Автор Тема: simplexml — резкий скачок используемой памяти  (Прочитано 747 раз)

0 Пользователей и 1 Гость смотрят эту тему.

Оффлайн 3eproBckuu

  • Team
  • Опытный
  • ***
  • Сообщений: 141
  • Карма: 8
Уже несколько дней тестирую парсинг xml ~ 300м на обычном хостинге. Замеров никаких не делал, но парсинг + помещение в БД занимает порядка 30-40 минут. Между циклами вставляю usleep, чтобы хостер не убил процесс. Парсер работает через пхп-шный xml_parse.
Есть подозрения, что парсер работает криво, т.к. таблицы в сумме с индексами в БД занимают меньше 200м. Буду искать косяк  :)

Оффлайн IgorN

  • Team
  • Герой
  • ***
  • Сообщений: 2106
  • Карма: 47
    • Мой сайт
xml_parse - это старый потоковый парсер. Заюзай XmlReader. 30-40 мин не много. У меня очень сложный xml его парсинг и вставка данных в БД занимает примерно ночь, на выходе получается таблица с 150 млн записей :)
Мой сайт: http://igor-negrutsa.info/
Я знаю только то,что ничего не знаю, а многие не знают даже этого.

Оффлайн 3eproBckuu

  • Team
  • Опытный
  • ***
  • Сообщений: 141
  • Карма: 8
сайт под озон со 150 млн записей?  :)

чуть освобожусь и перепишу парсер. самому свой не нравится

Оффлайн IgorN

  • Team
  • Герой
  • ***
  • Сообщений: 2106
  • Карма: 47
    • Мой сайт
сайт под озон со 150 млн записей?  :)

чуть освобожусь и перепишу парсер. самому свой не нравится

Да нет, там просто табличка со связями (два поля) мобильного контента и моделей телефона, контента 150 тыс, и у каждого контента примерно 1000-1500 моделей. Извлечение из таблички происходит быстро хоть и записей много :)
Мой сайт: http://igor-negrutsa.info/
Я знаю только то,что ничего не знаю, а многие не знают даже этого.

Оффлайн Ergall-M

  • Мастер
  • ****
  • Сообщений: 329
  • Карма: 0
  • New Creative World
    • New Creative World
Re: simplexml — резкий скачок используемой памяти
« Ответ #19 : Августа 10, 2010, 13:36:17 »
Ребят, а вот такой вопросик...а сколько у вас жрет сайт написанный с использованием ZF? ну и вообще, к какому расходу памяти стоит стремится при оптимизации....понятно что чем меньше, тем лучше...но хотелось бы пощупать реальные цифры....
Моя студия: http://ncwlife.ru
Мой блог:  http://blog.ncwlife.ru

Оффлайн IgorN

  • Team
  • Герой
  • ***
  • Сообщений: 2106
  • Карма: 47
    • Мой сайт
Re: simplexml — резкий скачок используемой памяти
« Ответ #20 : Августа 10, 2010, 14:01:10 »
Ребят, а вот такой вопросик...а сколько у вас жрет сайт написанный с использованием ZF? ну и вообще, к какому расходу памяти стоит стремится при оптимизации....понятно что чем меньше, тем лучше...но хотелось бы пощупать реальные цифры....

Не думаю, что на этот вопрос есть однозначный ответ. Каждый сайт жрет по разному,  многое зависит от оси, сервака и его настроект, базы и т.д.
Сейчас у меня проектик под виндой на одной из страниц жрет 11 метров.
Мой сайт: http://igor-negrutsa.info/
Я знаю только то,что ничего не знаю, а многие не знают даже этого.

Оффлайн Ergall-M

  • Мастер
  • ****
  • Сообщений: 329
  • Карма: 0
  • New Creative World
    • New Creative World
Re: simplexml — резкий скачок используемой памяти
« Ответ #21 : Августа 10, 2010, 17:35:03 »
спс) да я понимаю что куча параметров влияют на размер памяти....и вопрос достаточно не однозначный....но просто хочется знать какие-то средние значения...у меня например страница с формой и сохранением данных этой формы весят 14мб...
Моя студия: http://ncwlife.ru
Мой блог:  http://blog.ncwlife.ru

Оффлайн IgorN

  • Team
  • Герой
  • ***
  • Сообщений: 2106
  • Карма: 47
    • Мой сайт
Re: simplexml — резкий скачок используемой памяти
« Ответ #22 : Августа 10, 2010, 17:57:02 »
спс) да я понимаю что куча параметров влияют на размер памяти....и вопрос достаточно не однозначный....но просто хочется знать какие-то средние значения...у меня например страница с формой и сохранением данных этой формы весят 14мб...

Вроде нормально :)
Мой сайт: http://igor-negrutsa.info/
Я знаю только то,что ничего не знаю, а многие не знают даже этого.

Оффлайн 3eproBckuu

  • Team
  • Опытный
  • ***
  • Сообщений: 141
  • Карма: 8
Re: simplexml — резкий скачок используемой памяти
« Ответ #23 : Августа 13, 2010, 02:40:26 »
xml_parse - это старый потоковый парсер. Заюзай XmlReader. 30-40 мин не много. У меня очень сложный xml его парсинг и вставка данных в БД занимает примерно ночь, на выходе получается таблица с 150 млн записей :)

Наконец-то руки добрались, переписал свой парсер под XmlReader. Нашел баг в старом - не все записи добавлялись в БД. И время парсинга сократилось на ~25%.