rotoZOOM
ACM maniac
Ты хоть раз в html'ник заглядывал? А между прочим - это текстовый файл с форматированием.Не думаю, что гигабайтный файл без переносов строк вообще возможен. Скорее всего любой текстовый файл будет с форматированием
Ты хоть раз в html'ник заглядывал? А между прочим - это текстовый файл с форматированием.Не думаю, что гигабайтный файл без переносов строк вообще возможен. Скорее всего любой текстовый файл будет с форматированием
А зачем в логе форматирование??? Не проще ли записывать данные в файл в виде $a,$b,$c и т.д., а потом форматируй сколько влезет при выводе или анализе? По-моему, верх изврата налицо!Автор оригинала: Monah IRH
Обычный да)
Там html страничка - лог. Представляет собой формы и таблицы. Скрпит определенным образом автоматически настраивает фильтры,а потом анализирует полученный лог. Для большенства контрагентов лог содержит не более мегабайта информации с учетом html тегов, но вот как видите появлялась ситуация, когда лог превышал 7 метров. Это с учетом html тегов, большенство из которых tr, td и т.п.
это прост дополнение к разговору)
Тут ты не прав. Поверь существует и достаточно много где. От этого легко избавиться, но не все избавляются. Чаще всего такие вещи происходят, когда код страницы генерируется скриптом. Ему все-равно есть там форматирование или нет и он фигачит все подряд. Да это минус.. Но визуальное отображение от этого не страдает и поэтому часто на это забивают. При этом чтение html кода такой страницы затруднено.А если бы даже такой безумный лог и существует
Да, например программы анализаторы логов, которым вообще по барабану твои переносы строк '\n', они все сами отформатируют и представят в удобоваримом виде.Если человек делает лог, то должен предполагать, что его кто-то будет читать.
пока все про переносы строк говорят, спрошу:Это когда "умельцы" злоупотребляют file_get_contents. Большие файлы умные дяди открывают с помощью file.
Это уже монстры, которые открывают только хостеры и я говорил не о таких файлах а о файлах разумной величины. Такой скорее всего можно открыть только строкой частями, но для анализа я бы например эти части порезал на строки и обработал бы циклом.Автор оригинала: Breeze
пока все про переносы строк говорят, спрошу:
какой из этих вариантов съест больше памяти для одного и того же файла?
И приведу такой пример: лог-файл апача на 250мб. тоже file? ))
Там строки маленькие, да. И что?
Почему теория, вот мне пришлось провести такой эксперимент, а эксперимент это уже практика. А что будет в продакшене - это другое дело.Автор оригинала: Bu-Bu
Это все теория. Вряд ли кому понадобится в здравом уме такие файлы плодить и потом их открывать через пых-пых. По-моему флейм развернули на пустом месте. Обычные файлы в сети далеко до 1 Мб, а все остальное проще скачать и посмотреть на домашнем компе, раз уж свербит там что-то поковырять. А в диапазоне до 1 Мб - file + цикл быстрее, чем регэкспы с file_get_contents
правильно. потому для больших объемов ни file, ни file_get_contents не подходят.Построчно считывать 250мб файл очень долго, если строчки "короткие".