2nirex
Скажи ты имеешь опыт разработки баннероной сети или счетчика?
Просто если нет, то не сильно интересно рассказывать все "сначала", а если имеешь, то тогда у вас наверное слишком много серверов, если вы можете хранить логи в СУБД?
Иногда поиск информации нужно вести по логам(так как только там есть нужная детализация). Это долго да, но такие задачи бывают. Они могут быть разовыми, точечными. Например, анализ подозрительных событий или проверка каких-то закономерностей. Если действие надо делать регулярно, то конечно его автоматизируют, но часто его надо сделать один раз, сформировать отчет и забыть.
-~{}~ 25.10.09 00:21:
p.s. Кстати, это в некоторых случаях быстрее, чем СУБД(здесь надо помнить, что такое вообще olap базы данных, какая у них структура и что такео seq scan).
На файлах, я могу разбить лог на части, и парсить его кусками в разных процессах(на много ядер или кластер - это отлично ложится).
Собственно map reduce - это и есть развитие данной идеи. Сам я его не применял(map reduce нам пока не нужен, хватает средств операционной системы ), но общался с людьми, которые его использовали.