Ребят, а вот у меня такая проблема:
есть прайс-лист в экселе, прайс содержит порядка 13 тыс. позиций.
Текст идет спошняком:
(код, наименование, артикул, цена, еще что-то)
никакого разбиения на категории товаров нет.
я конвертировал файл из экселя в тест разделенный табуляцией и смог заставить его (php) прочитать этот файл довольно быстро ~3 сек (экселевский парсер оказался слишком медленным)
Нужно сделать удобную разбивочку по категориям и поиск по наименованию.
Тут вот ничего другого как взять первое слово из поля наименование в голову не приходит, но это не правильно, т.к. название раздела может содержать более одного слова. Ну это еще ладно. Самое интересное когда начал все это дело записывать в mysql: машина примерно 1.5 минуты стояла со 100% загрузкой проца. Т.е. мне хостер каждый раз после обновления прайса будет по голове сильно бить. Хоть на серваке этот процесс должен пройти быстрее, но все равно.
Я хочу обратиться за советом к тем, кто уже сталкивался с подобной проблемой. Каким образом вы это организовали?
Есть идея написать на VBA макрос, который будет сравнивать два файла - прайс последнего обновления и изменный/дополненный прайс. Повозимся, но думаю vba вспомню, напишу. Но тогда встает вопрос о такой случае: ясно что с измененными позициями и новыми проблем не будет, а как быть с удаленными?
Тогда видимо придется сразу на "земле" создавать файл с инструкциями для mysql. Наиболее простым вариантом конечно было бы сделать так: заливаем прайс на сервер, читаем его, очишаем таблицу, и записываем в нее новые данные, но есть ли алгоритм, который позволит, скажем не обязательно быстро записывать данные в бд, а главное не загружать в это время сервер слишком сильно ???