Парсинг прайслистов в mysql базу

Beckie

Новичок
Парсинг прайслистов в mysql базу

Собственно встретился такой задачей. Надо создать обработчик прайс листов на сайте.
Загрузка файла на сервер и последующая его обработка там же.

Собственно я никогда с этим не работал, вот и хотел бы посоветоваться с специалистами в этой сфере.
Я еще не знаю, в каком типе будут поступать прайс листы. Вероятнее всего это будет excel документы, может быть что-то другое.

С какими расширениями кроме excel работают крупные поставщики?
И главный вопрос, как все это парсить на PHP?

Советы хорошей литературы тоже приветствуются. :rolleyes:
 

baev

‹°°¬•
Команда форума
как все это парсить на PHP?
— что значит «как»? Скрипт надо писать.

Прайс из xls-формата сохраняем в csv-формате. Потом скриптом приводим в тот вид, в котором у нас в базе данные хранятся.
 

Beckie

Новичок
Автор оригинала: baev
— что значит «как»? Скрипт надо писать.

Прайс из xls-формата сохраняем в csv-формате. Потом скриптом приводим в тот вид, в котором у нас в базе данные хранятся.
Это единственный или самый распространенный способ? Я имею ввиду xls.

Получается что-то типа этого:

Brand;Model;Price
Sony;Vaio;34 700

То есть, дальше парсим с помощью PHP в массивы и уже заносим в базу в нужные места.

С загрузкой на сервер какие-то нюансы существуют?

Кстати, если на сервер загружают xls, то чем на сервере преобразовывать в csv?
 

baev

‹°°¬•
Команда форума
Зачем на сервер загружать в xls?
Открываете прайс в excel и сохраняете как cvs.

Это единственный или самый распространенный способ?
— это пример.
Вам поставщики могут и в xml'е прайсы слать, к примеру.
 

Alexandre

PHPПенсионер
Я еще не знаю, в каком типе будут поступать прайс листы. Вероятнее всего это будет excel документы, может быть что-то другое
вот с этого и надо начинать
И главный вопрос, как все это парсить на PHP?
все зависит от пп1
 

dimagolov

Новичок
Beckie, тебе что нужно? написать скрипт под ТЗ или составить ТЗ в каком виде тебе должны передавать данные?
 

Beckie

Новичок
Вообще хотелось бы написать оба скрипта, пока время есть.

И для обработки xls, и для обработки xml.

То есть, по типу файла будет уже запускаться нужный тип обработки.

Я так понимаю, что xml обрабатывается с помощью модуля SimpleXML, а xls конверить с помощью iconv?

Далее уже функциями fopen / fread?
 

baev

‹°°¬•
Команда форума
Вообще хотелось бы написать оба скрипта, пока время есть.

И для обработки xls, и для обработки xml.

То есть, по типу файла будет уже запускаться нужный тип обработки.
Гм.
Как, не зная структуру предполагаемого файла, Вы собираетесь парсить прайсы?
Вы предполагаете, что у всех поставщиков все xls-прайсы будут одинаковыми?
 

Beckie

Новичок
Поставщик будет один.

Я предполагаю, что в основном придеться писать регулярные выражения для прогона прайса.

Сомневаюсь, что там надо будет применить explode и потом работать с массивом или все именно так и делается в случае с xls?
 

damngood

Мозг был, но ушел...
Beckie
Ты бы договорился уже с поставищиком на счет формата файла, чтобы лишнюю работу не делать.
 

Miiix

Новичок
Подскажите если кто-то знает. За это время появилось какое-то универсальное решение чтобы закачивать прайсы разного формата и структуры в базу?
 

Hello

Новичок
Подскажите если кто-то знает. За это время появилось какое-то универсальное решение чтобы закачивать прайсы разного формата и структуры в базу?
5 операторов ПК, приводящих прайсы к внутреннему формату
 

Фанат

oncle terrible
Команда форума
Подскажите если кто-то знает. За это время появилось какое-то универсальное решение чтобы закачивать прайсы разного формата и структуры в базу?
Решение простое. Нужен один оператор ПК, который один раз объясняет парсеру, из каких полей документа брать информацию.
 

grigori

( ͡° ͜ʖ ͡°)
Команда форума
Решение простое. Нужен один оператор ПК, который один раз объясняет парсеру, из каких полей документа брать информацию.
Простое, но неуниверсальное, то есть надо делать самому. А ему нужно универсальное.
 
Сверху