Проектирование товарного каталога

koder_

Новичок
Проектирование товарного каталога

Добрый день!

Очень нужна консультация чисто по теоретической части.
Есть цель - написать каталог вроде hotline.ua

Для тех кто не знает - это сайт-каталог товаров. У них своя база товаров с описаниями и картинками, а цены они берут из прайсов магазинов (поставщиков).

Единственный не понятный для меня момент - обработка прайсов магазинов. А точнее - сопоставление названий товара в каталоге и поставщика.

Вот допустим в каталоге есть товар с названием: Fujitsu Siemens Pocket LOOX C550
А у поставщика он называется: Fujitsu Siemens Pocket C550 Loox

А может быть еще запутанее, в процессорах там вообще куча характеристик может ити в названии..

Так вот как понять что это один и тот же товар? Ну и это должно быть в полностью автоматическом режиме т.к. позиций в каталоге может быть десятки тысяч, а позиций у поставщиков в сумме сотни тыс..
 

zerkms

TDD infected
Команда форума
может посмотреть хотя бы требования к источникам для я.маркет хотя бы для начала?
 

koder_

Новичок
Ну да, я знаю этот формат
http://partner.market.yandex.ru/legal/tt/

Но по опыту работы с магазинами знаю что не вбивают они эти 2 параметра.

<model> Color LaserJet 3000</model>
<vendorCode> Q7533A </vendorCode>

В первом могут все так перепутать как выше писал, а второй вообще отсутствует.

Так вот получив от источника
<model>HP LaserJet 3000</model>
как понять что на самом деле это
<model> Color LaserJet 3000</model>
?
 

pilot911

Новичок
Автор оригинала: koder_
Ну да, я знаю этот формат
http://partner.market.yandex.ru/legal/tt/

Но по опыту работы с магазинами знаю что не вбивают они эти 2 параметра.

<model> Color LaserJet 3000</model>
<vendorCode> Q7533A </vendorCode>

В первом могут все так перепутать как выше писал, а второй вообще отсутствует.

Так вот получив от источника
<model>HP LaserJet 3000</model>
как понять что на самом деле это
<model> Color LaserJet 3000</model>
?
наверное у яндекса есть идеальная база товаров, относительно которой происходит поиск и сортировка товаров из интернет-магазинов
 

Adelf

Administrator
Команда форума
<model>HP LaserJet 3000</model>
<model> Color LaserJet 3000</model>

Это даже мне непонятно :)

А вообще.. делал я подобное. Находил "подозрительные" записи и отдавал их на ручную проверку. Тут конечно уже от качества зависит.. если подозрительных много будет - все неэффективно.
 

koder_

Новичок
Пришел к тому, что в любом случае нужен модератор.
Ну а тему наверное можно вынести из этой ветки
 

Beavis

Banned
я помню, обсуждалась тут уже такая проблема, попробуй поискать
 

koder_

Новичок
Ага уже нашел одну тему (и совсем рядом)

http://phpclub.ru/talk/showthread.php?s=&threadid=116419&rand=30

Alexandre а можете линкануть на остальные. И на эту "интеллектуальную систему"?
Спасибо
 
Сверху