mak_sim2001
Новичок
Паук(Spider) Общие вопросы
Цель:
Наполнить контент сайта. Конкретно две страницы "события" и "работа".
Сайт типа каталога где компаний размещают свой профайл, и соответсвенно могут добовлять свои вакансии и свои различные события(скидка, акция, выставка и т.п.)
Задача максимум:
Написать систему поиска(я так понимаю полноценный spider) которая будет искать на различных сайтах(неопределенно'), "события" и "предложения о работе".
(Под событием понимается что-то типа" 2006-12-4 состоится фестиваль ..." "Ежегодная ярмарка достижений в области ..." и т.п.).
Соответсвенно сортировать по типам "работы", "событий" и выодить это все в поиске по сайту(как в поисковике) с ссылками на соответсвующие сайты(?).
Причем надо что-бы в выводе было полноценное описание события, или работы
Важный вопрос: Небудет ли это кражей контента?
Делал ли кто подобное? С чего начинать, и т.п. ? Кто какие решения видит? Можно упрощать изменять преформулировать задачу если она некорректна. Кто может какие линки подкинет.
P.S. слышал что на dklab есть код нормального(неплохого =) паука но не нашел там его, мож кто знает???
Цель:
Наполнить контент сайта. Конкретно две страницы "события" и "работа".
Сайт типа каталога где компаний размещают свой профайл, и соответсвенно могут добовлять свои вакансии и свои различные события(скидка, акция, выставка и т.п.)
Задача максимум:
Написать систему поиска(я так понимаю полноценный spider) которая будет искать на различных сайтах(неопределенно'), "события" и "предложения о работе".
(Под событием понимается что-то типа" 2006-12-4 состоится фестиваль ..." "Ежегодная ярмарка достижений в области ..." и т.п.).
Соответсвенно сортировать по типам "работы", "событий" и выодить это все в поиске по сайту(как в поисковике) с ссылками на соответсвующие сайты(?).
Причем надо что-бы в выводе было полноценное описание события, или работы
Важный вопрос: Небудет ли это кражей контента?
Делал ли кто подобное? С чего начинать, и т.п. ? Кто какие решения видит? Можно упрощать изменять преформулировать задачу если она некорректна. Кто может какие линки подкинет.
P.S. слышал что на dklab есть код нормального(неплохого =) паука но не нашел там его, мож кто знает???