Организация механизма поиска по сайту

DDT

Новичок
Организация механизма поиска по сайту

Привет. Есть ли у каго-нибудь ссылки на описание механизма поиска по сайту. Т.е. мне не нужны как таковые исходники, мне бы слысел посмотреть. Как это делается?

В частности поиск в БД мне понятен. Гораздо интереснее как сделан поиск фразы на html-странице? РНР может искать в html-файлах?
 

lovchy

nacido para cifrar
> РНР может искать в html-файлах?

Нет, не может. Он их боится.
 

Ajax

Guest
какой бы нне был файл... если нужно найти встречается ли там допустим слово привет, сначала считываешь файл в массив и потом в каждом элементе массива ищещь
if(strstr($stroka[$i],'привет'){ print 'Нашел'; }
 

DDT

Новичок
Спасибо, Ajax, примерно так я и делаю.

Есть ли какие-нибудь принятые правила индексирования страниц сайта ?
 

Yuriy_S

-=PHP-Club=-
ещё можно считать файл и вырезать из него все HTML теги, оставить только текст и искать там.
 

DDT

Новичок
Ага, а как-нить можно ему указать свои теги для уничтожения?

Например: <?php ... ?> или <? ... ?>
 

Yuriy_S

-=PHP-Club=-
можно.
только вот нафига тебе <?php ?> ??
Читай файлы через http://localhost/****
и тогда у тебя веб- сервер будет отдавать только html код.
 

DDT

Новичок
В смысле, например,

fopen("http://www.mysite.ru/docs/html/page.html") ? Так что ли?
 

DDT

Новичок
Спасибо, ForJest. Неплохая ссылочка. Мне нравится !!! :))
 

lovchy

nacido para cifrar
> Читай файлы через http://localhost/****

Я насколько понял, ты предлагаешь заменить require сокетом на локалхост? ,]. Ты где такую траву то взял? ;p
 

DDT

Новичок
L0vCh1Y, а если писать так:

fopen("http://www.mysite.ru/docs/html/page.html")

То смогет открыть, игнорировав РНР-теги?
 

phprus

Moderator
Команда форума
Какие php-теги? При открытии по протоколу http сервер выдаст вместо php html который генерировали php-теги.
 

DDT

Новичок
Дело в том, phprus, что у меня в файл хтмл включен рнр-код в тегах <?php ?>. На пример,

<a href="<?php write_link("link_name"); ?>">Link to something</a>

Так вот он путается во всех этих тегах и вырезает текст "Link to something", который мне надо оставить.
 

phprus

Moderator
Команда форума
При открытии php скрипта через web php интерпритатор выполнит этод код и выдаст вместо <?php write_link("link_name"); ?> url. Для этого у вас должен быть установлен Apache и php.

И еще если твой поисковик при индексировании просто сканирует папки твоего сайта на налисие html php файлов то динамисеский сайт ты непроиндексируеш тут нужен паук.
 

Фанат

oncle terrible
Команда форума
ДДТ, никогда не слушай Аякса.
он вообще ничего не понимает.
по хорошему, ему вообще нельзя давать отвечать на чужие вопросы.

И его ответ тебе понравился совершенно зря.
Ты, когда тебе надо найти вещь в куче, ведь не раскладываешь сначала ПО ОДНОЙ по ящикам, а потом только начинаешь искать в каждом ящике?
проще, наверное, перебрать кучу сразу и найти вещь?
так и здесь
зачем сначала считывать файл, потом делать из него массив, а потом искать по этому массиву?
 
Сверху