Поиск по файлам MS-WORD

TS

Guest
Поиск по файлам MS-WORD

Как можно организовать поиск по файлам MS-WORD и иже с ними?
 

young

Новичок
1) Если у тебя Windows => Start -> Search
2) Если у тебя Linux => catdoc (google.com) + grep
 

TS

Guest
Требуется организовать удобный поиск в рамках сайта по документам на сервере, от этого и зависит выбор хостинга
 

young

Новичок
Тебе нужна идея или скрипт?
На Win-сервере это проще
 

TS

Guest
Идеи нужны, ибо я не представляю как это делать...
Как на win-сервере это можно реализовать?
 

Romantik

TeaM PHPClub
копай в сторону com только на win платформе
Что бы не зависило отхостинга сделай это на своем сервере. а потом перекидывай либо базу либо XML на хостинг
 

sergadm

Новичок
а почему непременно в MS-Word. пересохраняй в другом формате. либо для поиска ещё можно делать дубликат doca только текс и в нём осущ поиск. если найдено то отдавай одноимённый дос
 

TS

Guest
дубликат doc'а не кому делать, надо автоматизированное решение
 

slach

Новичок
под win32 копай в сторону COM, тебе уже сказали...

вообще можешь натравить google на свой сайт, а потом сделать форму поиска типа

PHP:
<form action="http://google.com/search" method="get" target="_blank" onsubmit="this.q.value=this.q.value+' site:www.твой.сайт'; return true">
 <input type=text name="q" value="введите строку поиска">
 <input type=submit value="Поиск">
</form>
гугль умеет искать в DOC'ах

если заказчик будет качать права, тогда пусть поинтересуется сколько гугль берет с корпоративных клиентов за свою поисковую машину по DOC формату... (по моему его индексацию они тоже у кого то лицензировали)
 

TS

Guest
поясните, что значит - копай в сторону COM
на яве скрипт открывать ActiveXObject("Word.Application")
и по нему бегать? или что-то иное?
 

TS

Guest
Re: Вообще то там была ссылка....

Извините, результатов не найдено. Попробуйте задать другие критерии для поиска.
 

sergadm

Новичок
дубликат doc'а не кому делать, надо автоматизированное решение
а кто сказал, что это ручками делать?
(у меня примерно также сервер в локальной сети по этому размер получаемых файлов не столь критичен и поиск пока не нужен зато узер который не в зуб ногой через веб-интерфес выкладывает дос а php+com его в нтмл сохраняет)
да и поиск в дос будет силнее нагружать сервак да и дольше (тк файл больше) чем в тхт
менньше примеров зато на русском
http://phpclub.ru/manrus/f/ref.com.html
 

Barkas

Guest
PHP:
//an easy way to convert your file from .doc to .html

// starting word
$word = new COM("word.application") or die("Unable to instanciate Word");

// if you want see thw World interface the value must be '1' else '0'
$word->Visible = 1;

//doc file location
$word->Documents->Open("E:\\first.doc");

//html file location  '8' mean HTML format
$word->Documents[1]->SaveAs("E:\\test_doc.html",8);

//closing word
$word->Quit();

//free the object from the memory
$word->Release();
$word = null;
... правда вместо SaveAs можно подыскать какую нить другую ф-ию типа Find и тогда не надо конвертить. А если не найдёшь, то по Html я думаю сможешь поиск сделать...
 

Geol

Пациент
... правда вместо SaveAs можно подыскать какую нить другую ф-ию типа Find
Прости, а зачем тебе их вообще конвертить, если ты уже именно COM (не к ночи будь помянут) воспользовался?
Тебе подсказать "какую нить другую ф-ию типа Find", или сам найдёшь?
 

Barkas

Guest
Автор оригинала: Geol
Тебе подсказать "какую нить другую ф-ию типа Find", или сам найдёшь?
Буду благодарен, если подскажешь где есть справочник по функциям объектов СOM.
 

Geol

Пациент
Ты хотел сказать по объектам MSOffice?
Ну в книжном магазине наверняка (искать VBA)
На сайте Microsoft
В самом приложении почти всё выясняется при написании макроса.
 

Barkas

Guest
Автор оригинала: Geol
Ты хотел сказать по объектам MSOffice?
Ну в книжном магазине наверняка (искать VBA)
На сайте Microsoft
В самом приложении почти всё выясняется при написании макроса.
Спасибо за ссылку :)
 
Сверху