|
|
|
| Есть на сайте поиск, индексируется весь текст сайта, как лучше из индексации убрать все не нужное (например: убрать название всех разделов меню)? | |
|
|
|
|
|
|
|
для: Seb
(08.02.2006 в 14:25)
| | А как индекс организован? Т.е. как информация хранится? | |
|
|
|
|
|
|
|
для: cheops
(08.02.2006 в 18:07)
| | Можно параллельный вопрос? Как вообще систему поиска организовать на сайте с помощью РНР? Спасибо! | |
|
|
|
|
|
|
|
для: Mouse
(10.02.2006 в 10:36)
| | >Можно параллельный вопрос? Как вообще систему поиска
>организовать на сайте с помощью РНР? Спасибо!
А это смотря где хранится инфа, допустим у меня на файлах, то я делал обход по файлом(был написан скрипт индексирования), этот скрипт сделал индексный файл, а потом в нем производится поиск с помощью скрипта поиска в одном файле и выводе результата. | |
|
|
|
|
|
|
|
для: Mouse
(10.02.2006 в 10:36)
| | А где хранится информация в файлах или в базе данных (это влияет на ответ)? | |
|
|
|
|
|
|
|
для: cheops
(10.02.2006 в 15:32)
| | спасибо, уже разобралась.
Индексируется вся информация, которая отображается на странице (и то что хранится в базе, и то что забито в шаблоны), индексирование происходит после отображения страницы, при условии изменения количества символов. | |
|
|
|
|
|
|
|
для: cheops
(10.02.2006 в 15:32)
| | меня как раз интересует информация по скрипту поиска.
Чтобы не открывать новый топик, буду сдесь писать.
СУТЬ ДЕЛА:
есть много информации (десятки тысяч заметок).
нужно организовать по этой всей куче информации поиск с учетом словоформ.
ДОПОЛНИТЕЛЬНЫЕ УСЛОВИЯ:
процесс поиска не должен слишком грузить сервер чтобы хостер не погнал.
вся инфа в текстовых файликах, но при необходимости я ее могу загнать в базу.
ВОПРОС:
есть ли готовые скрипты для этого? | |
|
|
|
|
|
|
|
|
для: cheops
(16.02.2006 в 23:59)
| | спасибо, сейчас полезу разбираться
между прочим, я кажется нашел готовое решение, и даже два:
http://risearch.org/rus/risearch_php/index.html
http://search.mnogo.ru/download.html
как испробую их, отпишу насчет сложности и универсальности настройки под конкретную структуру информации. | |
|
|
|
|
|
|
|
для: SergijKa
(17.02.2006 в 00:30)
| | попробовал RiSearch Pro от http://risearch.org/rus/index.html.
доволен :)
потому что все довольно просто настраивается и работает.
вот краткое описание взятое с самого сайта:
________________________________
Поисковый скрипт, написанный на Перле и не требующий внешней базы данных. Скрипт использует эффективный механизм индексации, позволяющий легко работать с сотнями мегабайт текстовой информации. В новой версии появилась возможность на лету добавлять новые документы в индекс. Другие возможности: поиск с учетом морфологии русского языка (требуется библиотека RuMor), сортировка результатов поиска по релевантности, размеру файла и дате последнего редактирования, подсветка ключевых слов в результатах поиска, расширенный поиск.
________________________________
если кого пугает перл - есть версия на пхп, но немножко с меньшими возможностями
________________________________
RiSearch PHP - поисковый скрипт, предназначенный для небольших сайтов.
RiSearch PHP не требует наличия базы данных для хранения индекса.
Простой и удобный язык запросов.
RiSearch PHP использует платформонезависимые бинарные файлы, которые могут быть использованы на разных компьютерах. То есть, Вы можете проводить индексацию локальной копии сайта у себя дома под Windows9x, а затем использовать созданные скриптом файлы на сервере.
Возможна индексация на локальном диске и через HTTP.
Конфигурируемый список стоп-слов.
Настраиваемый внешний вид результатов поиска.
________________________________
так что если кому нужен просто хороший поиск по сайту, где вся инфа лежит не в базе а в файлах - это очень хорошее решение.
а если в базах, то тогда там есть индексатор-паук, которому вы можете скормить урл и он (теоретически) затянет в индекс весь контент этого сайта (при желании можно указать глубину проникновения паука в сайт). "Теоретически" потому как у меня с нескольких попыток не заработало, а спать уже захотелось :) | |
|
|
|
|
|
|
|
для: SergijKa
(17.02.2006 в 00:30)
| | продукт от http://search.mnogo.ru/download.html пока не пробовал.
Потому как хочу RiSearch Pro хорошо потестировать (с моими десятками тысяч заметок). | |
|
|
|
|
|
|
|
для: cheops
(10.02.2006 в 15:32)
| | В файлах, извиняюсь, что затянул с ответом! | |
|
|
|
|
|
|
|
|
для: cheops
(26.02.2006 в 23:50)
| | Спасибо, очень полезная информация! | |
|
|
|