Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Социальная инженерия и социальные хакеры. Авторы: Кузнецов М.В., Симдянов И.В. MySQL 5. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. MySQL на примерах. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В. C++. Мастер-класс в задачах и примерах. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Поиск по сайту
 
 автор: Seb   (08.02.2006 в 14:25)   письмо автору
 
 

Есть на сайте поиск, индексируется весь текст сайта, как лучше из индексации убрать все не нужное (например: убрать название всех разделов меню)?

   
 
 автор: cheops   (08.02.2006 в 18:07)   письмо автору
 
   для: Seb   (08.02.2006 в 14:25)
 

А как индекс организован? Т.е. как информация хранится?

   
 
 автор: Mouse   (10.02.2006 в 10:36)   письмо автору
 
   для: cheops   (08.02.2006 в 18:07)
 

Можно параллельный вопрос? Как вообще систему поиска организовать на сайте с помощью РНР? Спасибо!

   
 
 автор: zavragnov   (10.02.2006 в 13:06)   письмо автору
 
   для: Mouse   (10.02.2006 в 10:36)
 

>Можно параллельный вопрос? Как вообще систему поиска
>организовать на сайте с помощью РНР? Спасибо!


А это смотря где хранится инфа, допустим у меня на файлах, то я делал обход по файлом(был написан скрипт индексирования), этот скрипт сделал индексный файл, а потом в нем производится поиск с помощью скрипта поиска в одном файле и выводе результата.

   
 
 автор: cheops   (10.02.2006 в 15:32)   письмо автору
 
   для: Mouse   (10.02.2006 в 10:36)
 

А где хранится информация в файлах или в базе данных (это влияет на ответ)?

   
 
 автор: seb   (13.02.2006 в 12:58)   письмо автору
 
   для: cheops   (10.02.2006 в 15:32)
 

спасибо, уже разобралась.
Индексируется вся информация, которая отображается на странице (и то что хранится в базе, и то что забито в шаблоны), индексирование происходит после отображения страницы, при условии изменения количества символов.

   
 
 автор: SergijKa   (16.02.2006 в 16:07)   письмо автору
 
   для: cheops   (10.02.2006 в 15:32)
 

меня как раз интересует информация по скрипту поиска.
Чтобы не открывать новый топик, буду сдесь писать.

СУТЬ ДЕЛА:
есть много информации (десятки тысяч заметок).
нужно организовать по этой всей куче информации поиск с учетом словоформ.

ДОПОЛНИТЕЛЬНЫЕ УСЛОВИЯ:
процесс поиска не должен слишком грузить сервер чтобы хостер не погнал.
вся инфа в текстовых файликах, но при необходимости я ее могу загнать в базу.

ВОПРОС:
есть ли готовые скрипты для этого?

   
 
 автор: cheops   (16.02.2006 в 23:59)   письмо автору
 
   для: SergijKa   (16.02.2006 в 16:07)
 

Универсальный скрипт вряд ли имеется, так как все скрипты завязаны на структуру информации. Механизмы поиска описываются в темах
http://www.softtime.ru/forum/read.php?id_forum=3&id_theme=514
http://www.softtime.ru/forum/read.php?id_forum=1&id_theme=148
http://www.softtime.ru/forum/read.php?id_forum=3&id_theme=807
http://www.softtime.ru/forum/read.php?id_forum=3&id_theme=6620
http://www.softtime.ru/forum/read.php?id_forum=3&id_theme=5828
http://www.softtime.ru/forum/read.php?id_forum=3&id_theme=6439
http://www.softtime.ru/forum/read.php?id_forum=3&id_theme=5311
http://www.softtime.ru/forum/read.php?id_forum=3&id_theme=4699
http://www.softtime.ru/forum/read.php?id_forum=3&id_theme=3696
http://www.softtime.ru/forum/read.php?id_forum=3&id_theme=4797

   
 
 автор: SergijKa   (17.02.2006 в 00:30)   письмо автору
 
   для: cheops   (16.02.2006 в 23:59)
 

спасибо, сейчас полезу разбираться

между прочим, я кажется нашел готовое решение, и даже два:
http://risearch.org/rus/risearch_php/index.html
http://search.mnogo.ru/download.html

как испробую их, отпишу насчет сложности и универсальности настройки под конкретную структуру информации.

   
 
 автор: SergijKa   (17.02.2006 в 02:40)   письмо автору
 
   для: SergijKa   (17.02.2006 в 00:30)
 

попробовал RiSearch Pro от http://risearch.org/rus/index.html.

доволен :)
потому что все довольно просто настраивается и работает.


вот краткое описание взятое с самого сайта:

________________________________
Поисковый скрипт, написанный на Перле и не требующий внешней базы данных. Скрипт использует эффективный механизм индексации, позволяющий легко работать с сотнями мегабайт текстовой информации. В новой версии появилась возможность на лету добавлять новые документы в индекс. Другие возможности: поиск с учетом морфологии русского языка (требуется библиотека RuMor), сортировка результатов поиска по релевантности, размеру файла и дате последнего редактирования, подсветка ключевых слов в результатах поиска, расширенный поиск.
________________________________

если кого пугает перл - есть версия на пхп, но немножко с меньшими возможностями

________________________________
RiSearch PHP - поисковый скрипт, предназначенный для небольших сайтов.
RiSearch PHP не требует наличия базы данных для хранения индекса.
Простой и удобный язык запросов.
RiSearch PHP использует платформонезависимые бинарные файлы, которые могут быть использованы на разных компьютерах. То есть, Вы можете проводить индексацию локальной копии сайта у себя дома под Windows9x, а затем использовать созданные скриптом файлы на сервере.
Возможна индексация на локальном диске и через HTTP.
Конфигурируемый список стоп-слов.
Настраиваемый внешний вид результатов поиска.
________________________________

так что если кому нужен просто хороший поиск по сайту, где вся инфа лежит не в базе а в файлах - это очень хорошее решение.

а если в базах, то тогда там есть индексатор-паук, которому вы можете скормить урл и он (теоретически) затянет в индекс весь контент этого сайта (при желании можно указать глубину проникновения паука в сайт). "Теоретически" потому как у меня с нескольких попыток не заработало, а спать уже захотелось :)

   
 
 автор: SergijKa   (17.02.2006 в 02:41)   письмо автору
 
   для: SergijKa   (17.02.2006 в 00:30)
 

продукт от http://search.mnogo.ru/download.html пока не пробовал.

Потому как хочу RiSearch Pro хорошо потестировать (с моими десятками тысяч заметок).

   
 
 автор: Mouse   (26.02.2006 в 18:51)   письмо автору
 
   для: cheops   (10.02.2006 в 15:32)
 

В файлах, извиняюсь, что затянул с ответом!

   
 
 автор: cheops   (26.02.2006 в 23:50)   письмо автору
 
   для: Mouse   (26.02.2006 в 18:51)
 

Поиск в файлах создавался на протяжении следующих тем
http://www.softtime.ru/forum/read.php?id_forum=1&id_theme=1593
http://www.softtime.ru/forum/read.php?id_forum=1&id_theme=1701
http://www.softtime.ru/forum/read.php?id_forum=1&id_theme=1815

   
 
 автор: Mouse   (27.02.2006 в 10:55)   письмо автору
 
   для: cheops   (26.02.2006 в 23:50)
 

Спасибо, очень полезная информация!

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования