Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В. C++. Мастер-класс в задачах и примерах. Авторы: Кузнецов М.В., Симдянов И.В. MySQL на примерах. Авторы: Кузнецов М.В., Симдянов И.В. PHP Puzzles. Авторы: Кузнецов М.В., Симдянов И.В. MySQL 5. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум Регулярные Выражения

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Разбор результата запроса к Yandex
 
 автор: Aesha   (17.04.2007 в 15:35)   письмо автору
 
 

Как правильно написать шаблон для запроса к яндексу?

Надо забрать дескрипшен из выдачи. Из вот такого кода, к примеру:


<a tabindex="6" onclick="w(this, '80.22.82', '84=89');" href="http://www.integrumworld.com/eng/queris.htm" target="_blank">Sample queries </a>


Я пишу:


$pattern1 = '<a tabindex="[[:digit:]]{1,}" onclick="w\(this,\'[[:digit:]]{1,}\.[[:digit:]]{1,}\.[[:digit:]]{1,}\', \'[[:digit:]]{1,}=[[:digit:]]{1,}\')\;" href="([[:graph:]]{1,})" target="_blank"/>(.*)</a>';


Только почему-то так не работает. Как правильно написать?

   
 
 автор: cheops   (17.04.2007 в 16:28)   письмо автору
 
   для: Aesha   (17.04.2007 в 15:35)
 

Приведите пример исходной страницы - что окружает искомый текст?

PS POSIX-регулярные выражения будут исключены из PHP 6, поэтому лучше ориентироваться на Perl-регулярные выраженя.

   
 
 автор: Aesha   (17.04.2007 в 17:02)   письмо автору
 
   для: cheops   (17.04.2007 в 16:28)
 

Нужно забрать из яндекса дескрипшены ссылок, выдаваемых по разным запросам.
Т.е. если в яндексе набрать любой поисковый запрос, то он выдаст несколько страниц результатов. На каждый результат приходится примерно вот такой код:


<li value=5 >
<div class="title">
<a tabindex="6" onclick="w(this, '80.22.82', '84=89');" href="http://www.integrumworld.com/eng/queris.htm" target="_blank">Sample queries </a>
</div>
<div class="text">
<span style="color:#777; font-weight:bold;">текст ссылок: </span>
<span><b>примеры</b> <b>запросов</b>&hellip;</span>
</div>
<div class="info"><span style="color:#060;">
www.integrumworld.com/eng/queris.htm
&nbsp;&middot;&nbsp;865&nbsp;байт
&nbsp;&middot;&nbsp;02.04.1999
</span>
&mdash;&nbsp;найден по ссылке
</div>
<div class="info">
<nobr><a href="/yandsearch?text=%EF%F0%E8%EC%E5%F0%20%E7%E0%EF%F0%EE%F1%E0&pag=u&surl=integrumworld.com&">Еще с сайта</a>&nbsp;<span class="count">5</span></nobr>
&nbsp;&middot;&nbsp; <nobr>Рубрика: <a onclick="w(this, '80.83', '84=89');" href="http://yaca.yandex.ru/yca/cat/Business/Corporate_Services/Inquiry/">Агентства деловой информации</a></nobr>
</div>
</li>


Сами дескрипшены окружаются:


<a tabindex="6" onclick="w(this, '80.22.82', '84=89');" href="http://www.integrumworld.com/eng/queris.htm" target="_blank">Sample queries </a>

   
 
 автор: Trianon   (17.04.2007 в 17:52)   письмо автору
 
   для: Aesha   (17.04.2007 в 15:35)
 

Основная ошибка у Вас в том, что неограниченные квантификаторы захватывают лишние символы.
Их надо окорачивать.
Вот тут написано "брать сколько угодно любых символов, за ними следует уголок":
(.*)<

Имеет смысл сделать "брать сколько угодно любых символов, кроме уголка, за ними следует уголок":
([^<]*)<

Аналогично в других местах

   
 
 автор: Aesha   (17.04.2007 в 18:07)   письмо автору
 
   для: Trianon   (17.04.2007 в 17:52)
 

Так может проще написать как-то типа:


$pattern1 = '<a tabindex="[[:digit:]]{1,}" onclick="w\(this,([^=]*) ="([[:graph:]]{1,})" target="_blank"/>([^<]*)</a>';


Только так тоже не работает =/

   
 
 автор: Trianon   (17.04.2007 в 18:34)   письмо автору
 
   для: Aesha   (17.04.2007 в 18:07)
 

это - как?
="[[:digit:]]{1,}"
это - что?
="([[:graph:]]{1,})"

   
 
 автор: Aesha   (18.04.2007 в 09:44)   письмо автору
 
   для: Trianon   (17.04.2007 в 18:34)
 


"[[:digit:]]{1,}" 


значит одна или более цифр.


"([[:graph:]]{1,})"


печатные символы

   
 
 автор: Aesha   (18.04.2007 в 15:22)   письмо автору
 
   для: Aesha   (18.04.2007 в 09:44)
 

Всем спасибо. Разобралась.

   
 
 автор: 0ne   (12.08.2007 в 20:09)   письмо автору
 
   для: Aesha   (18.04.2007 в 15:22)
 

ЭЙ, что за люди, сами разобрались, а остальные так в луже и сидят(((
покажите код, задача точно такая же!

   
 
 автор: 0ne   (12.08.2007 в 21:46)   письмо автору
 
   для: 0ne   (12.08.2007 в 20:09)
 

Облазил весь форум, все примеры старые, т.к. дизайн ya.ру поменялся и теперь актуальна только эта тема, HELP

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования