| |
|
|
| | </td>
</tr>
</table>
СОДЕРЖИМОЕ
</div>
</td></tr>
</table>
Нужно достать с помощью рег выражений содержимое. Помогите, пожалуйста. | |
| |
|
|
| |
|
|
| |
для: opex
(07.01.2006 в 17:44)
| | | Это можно осуществить при помощи скрипта
<?php
$str = "</td>
</tr>
</table>
СОДЕРЖИМОЕ
</div>
</td></tr>
</table>";
$pattern = "|</table>(.*)</div>|isU";
preg_match($pattern, $str, $out);
echo $out[1];
?>
|
PS Вопросы, посвящённые регулярным выражениям лучше сразу размещать в форуме "Регулярные выражения". | |
| |
|
|
| |
|
|
| |
для: opex
(07.01.2006 в 17:44)
| | | Огромное Спасибо! Только я немного не понял: содержимое то неизвестно, а в скрипте оно как бы известно.
т. е оно есть в строке
$str = "</td>
</tr>
</table>
СОДЕРЖИМОЕ
</div>
</td></tr>
</table>";
|
но его не должно там быть.
P.S. Я окончательно запутался....... | |
| |
|
|
| |
|
|
| |
для: opex
(08.01.2006 в 10:50)
| | | Вот конкретный пример
Вот мне и нужно достать отсюда основное содержание со всеми тегами. | |
| |
|
|
| |
|
|
| |
для: opex
(08.01.2006 в 11:03)
| | | Прикрепите этот здоровый текст в виде файла, если не сложно, иначе мы замучаемся его каждый раз выгружать при ответе на тему. | |
| |
|
|
| |
|
|
| |
для: opex
(07.01.2006 в 17:44)
| | | Вот этот файл. | |
| |
|
|
| |
|
|
| |
для: opex
(08.01.2006 в 13:35)
| | | А какой кусок текста примерно необходимо вытащить? | |
| |
|
|
| |
|
|
| |
для: cheops
(08.01.2006 в 22:03)
| | | полностью всю новость. | |
| |
|
|
| |
|
|
| |
для: opex
(09.01.2006 в 17:12)
| | | Вы лучше её приведите в сообщении... | |
| |
|
|
| |
|
|
| |
для: cheops
(09.01.2006 в 22:25)
| | | Мне нужно именно вот что:
Через пять лет после бума доткомов локомотив американского интернета снова набрал ход. Еще в 2004 г. мы видели символы будущего расцвета: это существенный рост объемов <nobr>интернет-рекламы</nobr> и феерическое IPO компании Google. Нынешний год в полной мере оправдал все ожидания. В 2005 г. в области <nobr>IT-технологий,</nobr> <nobr>интернет-рынков</nobr> и сетевой культуры знаменовался таким всплеском энергии и воодушевления, какого мы не видели с конца <nobr>90-х</nobr> гг. О возрождении американского интернета <a href="http://news.com.com/Year+in+review+The+Internet+reborn/2009-1023_3-5993030.html">пишет</a> News.com, подводя итоги уходящего года.
<p>
<p>Виртуальные сообщества и интерактивные технологии расцвели буйным цветом. Давно ожидаемая конвергенция ТВ и компьютерных технологий, наконец, началась. В то же время молодое поколение, выросшее с интернетом повзрослело и породило социальную революцию в Сети. Благодаря им веб перешел в стадию Web 2.0.
<p>
<p>Хотя в средствах массовой информации чаще всего мелькало название Google как технологического лидера в интернете, но это лишь вершина айсберга. В тени Google росли и крепли многочисленные <nobr>веб-сервисы</nobr> нового поколения.
<p>
<p>Параллельно с интернетом бурное развитие наблюдалось в других областях IT: цифровой фотографии (массовое распространение бюджетных зеркальных камер), автомобилестроении (первые гибридные автомобили для массового рынка) и передовых областях хайтека, таких как <a href="http://news.com.com/New+life+for+Moores+Law/2009-1006_3-5672485.html">спинтроника</a>. Эхо технологической революции распространилось по всем странам.
<p>
<p>Процесс быстрых изменений в области технологий и <nobr>бизнес-среды</nobr> не прошел незамеченным для крупных корпораций. В уходящем году <a href="http://news.com.com/Microsoft+gets+a+makeover/2009-1012_3-5875196.html">Microsoft</a> и <a href="http://news.com.com/HP+after+Fiorina+Analysis%2C+videos%2C+commentary/2009-1014_3-5569425.html"><nobr>Hewlett-Packard</nobr></a> провели масштабную реорганизацию в своих управленческих структурах на самом высоком уровне. В новых быстро меняющихся условиях некоторые корпорации пошли на такие шаги, какие сложно было представить несколько лет назад. например, Microsoft заключила мир с RealNetworks и даже провела <a href="http://www.webplanet.ru/news/lenta/2005/10/19/ms_xak.html">встречу с хакерами</a>, чтобы решить самые наболевшие проблемы в безопасности.
<p>
<p>Но самым большим сюрпризом 2005 г. стало решение Apple перейти на процессоры Intel, тогда как последняя всегда работала на платформу Wintel, то есть совместно с Microsoft, а платформа Apple является прямым конкурентом платформы Windows. Определенно, компьютерная индустрия стала другой. Наверное, эти изменения уже необратимы.
<p>
<p>Сколько новых сюрпризов ожидает нас в новом году? Наверняка, немало. <nobr>Интернет-экономика</nobr> и <nobr>IT-индустрия</nobr> точно не остановятся на достигнутом.
<p>
|
| |
| |
|
|
| |
|
|
| |
для: opex
(10.01.2006 в 06:29)
| | | Можно поступить следующим образом:
<?php
$str = file_get_contents("http://www.site.ru/index.php");
$pos = strpos($str, "<!-- /LEFT -->");
$str = substr($str, $pos);
$pattern = "|</table>(.+)<p>[\s]*</div>[\s]*</td></tr>[\s]*</table>|isU";
preg_match($pattern, $str, $out);
echo $out[1];
?>
|
| |
| |
|
|
| |
|
|
| |
для: cheops
(10.01.2006 в 14:11)
| | | В начале получается много лишнего:
</td></tr>
<tr><td height="10"><img src="/i/1x1.gif" width="1" height="10" /></td></tr>
</table>
<table border="0" cellspacing="0" cellpadding="0" height=600 width="100%">
<tr><td valign=top class="text">
<div class="news">
<p>
Этот год в жизни Сети был символичным и совершенно не похожим на предыдущие. Если и можно подобрать наиболее подходящее слово для него, то это — возрождение.
<p>
<p><table border="0" cellspacing="0" cellpadding="0" width="260" align="right">
<tr>
<td width="20"><img src="/i/1x1.gif" width="20" height="1" /></td>
<td width="240" height="400">
<script language="javascript">
<!-- /* © 2001 AdCycle.com All Rights Reserved.*/
var id=541;
var jar=new Date();var s=jar.getSeconds();var m=jar.getMinutes();
var flash=s*m+id;var cgi='http://ad.webplanet.ru/cgi-bin';
var p='<iframe src="'+cgi+'/adcycle.cgi?gid=72&layout=multi&t=_top&id='+flash+'&type=iframe" ';
p+='height=400 width=240 border=0 marginwidth=0 marginheight=0 hspace=0 ';
p+='vspace=0 frameborder=0 scrolling=no>';
p+='<a href="'+cgi+'/adclick.cgi?manager=adcycle.com&gid=72&layout=multi&id='+flash+'" target="_top">';
p+='<img src="'+cgi+'/adcycle.cgi?gid=72&layout=multi&id='+flash+'" width=240 height=400 ';
p+='border=1 alt="Click to Visit"></a></iframe>'; document.write(p); // -->
</script>
<noscript>
<a href="http://ad.webplanet.ru/cgi-bin/adclick.cgi?manager=adcycle.com&gid=72&layout=multi&id=541" target="_top"><FONT size=1>[AD]</FONT><AD- .ru/cgi-bin/adcycle.cgi?gid=72&layout=multi&id=541" width=240 height=400 border=1 ALT="Click to Visit"></a>
</noscript>
</td>
</tr>
</table>
Через пять лет после бума доткомов локомотив американского интернета снова набрал ход. Еще в 2004 г. мы видели символы будущего расцвета: это существенный рост объемов <nobr>интернет-рекламы</nobr> и феерическое IPO компании Google. Нынешний год в полной мере оправдал все ожидания. В 2005 г. в области <nobr>IT-технологий,</nobr> <nobr>интернет-рынков</nobr> и сетевой культуры знаменовался таким всплеском энергии и воодушевления, какого мы не видели с конца <nobr>90-х</nobr> гг. О возрождении американского интернета <a href="http://news.com.com/Year+in+review+The+Internet+reborn/2009-1023_3-5993030.html">пишет</a> News.com, подводя итоги уходящего года.
<p>
<p>Виртуальные сообщества и интерактивные технологии расцвели буйным цветом. Давно ожидаемая конвергенция ТВ и компьютерных технологий, наконец, началась. В то же время молодое поколение, выросшее с интернетом повзрослело и породило социальную революцию в Сети. Благодаря им веб перешел в стадию Web 2.0.
<p>
<p>Хотя в средствах массовой информации чаще всего мелькало название Google как технологического лидера в интернете, но это лишь вершина айсберга. В тени Google росли и крепли многочисленные <nobr>веб-сервисы</nobr> нового поколения.
<p>
<p>Параллельно с интернетом бурное развитие наблюдалось в других областях IT: цифровой фотографии (массовое распространение бюджетных зеркальных камер), автомобилестроении (первые гибридные автомобили для массового рынка) и передовых областях хайтека, таких как <a href="http://news.com.com/New+life+for+Moores+Law/2009-1006_3-5672485.html">спинтроника</a>. Эхо технологической революции распространилось по всем странам.
<p>
<p>Процесс быстрых изменений в области технологий и <nobr>бизнес-среды</nobr> не прошел незамеченным для крупных корпораций. В уходящем году <a href="http://news.com.com/Microsoft+gets+a+makeover/2009-1012_3-5875196.html">Microsoft</a> и <a href="http://news.com.com/HP+after+Fiorina+Analysis%2C+videos%2C+commentary/2009-1014_3-5569425.html"><nobr>Hewlett-Packard</nobr></a> провели масштабную реорганизацию в своих управленческих структурах на самом высоком уровне. В новых быстро меняющихся условиях некоторые корпорации пошли на такие шаги, какие сложно было представить несколько лет назад. например, Microsoft заключила мир с RealNetworks и даже провела <a href="http://www.webplanet.ru/news/lenta/2005/10/19/ms_xak.html">встречу с хакерами</a>, чтобы решить самые наболевшие проблемы в безопасности.
<p>
<p>Но самым большим сюрпризом 2005 г. стало решение Apple перейти на процессоры Intel, тогда как последняя всегда работала на платформу Wintel, то есть совместно с Microsoft, а платформа Apple является прямым конкурентом платформы Windows. Определенно, компьютерная индустрия стала другой. Наверное, эти изменения уже необратимы.
<p>
<p>Сколько новых сюрпризов ожидает нас в новом году? Наверняка, немало. <nobr>Интернет-экономика</nobr> и <nobr>IT-индустрия</nobr> точно не остановятся на достигнутом.
|
| |
| |
|
|
| |
|
|
| |
для: opex
(11.01.2006 в 13:07)
| | | Xм... странно, попробуйте вот этот скрипт
<?php
$str = file_get_contents("http://www.site.ru/index.php");
$pos = strpos($str, "<!-- /LEFT -->");
$str = substr($str, $pos);
$pattern = "|<!--(.+)</table>(.+)<p>[\s]*</div>[\s]*</td></tr>[\s]*</table>|isU";
preg_match($pattern, $str, $out);
echo $out[2];
?>
|
| |
| |
|
|
| |
|
|
| |
для: cheops
(11.01.2006 в 13:33)
| | | Получается то же самое.
Мне кажется нужно условие добавить чтобы в начале было вот от этого:
</noscript>
</td>
</tr>
</table>
|
| |
| |
|
|
| |
|
|
| |
для: opex
(07.01.2006 в 17:44)
| | | cheops, помоги пожалуйста!
Или дайте кто-нибудь ссылку на хороший учебник по регулярным выражениям, буду благодарен. | |
| |
|
|
| |
|
|
| |
для: opex
(15.01.2006 в 10:54)
| | | Хм... нужно как можно болше удалить текста с обоих концов статьи - иначе к ней не подобраться.
К изучению регулярных выражений следует подходить как к изучению отдельного языка. На сегодняшний момент наиболее полным руководством является книга Дж. Фридла "Регулярные выражения", к сожалению, ссылки на электронные варианты книги, которые у меня были - все дохлые и вам потребуется обнаружить их самостоятельно. | |
| |
|
|