Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
MySQL на примерах. Авторы: Кузнецов М.В., Симдянов И.В. C++. Мастер-класс в задачах и примерах. Авторы: Кузнецов М.В., Симдянов И.В. PHP. Практика создания Web-сайтов (второе издание). Авторы: Кузнецов М.В., Симдянов И.В. Объектно-ориентированное программирование на PHP. Авторы: Кузнецов М.В., Симдянов И.В. PHP Puzzles. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум Регулярные Выражения

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум (новые сообщения вниз) Структурный форум

тема: парсер???

Сообщения:  [1-10]   [11-15] 

 
 автор: wames   (11.03.2008 в 18:47)   письмо автору
 
   для: _гость_   (11.03.2008 в 17:04)
 

_гость_работает,спасибо,но есть проблема,все равно после окончания трансляции появиться ссылка отчет о матче как ее убить?

   
 
 автор: _гость_   (11.03.2008 в 17:04)
 
   для: wames   (11.03.2008 в 00:02)
 

ссылку "отчёт" не наблюдал кажется
я только раз качнул пару страниц, и раз проверил, у меня локально они 1.htm и txt.html

и для браузера мобильного помоему многовато будет страница на 20 кБ
и если даже как здесь использовать <pre></pre>
<html>
<style type="text/css">
h5, h1, b { margin: 0 10pt; }
</style>
 <head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
 </head>
<body>
<?php

$matchid 
= (isset($_GET['matchid'])) ? preg_replace('#[^\d]+#'''$_GET['matchid']) : '';
 
if  (
$matchid != ''){

 
$addr 'txt.html';
// $addr = 'http_www_liveresult_ru/c/home/football/txt.html?matchid=' . $matchid;
 
$text file_get_contents($addr);
 
 
preg_match('#<div class="date".+?(?=<div class="pane" id="pane_comments")#s'$text$text);
 
$text strip_tags($text[0], '<h1><b><table><td>');# теги
 
 
$textpreg_replace(array('#^\s+#m''#^(\d+\')#m''#(?:<)(/|)table[^>]*>#s''#</?td>#'),
    array(
'''<h5>$1</h5>''<$1pre>'' '), $text); // пробелы и выделение
 
$textpreg_replace(array('#^(\w.+)#m''#^\w.+#m'), array('<h5>$1</h5>'''), $text1); 
 
// обработка первых двух строк начинающихся с буквы

} else {

 
$addr '1.htm';
// $addr = 'http_www_liveresult_ru/';
 
$text file_get_contents($addr);
 
 
preg_match('#<div class="items".+?(?=<script )#s'$text$text); $text strip_tags($text[0], '<a>');#удалить теги кроме ссылок
 
$textpreg_replace(array('#http://[^&]+&amp;#''#^\s+#m''#^(\D.*)$#m'),
    array(
'?''''<h3>$1</h3>'), $text); // ссылки , пробелы и выделение
}

 echo 
$text;
?>
</body>
</html>

таблица типа этой

«МАРСЕЛЬ»
«СЕНТ-ЭТЬЕН»
Голы 0 0
Удары по воротам 3 1
Удары в створ 7 3
Нарушения правил 5 9
Угловые 4 2
Офсайды 0 0
Владение мячом 56% 44%
Предупреждения 1 2
Удаления 0 0

может в экран не уместиться, наверное.
Вариантов масса, но грабер :)

   
 
 автор: wames   (11.03.2008 в 00:02)   письмо автору
 
   для: wames   (10.03.2008 в 18:37)
 

_гость_,в работе скрипта я обнаружил маленькую ошибку:(принцип работы скрипта очень странный,пример:я пробовал зайти на ссылку сграбленной странички с мобильного браузера,и у меня перешел на другой сайт liveresult.ru,а когда я захожу с компьютерного браузера то у меня заходит и на сграбленную страничку,интересный граб,и еще на сграбленной страничке появляется ненужный текст я пробовал заменить его но у меня не получилось((вот этот текст бы надо убрать с граба (Анонс|Трансляция|Комментарии|Обновить)и еще иногда в грабе появляется ссылка отчет эту бы ссылку тоже бы нужно удалить,если получиться,спасибо за внимание,думаю мое сообщение не останется без ответа.

   
 
 автор: wames   (10.03.2008 в 18:37)   письмо автору
 
   для: _гость_   (10.03.2008 в 16:30)
 

_гость_,спасибо за оказанную помощь

   
 
 автор: _гость_   (10.03.2008 в 16:30)
 
   для: wames   (10.03.2008 в 01:10)
 

зависит от того каую разметку вы хотите оставить , если вообще что-то оставлять
, и время генерации страницы может получиться немаленьким
прикрепил

   
 
 автор: wames   (10.03.2008 в 01:10)   письмо автору
 
   для: cheops   (10.03.2008 в 00:27)
 

мне нужен граб похожий на этот http://softtime.ru/forum/read.php?id_forum=6&id_theme=45052 только чтобы был сграблен с сайта http://liveresult.ru без картинок,и лишних пробелов, <!-- Content -->здесь кусок страницы <div class="items" id="pane_txtt12" style="display:none">помогите пожалуйста

   
 
 автор: cheops   (10.03.2008 в 00:27)   письмо автору
 
   для: wames   (09.03.2008 в 09:11)
 

Хм... а на словах не можете объяснить что требуется?

   
 
 автор: wames   (09.03.2008 в 23:20)   письмо автору
 
   для: wames   (09.03.2008 в 10:16)
 

Ну мне никто не поможет?

   
 
 автор: wames   (09.03.2008 в 10:16)   письмо автору
 
   для: wames   (09.03.2008 в 09:14)
 

целую неделю пишу все не получаеться(((

   
 
 автор: wames   (09.03.2008 в 09:14)   письмо автору
 
   для: wames   (09.03.2008 в 09:11)
 

принцип работы скрипта хотел бы чтобы был такой

   

Сообщения:  [1-10]   [11-15] 

Форум разработан IT-студией SoftTime
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования