Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель MySQL 5. Авторы: Кузнецов М.В., Симдянов И.В. PHP 5. На примерах. Авторы: Кузнецов М.В., Симдянов И.В., Голышев С.В. C++. Мастер-класс в задачах и примерах. Авторы: Кузнецов М.В., Симдянов И.В. PHP. Практика создания Web-сайтов (второе издание). Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум Регулярные Выражения

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Помогите отфильтровать необходимый фрагмент текста
 
 автор: heckfy   (09.09.2008 в 16:08)   письмо автору
 
 

С регулярными выражениями начал разбератся совсем недавно.
В аттаче иммется текст в виде рисунка там ясно выделен текст красным цветом, который необходимо вытащить использую регулярные выражения.
Заранее благодарю!

  Ответить  
 
 автор: xx77   (09.09.2008 в 18:43)   письмо автору
 
   для: heckfy   (09.09.2008 в 16:08)
 

нифигасе, картинку, прикрутили ,)

нужно извлечь фрагмент из BMP-файла ?

PS// если просто строку из текста прикрепили-бы TXT-файл
, с подробной инструкцией чего и как вырезать )
и говорят что jpg намного меньше bmp

  Ответить  
 
 автор: AcidTrash   (09.09.2008 в 23:17)   письмо автору
 
   для: heckfy   (09.09.2008 в 16:08)
 

>В аттаче иммется текст в виде рисунка там ясно выделен текст красным цветом,
Это конечно хорошо, но как вы думаете по какому параметру должна быть привязка?
На первый взгляд это, по цифрам 1,2,3. Но опять же есть свои нюансы.

P.S. Как заметил xx77, в bmp-файле аттачить текст, это интересное новшество :). Даже просто для отладки брать ваш текст не получится(а набирать ручками как-то не хочется) => мало кто будет заморачиваться по вашему вопросу!

  Ответить  
 
 автор: heckfy   (10.09.2008 в 07:12)   письмо автору
2.1 Кб
 
   для: AcidTrash   (09.09.2008 в 23:17)
 

Извеняюсь!
Высылаю файл с текстом

  Ответить  
 
 автор: xx77   (10.09.2008 в 11:31)   письмо автору
 
   для: heckfy   (10.09.2008 в 07:12)
 

как-то можно получить фрагменты которые Вам нужны
(что-бы не жечь свой gprs-траффик ,заглянул таки посмотреть на картинку через OperaMini , ~4kb но мелковато))

думаю найти подгруппы точнее всего будет начиная захватывать с порядковых номеров
, а элементы списка проверять на наличие более например 4х точек подряд
что-то типа
<pre><?
$text 
file_get_contents('этот.txt');
################################
$pattern '/^(?:\d+\s+(?:\w\s+)?\w+.*|\w+.*?\.{4,}.+)$/m';
preg_match_all($pattern$text $array); 
print_r($array[0]);
##################################
?><hr/>

или можно при помощи preg_replace_callback()
формировать массив или массивы с данными

например как-то так:
<hr/>
<?

#################################
$pattern '/^(\d+\s+(?:\w\s+)?(\w+.*)|(\w+.*?)\.{4,}(.+))$/m';
$final_array = array();
$last_match '';

function 
pr_spt($match) {
//print_r($match);
    
global $final_array$last_match
    if (!empty(
$match[2])) {
        
$final_array[ ($match[2] = trim($match[2])) ] = array();
        
$last_match $match[2];
    }
    else 
array_push($final_array[$last_match], array($match[3], $match[4]));
    return 
'';
}
preg_replace_callback($pattern'pr_spt'$text); 
print_r($final_array);
?>

  Ответить  
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования