Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В. PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. C++. Мастер-класс в задачах и примерах. Авторы: Кузнецов М.В., Симдянов И.В. Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В. Социальная инженерия и социальные хакеры. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум Регулярные Выражения

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум (новые сообщения вниз) Структурный форум

тема: Как преобразовать текст в массив (разделитель точка в конце предложения)?

Сообщения:  [1-6] 

 
 автор: Владимир55   (19.04.2011 в 16:13)   письмо автору
 
   для: cheops   (19.04.2011 в 16:07)
 

Превосходно! Большое спасибо!

  Ответить  
 
 автор: cheops   (19.04.2011 в 16:07)   письмо автору
 
   для: Владимир55   (19.04.2011 в 15:42)
 

Можно изменить скрипт следующим образом
<?php
  $text 
"Разделителем массива должна быть точка в ".
          
"тексте. однако не всякая точка, а лишь та, ".
          
"которой предшествует не менее трех букв ".
          
"(так, что бы разделителем не явилась точка ".
          
"в сокращениях «г-н.» или «др.»). ".
          
"Разделителем массива должна быть точка в ".
          
"тексте. Однако не всякая точка, а лишь та, ".
          
"которой предшествует не менее трех букв ".
          
"(так, что бы разделителем не явилась точка ".
          
"в сокращениях «г-н.» или «др.»).";
  
$pattern "|(?<=[а-яА-Яa-zA-Z]{3})\.(?=[\s]+[А-ЯA-Z])|s";
  
$arr preg_split($pattern$text);
  echo 
"<pre>";
  
print_r($arr);
  echo 
"</pre>";
?>

  Ответить  
 
 автор: Владимир55   (19.04.2011 в 15:42)   письмо автору
 
   для: cheops   (19.04.2011 в 14:47)
 

Это просто замечательно! Спасибо! Я два дня корпел - а тут за минуту можно всё сделать.

Однако хотелось бы для корректности еще ужесточить критерий выбора нужной точки, добавив к имеющимся критериям отбора такое условие - правее точки после пробела (пробелов) имеется любая буква верхнего регистра (рус./лат.) или цифра.

  Ответить  
 
 автор: cheops   (19.04.2011 в 14:47)   письмо автору
 
   для: Владимир55   (19.04.2011 в 14:36)
 

Можно начать отталкиваться от следующего скрипта
<?php
  $text 
"Разделителем массива должна быть точка в ".
          
"тексте. Однако не всякая точка, а лишь та, ".
          
"которой предшествует не менее трех букв ".
          
"(так, что бы разделителем не явилась точка ".
          
"в сокращениях «г-н.» или «др.»). ".
          
"Разделителем массива должна быть точка в ".
          
"тексте. Однако не всякая точка, а лишь та, ".
          
"которой предшествует не менее трех букв ".
          
"(так, что бы разделителем не явилась точка ".
          
"в сокращениях «г-н.» или «др.»).";
  
$pattern "|(?<=[а-я]{3})\.|is";
  
$arr preg_split($pattern$text);
  echo 
"<pre>";
  
print_r($arr);
  echo 
"</pre>";
?>

  Ответить  
 
 автор: parczynski   (19.04.2011 в 14:42)   письмо автору
 
   для: Владимир55   (19.04.2011 в 14:36)
 

думаю проще всего через регулярные выражения заменить нужные вам точки на спец.знак и использовать его как разделитель

  Ответить  
 
 автор: Владимир55   (19.04.2011 в 14:36)   письмо автору
 
 

Разделителем массива должна быть точка в тексте. Однако не всякая точка, а лишь та, которой предшествует не менее трех букв (так, что бы разделителем не явилась точка в сокращениях «г-н.», «д-р.», «др.» или «тов.»).

Как сделать такое хитрое преобразование?

  Ответить  

Сообщения:  [1-6] 

Форум разработан IT-студией SoftTime
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования