|
|
|
| Пытаюсь вырезать заголовки <h1>.
Есть текст следующего вида
<h1>заголовок 1 <a href="" >Подробно</a></h1>
<h2>подзаголовок 1.1</h2>
<h1>заголовок 2</h1>
|
Если задать регулярное выражение вида
вырезается 1 соответствие
<h1>заголовок 1 <a href="" >Подробно</a></h1>
<h2>подзаголовок 1.1</h2>
<h1>заголовок 2</h1>
|
А мне нужно получить 2 соответствия
<h1>заголовок 1 <a href="" >Подробно</a></h1>
<h1>заголовок 2</h1>
|
| |
|
|
|
|
|
|
|
для: Wapo
(18.05.2012 в 11:46)
| | Нашел в этом форуме подобную задачу, там есть регулярное выражение
<h[0-6]*\>([а-яА-Я0-9\/\.\-\—\(\)\sa-zA-Z]*)\<\/h[0-6]*\>, но если внутри тега объявить другой тэг (например ссылку <a>) это регулярное выражение срабатывает не так как хотелось. Как это исправить? Помогите пожалуйста | |
|
|
|
|
|
|
|
для: Wapo
(18.05.2012 в 12:28)
| |
|<h[1-6]+>.*?</h[1-6]+>|si
|
Если работаете через РНР, потом можете вырезать все теги из полученной строки при помощи strip_tags | |
|
|
|
|
|
|
|
для: mihdan
(18.05.2012 в 12:57)
| | Я пишу на C#.
Но это уже другая песня.
Спасибо mihdan за помощь.
Конечный вариант (<h[1-6]>.*?</h[1-6]>)|(<p>.*?</p>)|(<div>.*?</div>) с поддержкой параграфов и дивов | |
|
|
|