| |
|
|
| | В выдаче Яндекса на xml запрос имеются не предусмотренные регламентом коды типа "
<passage>"Сумчатое" настроение на лето
<passage>Художественный фильм "Мое лето любви"
<passage>Летом надо отдыхать, а деньги, сэкономленные при покупке автомобиля Ford у Атлант-М Либерти, будет очень приятно тратить где-нибудь на пляжах и в сувенирных лавках Турции или Египта.
Присутствуют они не всегда, а их существование в регламенте не предусмотрено. Возможно, что в них заложен глубокий смысл, но я этого не знаю. Впечатление, что это типа кавычек в какой-нибудь кодировке, или что-то в этом роде.
Как бы текст очистить от этих кодов? Что бы при любой комбинации цифр эти коды не пролезали в текст? | |
| |
|
|
| |
|
|
| |
для: Владимир55
(23.07.2007 в 23:48)
| | | как вариант
preg_replace('|&#[0-9]+;|', '', $str);
|
| |
| |
|
|
| |
|
|
| |
для: Ziq
(24.07.2007 в 00:55)
| | | Ну тогда уж
<?php
$string = preg_replace("/&#([0-9]+);/e", "chr(\\1)", $string);
$string = preg_replace("/&#x([0-9a-fA-F]+);/e", "chr(hexdec(\\1))", $string);
?>
|
| |
| |
|
|
| |
|
|
| |
для: Владимир55
(23.07.2007 в 23:48)
| | | " - цифровая мнемоника - эквивалент символьной "
  - аналогично
Так что с ними можно ничего не делать...
ну или позаменять на символьные, чтоб понятнее было) | |
| |
|
|
| |
|
|
| |
для: Владимир55
(23.07.2007 в 23:48)
| | | Похоже, Вы некорректно разбираете XML-отклик.
При корректном разборе таких "корявок" не будет.
Код " в XML означает то же что и chr(34) в php. | |
| |
|
|
| |
|
|
| |
для: Trianon
(24.07.2007 в 13:32)
| | | Сейчас посмотрел - эти коды приходят прямо с первородным ответом, до разбора и обработки. | |
| |
|
|
| |
|
|
| |
для: Владимир55
(24.07.2007 в 16:09)
| | | >Сейчас посмотрел - эти коды приходят прямо с первородным ответом, до разбора и обработки.
Никто и не сомневался. Там они и должны быть именно в таком виде.
И стандартом XML (который Вы называете регламентом) эти символы предусмотрены. | |
| |
|
|
| |
|
|
| |
для: Trianon
(24.07.2007 в 13:32)
| | | > Код " в XML означает то же что и chr(34) в php.
Но не тоже самое, что " (или ") в HTML? | |
| |
|
|
| |
|
|
| |
для: kasmanaft
(24.07.2007 в 19:48)
| | | наверное то же.
Но задача-то была не в HTML данные получить. А в plain-text.
Иначе эти закорючки Владимира не испугали и не удивили бы. | |
| |
|
|
| |
|
|
| |
для: Владимир55
(23.07.2007 в 23:48)
| | | >Как бы текст очистить от этих кодов? Что бы при любой комбинации цифр эти коды не пролезали в текст?
а разве html эти коды не должен переводить в символы при выводе в браузер??? | |
| |
|
|