|
|
|
| Такая проблемка передо мной встала. Делаю версию сайта на испанском языке. Когда инкулдю файлы с текстом, в браузере все корректно выводится. А вот когда читаю файл для разбора и последующего вывода, все буковки испаского языка, которые отличны от английского, в "каку" превращаются. Я не силен в вопросах кодировок. Вот хотелось бы узнать как разрешить такую проблемку. Да и вообще, как стратегически подходить к созданию сайтов с языковыми версиями отличными от родного русского и английского. | |
|
|
|
|
|
|
|
для: GoodBoy
(26.10.2006 в 15:23)
| | Покажите что Вы там делаете-то...
file_get_contents() вообще-то с кодировкой ниче не делает... | |
|
|
|
|
|
|
|
для: Unkind™
(26.10.2006 в 15:24)
| | Простетскую xml-ку парсю. Потом включаю нужный текст в вывод.
К примеру: в испанском тексте есть слово "lapices", и над второй буковой стоит "ударение" (не помню уже, как эти штуки называются). Так вот на выходе появляется просто символ "a". | |
|
|
|
|
|
|
|
для: GoodBoy
(26.10.2006 в 16:42)
| | В xml-файлах название кодовой страницы указывается в самом начале.
<?xml version="1.0" encoding="здесь" > | |
|
|
|
|
|
|
|
для: Trianon
(26.10.2006 в 17:20)
| | Я знаю. Но я xml парсю вручную (рег. выражениями), как обычный текстовый файл. И еще в одном xml несколько языков. А html или xml можно указывать несколько кодировок? | |
|
|
|
|
|
|
|
для: GoodBoy
(26.10.2006 в 18:24)
| | А html или xml можно указывать несколько кодировок?
Нет | |
|
|
|
|
|
|
|
для: Unkind™
(26.10.2006 в 18:28)
| | А с самим файлом, хранящим текст, не надо ничего мутить с кодировкой, т.е. как-то специфично сохранять для разных языков? | |
|
|
|
|
|
|
|
для: GoodBoy
(26.10.2006 в 18:24)
| | если документ в кдировке UTF-8 - он может содержать смесь хоть на вообще всех языках. | |
|
|
|
|
|
|
|
для: Trianon
(26.10.2006 в 20:27)
| | Тогда, я так понимаю, в html кодировку тоже utf надо ставить? | |
|
|
|
|
|
|
|
для: GoodBoy
(27.10.2006 в 13:20)
| | тогда - да.
Нро Вы то так и не сказали, в каком виде у Вас документ.
Документ без кодировки вообще может быть разве что на бумаге. | |
|
|
|
|
|
|
|
для: Trianon
(27.10.2006 в 13:40)
| | Сохранены в блокнотике, по умолачнию ANSI | |
|
|
|
|
|
|
|
для: GoodBoy
(27.10.2006 в 16:40)
| | ANSI - это не кодировка. Точнее - не конкретная кодировка. Для каждого языка она своя.
для русского , например - это Windows-1251 | |
|
|
|
|
|
|
|
для: Trianon
(27.10.2006 в 16:43)
| | А фиг его знает, в какой там блокнот сохраняет файлы :(
А почему utf не начать повально использовать, чтоб не возникало вообще подобных вопросов? И где бы вообще о тонкостях кодировок почитать, в частности использования их в инете? | |
|
|
|
|
|
|
|
для: GoodBoy
(26.10.2006 в 15:23)
| | а какую кодировку вы выставляете в строке
AddDefaultCharset
Вашего .htaccess? | |
|
|
|
|
|
|
|
для: Trianon
(26.10.2006 в 15:43)
| | Ни какую | |
|
|
|
|
|
|
|
для: Trianon
(26.10.2006 в 15:43)
| | Что дает эта деректива? | |
|
|
|
|
|
|
|
для: GoodBoy
(26.10.2006 в 18:36)
| | указывает, в какой кодовой странице Вы формируете документы.
Потому что документов вне кодовых страниц не бывает. Тем более - содержащих символы национальных (читай - не английского) алфавитов. | |
|
|
|