Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
PHP. Практика создания Web-сайтов (второе издание). Авторы: Кузнецов М.В., Симдянов И.В. PHP 5. На примерах. Авторы: Кузнецов М.В., Симдянов И.В., Голышев С.В. Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В. Объектно-ориентированное программирование на PHP. Авторы: Кузнецов М.В., Симдянов И.В. PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: file_get_contents() И кодировка
 
 автор: GoodBoy   (26.10.2006 в 15:23)   письмо автору
 
 

Такая проблемка передо мной встала. Делаю версию сайта на испанском языке. Когда инкулдю файлы с текстом, в браузере все корректно выводится. А вот когда читаю файл для разбора и последующего вывода, все буковки испаского языка, которые отличны от английского, в "каку" превращаются. Я не силен в вопросах кодировок. Вот хотелось бы узнать как разрешить такую проблемку. Да и вообще, как стратегически подходить к созданию сайтов с языковыми версиями отличными от родного русского и английского.

   
 
 автор: Unkind™   (26.10.2006 в 15:24)   письмо автору
 
   для: GoodBoy   (26.10.2006 в 15:23)
 

Покажите что Вы там делаете-то...
file_get_contents() вообще-то с кодировкой ниче не делает...

   
 
 автор: GoodBoy   (26.10.2006 в 16:42)   письмо автору
 
   для: Unkind™   (26.10.2006 в 15:24)
 

Простетскую xml-ку парсю. Потом включаю нужный текст в вывод.

К примеру: в испанском тексте есть слово "lapices", и над второй буковой стоит "ударение" (не помню уже, как эти штуки называются). Так вот на выходе появляется просто символ "a".

   
 
 автор: Trianon   (26.10.2006 в 17:20)   письмо автору
 
   для: GoodBoy   (26.10.2006 в 16:42)
 

В xml-файлах название кодовой страницы указывается в самом начале.
<?xml version="1.0" encoding="здесь" >

   
 
 автор: GoodBoy   (26.10.2006 в 18:24)   письмо автору
 
   для: Trianon   (26.10.2006 в 17:20)
 

Я знаю. Но я xml парсю вручную (рег. выражениями), как обычный текстовый файл. И еще в одном xml несколько языков. А html или xml можно указывать несколько кодировок?

   
 
 автор: Unkind™   (26.10.2006 в 18:28)   письмо автору
 
   для: GoodBoy   (26.10.2006 в 18:24)
 

А html или xml можно указывать несколько кодировок?
Нет

   
 
 автор: GoodBoy   (26.10.2006 в 18:36)   письмо автору
 
   для: Unkind™   (26.10.2006 в 18:28)
 

А с самим файлом, хранящим текст, не надо ничего мутить с кодировкой, т.е. как-то специфично сохранять для разных языков?

   
 
 автор: Trianon   (26.10.2006 в 20:27)   письмо автору
 
   для: GoodBoy   (26.10.2006 в 18:24)
 

если документ в кдировке UTF-8 - он может содержать смесь хоть на вообще всех языках.

   
 
 автор: GoodBoy   (27.10.2006 в 13:20)   письмо автору
 
   для: Trianon   (26.10.2006 в 20:27)
 

Тогда, я так понимаю, в html кодировку тоже utf надо ставить?

   
 
 автор: Trianon   (27.10.2006 в 13:40)   письмо автору
 
   для: GoodBoy   (27.10.2006 в 13:20)
 

тогда - да.
Нро Вы то так и не сказали, в каком виде у Вас документ.
Документ без кодировки вообще может быть разве что на бумаге.

   
 
 автор: GoodBoy   (27.10.2006 в 16:40)   письмо автору
 
   для: Trianon   (27.10.2006 в 13:40)
 

Сохранены в блокнотике, по умолачнию ANSI

   
 
 автор: Trianon   (27.10.2006 в 16:43)   письмо автору
 
   для: GoodBoy   (27.10.2006 в 16:40)
 

ANSI - это не кодировка. Точнее - не конкретная кодировка. Для каждого языка она своя.
для русского , например - это Windows-1251

   
 
 автор: GoodBoy   (27.10.2006 в 17:15)   письмо автору
 
   для: Trianon   (27.10.2006 в 16:43)
 

А фиг его знает, в какой там блокнот сохраняет файлы :(
А почему utf не начать повально использовать, чтоб не возникало вообще подобных вопросов? И где бы вообще о тонкостях кодировок почитать, в частности использования их в инете?

   
 
 автор: Trianon   (26.10.2006 в 15:43)   письмо автору
 
   для: GoodBoy   (26.10.2006 в 15:23)
 

а какую кодировку вы выставляете в строке
AddDefaultCharset
Вашего .htaccess?

   
 
 автор: GoodBoy   (26.10.2006 в 16:35)   письмо автору
 
   для: Trianon   (26.10.2006 в 15:43)
 

Ни какую

   
 
 автор: GoodBoy   (26.10.2006 в 18:36)   письмо автору
 
   для: Trianon   (26.10.2006 в 15:43)
 

Что дает эта деректива?

   
 
 автор: Trianon   (26.10.2006 в 20:26)   письмо автору
 
   для: GoodBoy   (26.10.2006 в 18:36)
 

указывает, в какой кодовой странице Вы формируете документы.
Потому что документов вне кодовых страниц не бывает. Тем более - содержащих символы национальных (читай - не английского) алфавитов.

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования