Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В. MySQL на примерах. Авторы: Кузнецов М.В., Симдянов И.В. PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В. PHP. Практика создания Web-сайтов (второе издание). Авторы: Кузнецов М.В., Симдянов И.В. Социальная инженерия и социальные хакеры. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Кодировка UTF-8!!!
 
 автор: Yustys   (07.01.2008 в 04:52)   письмо автору
 
 

Последнее время неоднократно слышал мнение, что сайты сейчас нужно создавать в кодировке UTF-8. Говорят что она наиболее перспективная и корректная, что нужно отказываться от всех других кодировок!!! Нужен авторитетный ответ на этот вопрос. Спасибо

   
 
 автор: Trianon   (07.01.2008 в 08:56)   письмо автору
 
   для: Yustys   (07.01.2008 в 04:52)
 

Если Вы хотите, чтобы Ваш сайт был посещался не только в России, но и достаточно спокойно был востребован в остальных регионах (в западной европе, к примеру) его нужно проектировать в utf-8.
Кроме того utf-8 естественным образом ложится на XML (а значит на RSS, ajax, flash и прочие сопутствующие технологии)

utf-8 требует несколько большей аккуратности в проектировании логики обработки данных.
Кроме того, спектр средств разработки (в частности - редакторов исходного кода) для utf-8 будет победнее - примитивным текстовым редактором Вы не обойдетесь.
Это цена, которую придется платить.

   
 
 автор: mihdan   (07.01.2008 в 11:06)   письмо автору
 
   для: Trianon   (07.01.2008 в 08:56)
 

>Кроме того, спектр средств разработки (в частности - редакторов исходного кода) для utf-8 будет победнее - примитивным текстовым редактором Вы не обойдетесь.
>Это цена, которую придется платить.

   
 
 автор: coloboc66   (07.01.2008 в 11:23)   письмо автору
 
   для: Trianon   (07.01.2008 в 08:56)
 

utf-8 также может работать с мобильными телефонами. Вот и получается, что эта кодировка универсальна и всё, что вами в ней написано, в случае необходимости без дополнительных усилий может быть перенесено на любой другой язык или в в wap-версию.
Как по мне, то основная проблема при использовании utf-8 возникает на русском апаче.

   
 
 автор: elenaki   (07.01.2008 в 11:28)   письмо автору
 
   для: coloboc66   (07.01.2008 в 11:23)
 

с этой utf8 одни заморочки... не было у бабы забот - перевела сайт на utf8 :(

   
 
 автор: SHAman   (07.01.2008 в 18:43)   письмо автору
 
   для: elenaki   (07.01.2008 в 11:28)
 

Зря вы так. Я вот перешел на ютф, решил один раз проблемы, теперь все в ней делаю. И буду делать. Потому что проблем никаких. Внутренний формат JS - utf-8, посему, с аяксом проблем не возникает вообще. Отображается это удовольствие всегда и везде одинаково и красиво. За юникодом будущее, как ни крути. Все остальные кодировки давно пора выкинуть на свалку истории.

   
 
 автор: Unkind   (07.01.2008 в 12:17)   письмо автору
 
   для: coloboc66   (07.01.2008 в 11:23)
 

> utf-8 также может работать с мобильными телефонами
Не, это браузеры мобильных телефонов могут работать с UTF-8, а не наоборот

   
 
 автор: mihdan   (07.01.2008 в 14:46)   письмо автору
 
   для: Yustys   (07.01.2008 в 04:52)
 

http://ru.wikipedia.org/wiki/UTF-8

   
 
 автор: Alex14   (07.01.2008 в 16:47)   письмо автору
 
   для: mihdan   (07.01.2008 в 14:46)
 

Почему обязательно переходить на UTF-8? Указал в заголовке кодировку
<meta http-equiv="content-type" content="text/html; charset=windows-1251" />
и браузер автоматически всё правильно отображает. Или проблема в том, что за рубежом не у всех эта кодировка есть?

   
 
 автор: SHAman   (07.01.2008 в 18:45)   письмо автору
 
   для: Alex14   (07.01.2008 в 16:47)
 

Проблема не только в отображении. В некоторых странах кодировки win-1251 нету. Да и вообще, utf-8 - это более-менее единый стандарт, на него надо ровняться. Лично меня бесит, когда куда-нибудь заходишь, а оно не в той кодировке. Если бы все юникод юзали, то таких проблем бы не было.

   
 
 автор: Alex14   (07.01.2008 в 19:01)   письмо автору
 
   для: SHAman   (07.01.2008 в 18:45)
 

Кодировки нет наверное не в странах, а на компьютерах пользователей. По-моему это довольно экзотический случай, т.к. CP1251 является почти стандартом в русскоязычном интернете, или по крайней мере входит в стандартный набор кодировок, которые должны быть на компьютере. У кого её нет, не может может просматривать значительную часть сайтов рунета (если не большинство), поэтому обязательно её установит.

   
 
 автор: SHAman   (07.01.2008 в 21:49)   письмо автору
 
   для: Alex14   (07.01.2008 в 19:01)
 

Как ни крути, а ютф-8 - прогрессивная кодировка, в отличие от однобайтовых собратьев.

   
 
 автор: Trianon   (07.01.2008 в 21:51)   письмо автору
 
   для: Alex14   (07.01.2008 в 19:01)
 

В странах. Вы же сами о рунете говорите. Рунет - что такое по-вашему?

   
 
 автор: Alex14   (07.01.2008 в 23:23)   письмо автору
 
   для: Trianon   (07.01.2008 в 21:51)
 

Рунет - сайты на русском языке. Да не спорю, что хорошо, когда одна кодировка, просто не вижу пока особых причин для беспокойства. Если будет нужно, просто заменить на всех страницах в мета-теге windows-1251 на UTF-8, вот и все дела.

   
 
 автор: coloboc66   (07.01.2008 в 23:54)   письмо автору
 
   для: Alex14   (07.01.2008 в 23:23)
 

Да не все дела. Попробуйте так сделать, и у вас, по крайней мере, wap-сайты точно сломаются. А также сломаются все регулярные выражения. И ещё что-нибудь обязательно сломается.

   
 
 автор: Alex14   (07.01.2008 в 23:57)   письмо автору
 
   для: coloboc66   (07.01.2008 в 23:54)
 

Смотря как сайты делать. У меня сайт от этого не зависит, хотя тоже использую регулярные выражения для подстановки в шаблон. Про WAP ничего не знаю, т.к. не занимался этим.

   
 
 автор: Unkind   (08.01.2008 в 09:59)   письмо автору
 
   для: Alex14   (07.01.2008 в 23:57)
 

Если Вам достаточно сменить заголовок "и все дела", то у Вас на сайте получается нигде нет ни кириллицы, ни нестандартных символов (ord > 0x7F).

   
 
 автор: Alex14   (08.01.2008 в 13:57)   письмо автору
 
   для: Unkind   (08.01.2008 в 09:59)
 

Если нет кириллицы, то и заголовок менять не надо - первые 127 символов в любой кодировке одинаковы. А изменение кода симоволов в тексте вообще проблемой не считаю - достаточно просто в редакторе открыть текст в кодировке cp1251, вырезать его весь, сменить кодировку на UTF-8, вставить обратно текст и сохранить. Или, если страниц много, скрипт написать.

   
 
 автор: Trianon   (08.01.2008 в 15:26)   письмо автору
 
   для: Alex14   (08.01.2008 в 13:57)
 

>Если нет кириллицы, то и заголовок менять не надо - первые 127 символов в любой кодировке одинаковы.

Это шедевр.
А простите, языков, отличных от английского и от образующих славянскую группу, их что - вообще в природе не существует?!

   
 
 автор: Alex14   (08.01.2008 в 15:38)   письмо автору
 
   для: Trianon   (08.01.2008 в 15:26)
 

С другими языками не имел дела. А что, в китайских кодировках иероглифы в первые 127 символов входят?

   
 
 автор: Trianon   (08.01.2008 в 15:50)   письмо автору
 
   для: Alex14   (08.01.2008 в 15:38)
 

>С другими языками не имел дела.

В таком случае, сделайте всем большое одолжение.
Вопрос автора треда адресован явно не Вам.

   
 
 автор: Unkind   (08.01.2008 в 15:46)   письмо автору
 
   для: Alex14   (08.01.2008 в 13:57)
 

> Если нет кириллицы, то и заголовок менять не надо - первые 127 символов в любой кодировке одинаковы.
Значит Вы хотите сказать, что у Вас на сайте есть кириллица и прочие символы, отличные от латинских, цифр и стандартных символов?
И Ваши же слова: "Если будет нужно, просто заменить на всех страницах в мета-теге windows-1251 на UTF-8, вот и все дела".
Вы этим говорите, что кодировка сама каким-то чудом смениться - достаточно только сменить заголовок. Да к какому черту этот заголовок был бы нужен? Не несите чушь.
Да и к Вашему сведению - в промежутке 128 - 255 лежит не только кириллица в windows-1251. Поэтому если её нет, это совсем ничего еще не значит.

   
 
 автор: Alex14   (08.01.2008 в 16:04)   письмо автору
 
   для: Unkind   (08.01.2008 в 15:46)
 

Trianon
А где в первом сообщении темы вы увидели вопрос об экзотических языках?

Unkind
Вы очень догадливы, есть кириллица.
Смена кодировки - это: 1) изменение кода символов в тексте, 2) изменение заголовка страницы (не обязательно, только чтобы браузер автоматически нужную кодировку выбирал, если она есть на компьютере).
В чём чушь, поведайте, гуру.

   
 
 автор: Unkind   (08.01.2008 в 16:21)   письмо автору
 
   для: Alex14   (08.01.2008 в 16:04)
 

В посте с датой 07.01.2008 в 23:23 Вы ничего не говорили про первый пункт. Спохватились, очевидно, поздно. Чушь уже сказали. Сначала подумайте, а потом нажимайте "Отправить".
А не отпираться потом.

   
 
 автор: Alex14   (08.01.2008 в 16:25)   письмо автору
 
   для: Unkind   (08.01.2008 в 16:21)
 

Вы прямо как следователь к словам цепляетесь. Согласен, первый пункт не сказал - наслаждайтесь этим. Хотя он очевиден, в том числе и в техническом отношении.

   
 
 автор: coloboc66   (08.01.2008 в 17:22)   письмо автору
 
   для: Alex14   (08.01.2008 в 16:25)
 

Если просто так взять и поменять кодировку на utf-8, то вперёд заголовков будут отправляться BOM-ы и всё сломается...

   
 
 автор: Faraon   (07.01.2008 в 23:59)   письмо автору
 
   для: coloboc66   (07.01.2008 в 23:54)
 

Смотря что проверяют регулярки :)

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования