Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
MySQL 5. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. PHP 5. На примерах. Авторы: Кузнецов М.В., Симдянов И.В., Голышев С.В. PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В. C++. Мастер-класс в задачах и примерах. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: определить кодировку функция
 
 автор: расшифровка   (29.05.2008 в 08:28)   письмо автору
 
 

подскажите пожалуйста функцию или способ,
для автоматического определения кодировки текста,
интересует utf8 или 1251
спасибо

   
 
 автор: waptanet   (29.05.2008 в 13:27)   письмо автору
 
   для: расшифровка   (29.05.2008 в 08:28)
 

mb_detect_encoding()

   
 
 автор: Расшифровка   (02.06.2008 в 07:55)   письмо автору
 
   для: waptanet   (29.05.2008 в 13:27)
 

кому то может пригодиться, обалденная функция,
преобразует любую кодировку в
cp1251,

http://popoff.donetsk.ua/text/work/libs/a/charset/
большое спасибо автору

   
 
 автор: mihdan   (02.06.2008 в 10:55)   письмо автору
 
   для: Расшифровка   (02.06.2008 в 07:55)
 

Спасибо интересное решение (работает по типу PuntoSwitcher), но mb_detect_encoding() все же быстрее и надежнее

   
 
 автор: BinLaden   (02.06.2008 в 12:15)   письмо автору
 
   для: Расшифровка   (02.06.2008 в 07:55)
 

Если есть возможность, то не надо ни в коем случае полагаться на подобные функции.

   
 
 автор: Trianon   (02.06.2008 в 12:18)   письмо автору
 
   для: BinLaden   (02.06.2008 в 12:15)
 

Более того, подходить к такого рода проблемам следует, заранее постулируя для себя, что такой возможности нет, не было и не будет никогда.

   
 
 автор: Расшифровка   (02.06.2008 в 12:38)   письмо автору
 
   для: Trianon   (02.06.2008 в 12:18)
 

http://us2.php.net/mb_detect_encoding
почитал честно говоря примеры сыроватые,
если выложите готовую функцию, для преобразования буду благодарен
допустим если кодировка utf8, преобразовать в вин,

   
 
 автор: Trianon   (02.06.2008 в 12:41)   письмо автору
 
   для: Расшифровка   (02.06.2008 в 12:38)
 

Непонятно, да?...

Достоверно автоматически кодировку текста по самому тексту определить невозможно.
Подсказывать решения, которые работают пусть даже в 99% случаев, но в одном оставшемся сажают пользователя в лужу - я не хочу и не буду.

   
 
 автор: расшифровка   (03.06.2008 в 17:34)   письмо автору
 
   для: Trianon   (02.06.2008 в 12:41)
 

Trianon,
выкладывайте))
будем юзать с учетом погрешности,
всетаки опыт экспертов, интересен,
да возможность подчерпнуть интересные технологии, многих наверное заинтересует.

   
 
 автор: mihdan   (02.06.2008 в 14:03)   письмо автору
 
   для: Расшифровка   (02.06.2008 в 12:38)
 

mb_convert_encoding()

   
 
 автор: vitali   (02.06.2008 в 17:56)   письмо автору
 
   для: mihdan   (02.06.2008 в 14:03)
 

Ремарка: Multibyte String Функции плохо "борются" с iso-кодировкой - например, ISO-8859-5 воспринимают как UTF-8, несмотря даже на предварительные установки в mb_detect_order().

   
 
 автор: а-я   (03.06.2008 в 19:58)   письмо автору
 
   для: расшифровка   (29.05.2008 в 08:28)
 

кажись так можно узнать UTF8

<?
 
function is_utf8($string
 { 
     return 
preg_match('%^(?: 
           [\x09\x0A\x0D\x20-\x7E]            # ASCII 
         | [\xC2-\xDF][\x80-\xBF]             # non-overlong 2-byte 
         |  \xE0[\xA0-\xBF][\x80-\xBF]        # excluding overlongs 
         | [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2}  # straight 3-byte 
         |  \xED[\x80-\x9F][\x80-\xBF]        # excluding surrogates 
         |  \xF0[\x90-\xBF][\x80-\xBF]{2}     # planes 1-3 
         | [\xF1-\xF3][\x80-\xBF]{3}          # planes 4-15 
         |  \xF4[\x80-\x8F][\x80-\xBF]{2}     # plane 16 
     )*$%xs'
$string); 
 }
?>

   
 
 автор: BinLaden   (03.06.2008 в 20:02)   письмо автору
 
   для: а-я   (03.06.2008 в 19:58)
 

Эта функция лишь проверяет валидность текста в UTF-8.

   
 
 автор: а-я   (03.06.2008 в 20:30)   письмо автору
 
   для: BinLaden   (03.06.2008 в 20:02)
 

т.е.??

если будет другая кодировка она уже будет на валидна... отсюда мы узнаем, что это UTF

или я ошибаюсь??

   
 
 автор: BinLaden   (04.06.2008 в 15:10)   письмо автору
 
   для: а-я   (03.06.2008 в 20:30)
 

> если будет другая кодировка она уже будет на валидна

Почему Вы так в этом уверены? Я возьму, запишу текст в UCS-2, состоящий из символов ASCII и она удовлетрит шаблону в Вашей функции. Вы намерены полагаться на случай?

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования