Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
PHP Puzzles. Авторы: Кузнецов М.В., Симдянов И.В. PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. PHP 5. На примерах. Авторы: Кузнецов М.В., Симдянов И.В., Голышев С.В. MySQL 5. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Оптимизация функции конвертации строки из charcode в UTF-8
 
 автор: igrok54   (30.11.2015 в 12:08)   письмо автору
 
 

Используется при парсинге базы товаров из XLS-файла
Была такая функция:
function uc2html($str) {
    $ret = '';
    for( $i=0; $i<strlen($str)/2; $i++ ) {
        $charcode = ord($str[$i*2])+256*ord($str[$i*2+1]);
        $ret .= html_entity_decode('&#'.$charcode.';',ENT_NOQUOTES,'UTF-8');
    }
    return $ret;
}

Excel-файл размером 1.5Мб разбирался секунд 40-45, и наибольшие тормоза создает именно данная функция.

Перенос в функции html_entity_decode из цикла в результирующую строку сократил время обработки файла в 3 раза - время обработки стало около 15 секунд.
function uc2html($str) {
    $ret = '';
    for( $i=0; $i<strlen($str)/2; $i++ ) {
        $charcode = ord($str[$i*2])+256*ord($str[$i*2+1]);
        $ret .= '&#'.$charcode.';';
    }
    return html_entity_decode($ret,ENT_NOQUOTES,'UTF-8');
}

Вопрос: можно ли еще оптимизировать эту функцию? Хотелось бы избавиться от цикла. Мысли такие: заменить цикл на str_split -> array_map -> implode -> html_entity_decode
Но запутался в математике. Прошу помочь.

  Ответить  
 
 автор: igrok54   (30.11.2015 в 23:37)   письмо автору
 
   для: igrok54   (30.11.2015 в 12:08)
 

Вопрос решил кодом, обрабатывающим всю строку разом:

Код: Выделить всё
mb_convert_encoding($str,'UTF-8','UCS-2LE');


Вместо UCS-2LE можно UTF-16LE и byte2le. Время выполнения скрипта стало (Ура!) 0.2 сек. Прогресс 45сек -> 15сек -> 0.2сек.

  Ответить  
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования