Оптимизация функции конвертации строки из charcode в UTF-8

Форум:	Форум PHP	Форум Apache	Форум Регулярные Выражения	Форум MySQL	HTML+CSS+JavaScript	Форум Flash	Разное
Новые темы:	0	0	0	0	0	0	0

Здравствуйте, Посетитель!

вид форума:

тема: Оптимизация функции конвертации строки из charcode в UTF-8

следующая тема

предыдущая тема

автор: igrok54 (30.11.2015 в 12:08) письмо автору

Используется при парсинге базы товаров из XLS-файла
Была такая функция:

function uc2html($str) { $ret = ''; for( $i=0; $i<strlen($str)/2; $i++ ) { $charcode = ord($str[$i*2])+256*ord($str[$i*2+1]); $ret .= html_entity_decode('&#'.$charcode.';',ENT_NOQUOTES,'UTF-8'); } return $ret; }

Excel-файл размером 1.5Мб разбирался секунд 40-45, и наибольшие тормоза создает именно данная функция.

Перенос в функции html_entity_decode из цикла в результирующую строку сократил время обработки файла в 3 раза - время обработки стало около 15 секунд.

function uc2html($str) { $ret = ''; for( $i=0; $i<strlen($str)/2; $i++ ) { $charcode = ord($str[$i*2])+256*ord($str[$i*2+1]); $ret .= '&#'.$charcode.';'; } return html_entity_decode($ret,ENT_NOQUOTES,'UTF-8'); }

Вопрос: можно ли еще оптимизировать эту функцию? Хотелось бы избавиться от цикла. Мысли такие: заменить цикл на str_split -> array_map -> implode -> html_entity_decode
Но запутался в математике. Прошу помочь.

Ответить

автор: igrok54 (30.11.2015 в 23:37) письмо автору

для: igrok54 (30.11.2015 в 12:08)

Вопрос решил кодом, обрабатывающим всю строку разом:

Код: Выделить всё

mb_convert_encoding($str,'UTF-8','UCS-2LE');

Вместо UCS-2LE можно UTF-16LE и byte2le. Время выполнения скрипта стало (Ура!) 0.2 сек. Прогресс 45сек -> 15сек -> 0.2сек.

Ответить

вверх

Форум PHP