|
|
|
| Используется при парсинге базы товаров из XLS-файла
Была такая функция:
function uc2html($str) {
$ret = '';
for( $i=0; $i<strlen($str)/2; $i++ ) {
$charcode = ord($str[$i*2])+256*ord($str[$i*2+1]);
$ret .= html_entity_decode('&#'.$charcode.';',ENT_NOQUOTES,'UTF-8');
}
return $ret;
}
|
Excel-файл размером 1.5Мб разбирался секунд 40-45, и наибольшие тормоза создает именно данная функция.
Перенос в функции html_entity_decode из цикла в результирующую строку сократил время обработки файла в 3 раза - время обработки стало около 15 секунд.
function uc2html($str) {
$ret = '';
for( $i=0; $i<strlen($str)/2; $i++ ) {
$charcode = ord($str[$i*2])+256*ord($str[$i*2+1]);
$ret .= '&#'.$charcode.';';
}
return html_entity_decode($ret,ENT_NOQUOTES,'UTF-8');
}
|
Вопрос: можно ли еще оптимизировать эту функцию? Хотелось бы избавиться от цикла. Мысли такие: заменить цикл на str_split -> array_map -> implode -> html_entity_decode
Но запутался в математике. Прошу помочь. | |
|
|
|
|
|
|
|
для: igrok54
(30.11.2015 в 12:08)
| | Вопрос решил кодом, обрабатывающим всю строку разом:
Код: Выделить всё
mb_convert_encoding($str,'UTF-8','UCS-2LE');
|
Вместо UCS-2LE можно UTF-16LE и byte2le. Время выполнения скрипта стало (Ура!) 0.2 сек. Прогресс 45сек -> 15сек -> 0.2сек. | |
|
|
|