Что лучше: много однострочных или один многострочный запрос INSERT?

Главная страница

Создание сайтов

Блог Кузнецова М.В.

Статьи о PHP

PHP-скрипты

Статьи об Apache

Форум С++

Консультации

Форум "Про Жизнь"

Форум:	Форум PHP	Форум Apache	Форум Регулярные Выражения	Форум MySQL	HTML+CSS+JavaScript	Форум Flash	Разное
Новые темы:	0	0	0	0	0	0	0

Здравствуйте, Посетитель!

вид форума:

тема: Что лучше: много однострочных или один многострочный запрос INSERT?

следующая тема

предыдущая тема

Сообщения: [1-10] [11-15]

	автор: Trianon (18.01.2008 в 21:50) письмо автору
	для: sav (18.01.2008 в 17:59)
	>>а если $this->parser не съел ровно 104857 байт? Остаток выкидываете? >остаток тоже обрабатывается когда буфер уже не получается 104857 байт Я в Вашем коде вижу иное. $buffer = ''; безусловно. >нет. каждый раз обрабатывается по 104857 байт, ftell($handle) при каждом круге увеличивается, поэтому я увеличиваю значение $part_size += 104857; Верно, тут я проглядел ftell() >вопрос в том что какой оптимальный размер части для обработки? Для любого подобного процесса оптимальный размер буфера может быть определен опытным путем. Для этого выполняют замеры производительности при размере буфера 1Кб 2Кб 4Кб 8Кб и т.д. С некоторого момента производительность (в Кб/сек), как функция от размера буфера, перестает расти, и начинает ассимптотически приближаться к некоторой константе. Где-то в этой точке (где производная роста становится меньше единицы) имеет смысл остановиться, дабы не тратить зря ресурсы.

	автор: sav (18.01.2008 в 17:59) письмо автору
	для: Trianon (17.01.2008 в 23:23)
	>а если $this->parser не съел ровно 104857 байт? Остаток выкидываете? остаток тоже обрабатывается когда буфер уже не получается 104857 байт >Дальше. На первом этапе Вы обрабатываете (примерно) 100 Кб >на втором - 200 Кб на третьем 300 и т.д.? нет. каждый раз обрабатывается по 104857 байт, ftell($handle) при каждом круге увеличивается, поэтому я увеличиваю значение $part_size += 104857; вопрос в том что какой оптимальный размер части для обработки?

	автор: Trianon (17.01.2008 в 23:23) письмо автору
	для: sav (17.01.2008 в 12:19)
	а если $this->parser не съел ровно 104857 байт? Остаток выкидываете? Дальше. На первом этапе Вы обрабатываете (примерно) 100 Кб на втором - 200 Кб на третьем 300 и т.д.?

автор: sav (17.01.2008 в 12:19) письмо автору

для: cheops (17.01.2008 в 02:34)

размер можно выбирать я делаю так например текстовый файл весит 5 мб

<?php fopen('text.txt', "r"); $part_size = 104857; while(!feof($handle)) { $buffer .= fgets($handle, 4096); if(ftell($handle) >= $part_size) { //когда размер строки 104857 байт парсю её и записываю в БД $this->parser($buffer); $buffer = ''; $part_size += 104857; } $i++; } //тут пишем оставшуюся часть файла $this->parser($buffer); fclose($handle); ?>

при таком раскладе какой размер части будет оптимальным?

	автор: cheops (17.01.2008 в 02:34) письмо автору
	для: sav (16.01.2008 в 18:26)
	Если объём данных в массиве $array не больше max_allowed_packet (по умолчанию 2 Мб), то лучше использовать второй вариант.

	автор: AVS (17.01.2008 в 00:15) письмо автору
	для: Trianon (16.01.2008 в 23:26)
	Согласен. Именно это я и имел в виду.

автор: Trianon (16.01.2008 в 23:26) письмо автору

для: AVS (16.01.2008 в 23:07)

>>А значит сгенерировать корректный запрос можно всегда.
>Я этого не отрицаю. Но существует понятие "синтаксическая ошибка".
>Строка содержит кавычку - будет ошибка если сама строка взята в кавычки.

Не будет, если правила лексики языка будут соблюдены.

insert into `O``relly` (id, `mc``robbins`) VALUES (1, "O\"Henry");

>Имя таблицы содержит обратную кавычку и мы используем обратные кавычки для обозначения этих имен - ошибка.
Не будет, если правила лексики языка будут соблюдены.

CREATE TABLE `O``relly` ( `id``row` INT NOT NULL , `mc``robbins` VARCHAR( 20 ) NOT NULL ) ENGINE = MYISAM

>Это надо учитывать всегда.
>Особенно при написании своей системы дампа базы данных (например) или другого скрипта, >генерирующего запросы.

На данном уровне это не синтаксическая ошибка. Это ошибка в алгоритме. То есть логическая.

	автор: AVS (16.01.2008 в 23:07) письмо автору
	для: Trianon (16.01.2008 в 22:35)
	>А значит сгенерировать корректный запрос можно всегда. Я этого не отрицаю. Но существует понятие "синтаксическая ошибка". Строка содержит кавычку - будет ошибка если сама строка взята в кавычки. Имя таблицы содержит обратную кавычку и мы используем обратные кавычки для обозначения этих имен - ошибка. Это надо учитывать всегда. Особенно при написании своей системы дампа базы данных (например) или другого скрипта, генерирующего запросы.

	автор: Trianon (16.01.2008 в 22:35) письмо автору
	для: elenaki (16.01.2008 в 20:22)
	В MySQL запрещенных символов не бывает в принципе. Иначе нельзя было бы двоичные файлы в таблицы вносить (те же картинки и прочее). А значит сгенерировать корректный запрос можно всегда. Писать весь объем данных в один запрос, конечно же, не стоит. Но выбрать разумное количество записей - более чем полезно. Это изрядно (в некоторых случаях в десятки раз) ускоряет процесс вставки.

	автор: elenaki (16.01.2008 в 20:55) письмо автору
	для: tAleks (16.01.2008 в 20:27)
	скажет - "ошибка в строке 1". а там ВСЕ в строке 1! я пробовала и одним запросом, но пришла к выводу, что лучше на каждую строку свой запрос. когда получаешь данные по почте от неподготовленного юзера, там может быть все, что угодно. самая частая ошибка - таб в ячейке и в csv все ячейки сдвигаются. или вообще какие-то нечитаемые символы (csv делали не в Excel, а в другом приложении). да много всего может быть. если б не было такого печального опыта, я бы не реагировала.

Сообщения: [1-10] [11-15]

Форум разработан IT-студией SoftTime