Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
PHP 5. На примерах. Авторы: Кузнецов М.В., Симдянов И.В., Голышев С.В. Объектно-ориентированное программирование на PHP. Авторы: Кузнецов М.В., Симдянов И.В. MySQL 5. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. Социальная инженерия и социальные хакеры. Авторы: Кузнецов М.В., Симдянов И.В. MySQL на примерах. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Прочитать содержимое страницы
 
 автор: Штеукуы   (27.07.2007 в 20:04)   письмо автору
 
 

file_get_contents vs fsockopen+fread vs fopen

Нужно открыть страницу в интернете пропарсить ее содержимое и занести кое какие данные в базу.
Какая из этих функций справится с этой задачей лучше и быстрее всего.

З.Ы. Вопрос надежности и скорости актуален, потому что скрипт будет работать в непрерывном режиме 24/7.

interes )

   
 
 автор: Trianon   (27.07.2007 в 20:25)   письмо автору
 
   для: Штеукуы   (27.07.2007 в 20:04)
 

>З.Ы. Вопрос надежности и скорости актуален

fileget_contents и fopen отпадают сразу. Вы просто не разберетесь, что Вам отвечает сервер.

fsockopen потребует кропотливой реализации http-протокола.

Ответ:
CURL - Client URL library functions (http://php.net/manual/ru/ref.curl.php) предназначены и разработаны специально для создания http-запросов к чужим серверам в сложных случаях (поддержка cookies, работа через прокси, работа с https/ssl серверами)

   
 
 автор: Штеукуы   (27.07.2007 в 20:34)   письмо автору
 
   для: Trianon   (27.07.2007 в 20:25)
 

Есть опыт работы со всеми вариантами, только ни в одном случае не требовалось выдерживать такие нагрузки.

Возможно вы не поняли что именно мне нужно. Мне нужна не связка сервер-клиент. Нужно постоянно парсить новые динамически создаваемые html страницы.

Примерно 200-400 тыс в сутки....Поэтому и встал вопрос надежности и скорости.

Возможно php не лучший вариант, но другого пока нет )

interes

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования