Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
PHP Puzzles. Авторы: Кузнецов М.В., Симдянов И.В. C++. Мастер-класс в задачах и примерах. Авторы: Кузнецов М.В., Симдянов И.В. MySQL на примерах. Авторы: Кузнецов М.В., Симдянов И.В. PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В. Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум (новые сообщения вниз) Структурный форум

тема: Взятие информации с чужого сайта (часть 2)

Сообщения:  [1-10]   [11-12] 

 
 автор: sata   (11.05.2005 в 22:32)   письмо автору
 
   для: cheops   (11.05.2005 в 12:15)
 

А взять нужно все характеристики они все имеют метки я для теста взял тока Stock Number он с меткой class=stockno. Зделал отсев тока по номеру а вот всё в куче нифига неполучается что то. Сварганил уже бета версию скрипта который по идее должон работать но загвоздочка вот собственно в чём по идее открываем страницу и содержимое должно сохраняться в файл потом файл фильтруется регами и выводится результат, в файл ничего не сохраняется но если тестить просто на вывод то страница выдирается и выводится на экран. Чё то я как то запутано обьяснил.
Тут в будущем есть одна проблема текст то сохранится в базу, а вот как быть с фотками при выводе все урлы меняются.
И вопрос по идее если как то выдрать эти фотки их же можно сохранить в базу как бинарники (в BLOB ) или их аплоэдить придётся. Спасибо

   
 
 автор: cheops   (11.05.2005 в 12:15)   письмо автору
 
   для: sata   (10.05.2005 в 20:44)
 

А какой кусок необходимо извлечь?

   
 
 автор: sata   (10.05.2005 в 20:44)   письмо автору
 
   для: sata   (10.05.2005 в 17:09)
 

Вот сварганил скриптик (неработает) что то я опять с регами намухливал. Непоможите

<?
set_time_limit
(0); 
//Открываем страницу
$url "https://www.iaai-bid.com/branchauctions.aspx?branch=623";
$ch curl_init();
curl_setopt($chCURLOPT_SSL_VERIFYPEERFALSE);
curl_setopt($chCURLOPT_URL,$url);
curl_setopt($chCURLOPT_FAILONERROR1);
curl_setopt($chCURLOPT_FOLLOWLOCATION1);
curl_setopt($chCURLOPT_RETURNTRANSFER,1);
curl_setopt($chCURLOPT_TIMEOUT3);
$result curl_exec($ch);//сохраняем содержание в переменную
//===================
$page file_get_contents("$result"); 
$pattern "|<A class=stockno href=([-a-z0-9])</A>|"
preg_match_all ($pattern,$page,$out,PREG_PATTERN_ORDER);
print_r($out[1]);  
curl_close($ch); 
?>

   
 
 автор: sata   (10.05.2005 в 17:09)   письмо автору
 
   для: sata   (10.05.2005 в 15:07)
 

О блин допёрло :)

<?php 
set_time_limit
(0); 
$page file_get_contents("http://autolegra.ru/details.htm"); 
$pattern "|<SPAN id=stockNumber2>([0-9]+)</SPAN>|"
preg_match_all ($pattern,$page,$out,PREG_PATTERN_ORDER); 
echo 
"<table>"
for(
$i 0$i count($out[1]); $i++) 

echo 
"<tr><td>".$out[1][$i]."</td></tr>"

echo 
"</table>";
?> 

   
 
 автор: sata   (10.05.2005 в 15:07)   письмо автору
 
   для: cheops   (08.05.2005 в 00:31)
 

Мда что то с регулярками у меня совсем туго, Но я их небоюсь :)
Приложил файл страницы откуда выдирается
Захороводил я что то типа этого

<?php 
set_time_limit
(0); 
$page file_get_contents("http://autolegra.ru/details.htm"); 
$pattern "|<SPAN id=stockNumber2>([^])</SPAN>|"
preg_match_all ($pattern,$page,$out,PREG_PATTERN_ORDER); 
echo 
"<pre>"
  
print_r($out[1]); 
  echo 
"</pre>";
?> 

Но результата недобился. Страница с тех характеристиками машины каждая характеристика имеет свою метку вот сижу копаю как их оттуда изьять. После изьятия уже в базу закинуть как нефиг делать.

   
 
 автор: cheops   (08.05.2005 в 00:31)   письмо автору
 
   для: sata   (07.05.2005 в 23:49)
 

Вы можете посмотреть ссылки по теме, а так же темы по ссылкам, а так же ссылку указанные в них - это всё вполне реально, главное получить страницу, разобрать её по винтику не вопрос, если не боитесь регулярных выражений (если боитесь, я вам помогу :).
http://www.softtime.ru/forum/read.php?id_forum=1&id_theme=3110
http://www.softtime.ru/forum/read.php?id_forum=1&id_theme=3137
http://www.softtime.ru/forum/read.php?id_forum=1&id_theme=3181

   
 
 автор: sata   (07.05.2005 в 23:49)   письмо автору
 
   для: sata   (07.05.2005 в 12:04)
 

Всё таки выдрал я инфу с их сайта через curl скрипт здесь http://www.autolegra.ru/test.php.
Уважаемый cheops я тут сижу в полной "Ж" так как незнаю что делать, а что знаю незнаю как реализовать.
Смысл всего таков: вглубь этого https://www.iaai-bid.com/ сайта попасть могут тока зареганые пользователи а их немного так как это закрытый сайт. Вот у меня и стоит задача (над которой я уже фиг знает скока думаю) нужно таблицы с машинами перенести на свой сайт при этом не выдав пароль с логином юзерам. Поразмыслив надумал тока пару вариантов.
1 вариант. Скрипт должен авторизоваться и вытащить инфу с сайта внести её в нашу базу данных а дальше уже делай что хочеш, но проблема с авторизацией и https и при этом ещё фиг знает как фотки от туда выудить к себе.
2 вариант. Возможно страницы сохранять вручную Дабы их немного и тогда вопрос с авторизацией и https отпадает напроч но остаётся вопрос как же занести инфу и фотки в базу.
Блин это последнее что нужно зделать на сайте чтобы здать его и я нифига неврубаюсь ка реализовать сиё дело вроде додумаеш идею а блин какая нить фигня заступорит всё делоБуду Благодарен за любые идеи.

   
 
 автор: sata   (07.05.2005 в 12:04)   письмо автору
 
   для: cheops   (04.05.2005 в 21:54)
 

Короче полная засада и за что тока 10 баксов в месяц плочу (правда фирма платит). Нифига у них не настроен https в php так что выдрать никак неполучится, а очень надо. Помозговав немного поспрашивав у умных людей пришлося всё к выводу Что
в качастве варианта: организовать тунель. то есть какой-то скрипт на чем-то написанный, которому в качестве параметра передается адрес https сайта, а он возвращает содержимое страницы из своего скрипта обращаешься к тому, а он тебе отдает содержимое. Посоветовали мне https проще открывать из перла..
Во а вот как это реализовать что то я недогоняю, в perle я ваще не шарю.
Может будут какие нить идеи или сталкивался уже кто с этим. Спасибо

   
 
 автор: cheops   (04.05.2005 в 21:54)   письмо автору
 
   для: sata   (03.05.2005 в 21:22)
 

Бубнящий под нос программист/админ/технарь находка для шпионов и хакеров :))) Такго узнать можно, особенно если подготовленный человек спрашивает. Я бы на месте админа попросил бы входные-выходные данные, скрипт и сказал бы "Разберёмся". Зато может вы не только себе поможете, но и всем хостящимся на их сервере :)

   
 
 автор: sata   (03.05.2005 в 21:22)   письмо автору
 
   для: cheops   (03.05.2005 в 19:14)
 

Поговорил по телефону с тех поддержкой чуть удар не хватил (меня) сперва с одним админом говорил видать то ли прошаристый а мож нет всё подтвердил и сказал заяву накатать типа согласны на перенос сайта на новый сервер, но не суть в этом. Звоню значит попозже там уже другой админ отвечает видать смена пришла тот давай сначала разбираться чё за фигня, пришёл значит к выводу что на сервере всё зашибись и это скрипт глючит я ему начинаю втирать что сам он глючит и скрипт работает, он начал копаться глубже в натуре скрипт вроде глючить не должен и докопался до ошибки (кстати скрипт находится здесь можете посмотреть http://www.autolegra.ru/1.php ) что типа файла удалённого такого нет, я говорю как так был же посмотрел в натуре есть файл дальше копаться начал чё то бубнить начал про то что типа возможно какая то фигня у этих на сервере что файл не открывается возможно ли такое, а то мне с ними завтра базарить а я уже даже и незнаю чё говорить. Короче всё свелось к тому что возможно всё таки это у них https в пхп ненастроен и что счас он ничего нескажет потому что незнает что сказать.
Сорри за такой конспект чё то поговорить пробрало :)

   

Сообщения:  [1-10]   [11-12] 

Форум разработан IT-студией SoftTime
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования