|
|
|
| Хочу както получить хэш сумму удаленной страницы, чтобы проверить ее обновление. Логичен ли подход?
Т.е. имеется страница на удаленном сервере. catalog.php?id=1234
данные на странице могут периодически меняться. Как это проверить? | |
|
|
|
|
|
|
|
для: Ильдар
(08.06.2011 в 00:37)
| | Только полностью закачивать, или если удаленная страница ваша, передавать текущую хэш-сумму через собственный HTTP-заголовок, начинающийся с X-. В этом случае можно отправить запрос методом HEAD, получить заголовки, проанализировать и получить хэш сумму без загрузки самой страницы. | |
|
|
|
|
|
|
|
для: cheops
(08.06.2011 в 08:57)
| | нет. Это не мой сервак. Мне нужно получить сумму со стороннего сайта, чтобы проверить ее на обновленную информацию, а потом грузиить ее. | |
|
|
|
|
|
|
|
для: Ильдар
(08.06.2011 в 16:09)
| | Тогда придется загружать файл полностью, иного выхода нет. | |
|
|
|
|
|
|
|
для: cheops
(08.06.2011 в 17:52)
| | может тогда лучше по content-length счиатать? В 95% случаях изменение будет явным? | |
|
|
|
|
|
|
|
для: Ильдар
(08.06.2011 в 18:59)
| | только вот проблема. Не вижу я в заголовках этого сервера таких данных ( | |
|
|
|
|
|
|
|
для: Ильдар
(08.06.2011 в 20:49)
| | А что за файл грузится? | |
|
|
|
|
|
|
|
для: cheops
(09.06.2011 в 09:48)
| | обычная текстовая станица. Это интернет магазин. На странице описание товара | |
|
|
|
|
|
|
|
для: Ильдар
(09.06.2011 в 11:54)
| | В этом случае допускается не указывать размер.
PS Эта страница очень большая? Почему бы её полностью не загрузить? | |
|
|
|
|
|
|
|
для: cheops
(09.06.2011 в 12:55)
| | каждый раз не хочется грузить страницу. Экономия на траффике. Я хочу парсить интернет магазин. Но чтобы в день по 10-20 раз не грузить страницу со стороннего сайта, хочу хранить в базе. И только каждые 2 дня грузить страницу.
Это в разы увеличит загрузку страницы пользователя. Потери на парсинг будут идти 2-5 секунд, а то и больше - я считаю это долго | |
|
|
|