Определение даты публикации статьи

Чтобы быть в курсе последних новостей, происходящих в таджикском IT-мире, я подписался на обновления ряда сайтов, которые подходят по тематике. К кому-то подписался по старой и доброй rss-ленте, а к кому-то и через новомодный твиттер. В том числе подписался на обновления сайтов мобильных компаний, чтобы узнавать об акциях и новых тарифах как можно быстрее. Какого же было моё удивление, когда после очередного обновления rss-лент, лента сайта beeline.tj показала свежую новость, но которая была датирована уже устаревшей на 3 недели датой. Глюки rss – подумал я, или администратор сайта ошибся при размещении новости. В вариант публикации новостей задним числом мне не верилось. Через какое-то время ситуация повторилась, опять пришло уведомление об изменении цен, но задним числом. Хм, уже стало интересно, но как доказать, что той новости действительно не было на сайте в заявленную дату? Кто в наше время на слово то поверит. Хорошенько подумав над этим вопросом, я пришёл к выводу, что прямых доказательств найти нельзя, но вот косвенные и в некоторым смысле авторитетные имеются. Обратимся к поисковику гугл!

Итак, новость, которая на сайте датирована 2-ым мая. Появилась у в rss-ленте только 21 мая! Посмотрим, что скажет гугл, если дать поиск по этой новости.

А гугл ровным счётом ничего не покажет! Он ещё не проиндексировал эту страницу.

Дальше больше, гугл по каким-то причинам не индексировал сайт Билайна в последние дни и это нам на руку! Но не будем торопиться.

Давайте посмотрим, на результаты поиска по новостям, которые были опубликованы после второго мая. Обратите внимание на выделенные красным даты – эти даты немного бледного цвета и показывают, когда статья была проиндексирована поисковиком:

Т.е. для 2-х новостей из 3-х мы можем утверждать, что они были добавлены на сайт точно в заявленные даты:
Итак, какие же вопросы возникают, после всего вышесказанного? Вопрос один и очень резонный — как новость, которая была опубликована якобы давно, до сих пор не попала в поисковой индекс?! А статьи, намного моложе указанной, уже находятся поисковым движком. Ответ на этот вопрос не может быть однозначным, ведь наличие или не наличие страницы в индексе крупного поисковика не может служить безусловным доказательством. Но, несмотря на это, таким образом нередко можно узнавать реальную дату публикации материалов с определённой долей вероятности.

На этом можно было бы и завершить статью, но благодаря тому, что гугл оперативно не проиндексировал последние изменения на сайте Билайна в его кеше до сих пор лежит снимок очень интересной страницы за 19 мая, на котором никакой новости за 2 мая нет!

Скачать кешированную страницу

Итог таков – определить реальную дату публикации статьи практически невозможно, а вот доказать существование статьи в заданный период времени вполне, но опять же при удачном стечении обстоятельств. В данном случае таким обстоятельством явился старый кеш поисковика. Но когда кеш гугла обновится, а он непременно обновится, то доказать что-либо будет проблематично.


Добавить комментарий

Ваш e-mail не будет опубликован.