Как искать в кэше яндекса и гугла
Именно с таким вопросом сюда регулярно ломятся различные граждане. Где-то здесь я неосторожно брякнул про поиски в кэше (ссылку на туда искать откровенно ломает), и теперь, значит – подай кэш и все тут.
Ну, коль скоро граждане ищут информацию про то, как искать сайты в кэше поисковых систем – чего бы не попробовать помочь?
Допустим, есть некий сайт, который вам до зарезу нужен. И вот в какой-то момент он просто перестал открываться. А информация вам нужна. Что делать в такой ситуации?
Ответ один – попробовать поковыряться в кэше яндекса и гугла. Проблема в том, что искомая информация – далеко не всегда может быть доступна.
Но обо всем по порядку.
Возьмем конкретный пример.
В незапамятные времена, когда пресловутое «бомжедвижение» было шибко популярно, был такой персонаж – ижевский бомж. Как и положено «бомжу», сей персонаж вел блог по адресу homelessinizhevsk.blogspot.com.
Если вы сунетесь туда сейчас – обнаружите вывеску о том, что блог удален. Давайте попробуем восстановить информацию блога, пока это возможно.
Самый простой и очевидный способ – обратиться к кешу яндекса. Берем адрес бомжацкого блога, копируем его в запросную дырку яши, смотрим.
Вывалилась ссылка на блог. «Квартира в Ижевске» и все такое прочее.
Ссылку жать не надо.
Надо нажать кнопочку «копия» под ссылкой.
Яша послушно забросит нас на сохраненную копию морды бомжеблога.
Проблема тут одна: если вы попробуете сходить по какой-нибудь ссылке на той копии – вас опять выбросит на вывеску об удаленном блоге.
А вам нужен, к примеру, архив блога за декабрь месяц 2007 года.
Чтобы получить копию этого архива – копируем адрес этого архива с морды: http://homelessinizhevsk.blogspot.com/2007_12_01_archive.html,
снова суем его в поисковую строку яндекса и снова жмем кнопку «копия».
Получаем копию декабрьского архива блога ижевского бомжа:

Если интересует какая-то конкретная статья (или фраза) в удаленном блоге, можно попробовать воспользоваться вот такой конструкцией:
интересующая_фраза “адрес сайта”.
Допустим, интересует заметка про распространение флэш-игр.
Пишем в яндексе:
Распространение флеш-игр "homelessinizhevsk.blogspot.com"
Получаем ссылку на заметку, затем – жмем кнопку «копия»:

Примерно то же самое можно проделывать и с кэшем гугла. Но там все на порядок проще. Например, тот же декабрьский архив можно получить, просто вбив в поисковую строку команду:
cache:homelessinizhevsk.blogspot.com/2007_12_01_archive.html
И перед вами послушно возникнет архив.
Все это здорово и прекрасно, конечно. Однако во всем этом есть одно серьезное «но». Все эти фокусы с извлеканием удаленных сайтов из кэша работают только до тех пор, пока поисковик не почистит выдачу и собственно кэш. Гугл делает это значительно быстрее, чем яндекс. И если речь зашла о просмотре кэша поисковой системы – первым делом надо лезть именно в яшу. То есть в данном случае природная тупость и тормознутость яшеньки играет нам на руку: гугл уже все подчистил, а яша до этого сайта еще даже не доковылял.
Если говорить о вышеуказанном блоге, то копию его морды, к примеру, вы в кэше гугла уже не найдете. Гугл ее уже уничтожил. А в яндексе – копия морды все еще висит.
Что делать, если выдача и кэш поисковых систем уже пусты?
Тогда придется лезть в архивы: http://www.archive.org/web/web.php
Если сильно повезет – можно отыскать копию нужного сайта. Например, последняя копия вышеуказанного блога там датирована июлем текущего года:

Проблема тут только одна – копии сайтов в этом архиве далеко не всегда бывают полными. Но на безрыбье, как говорится…
P.S. Вся эта заметка – является наглядным подтверждением распространенного тезиса: все, что попало в Интернет – остается там навсегда. Так что дважды подумайте, что вы вывешиваете в этих ваших интернетах. А то мало ли…
Вот тут есть одна неплохая контора, в которой водятся деньги.А вот здесь - вы можете совершенно бесплатно создать свой сайт.
Поделись заметкой с друзьями:
А вы не могли бы посоветовать, что делать если статьи публикуются в RSS до ката? Как залезть под кат?
Никак. Всю статью можно увидеть только на сайте.