
Законы Зипфа
Сегодня поведем речь о такой штуке, как законы Зипфа. (Иногда их еще называют «законы Ципфа». Я не знаю, какой из этих вариантов более правильный. Потому обозвал дяденьку с фамилией «Zipf» Зипфом).
Для начала нужно отметить, что вся эта писанина про умных дядечек – возникла после очевидной неудачи вот с этой байдой.
Могу сказать, что по той байде – я наблюдал все ту же безрадостную картину: страницы находятся, индексируются, и засовываются в дополнительный индекс.
И более того, если на такой вот «блог» ВНЕЗАПНО начать добавлять нормальные, человекообразные статьи, написанные только что – они ТОЖЕ будут засунуты в сапплиментал.
И на этом – все закончится.
Никакого трафа, никаких посетителей, никакого эффекта.
То есть налицо картина Репина «Приплыли».
Исходя из этих практических наблюдений, становится ясно, что всякие там «синонимайзеры» и идиотские советы типа «как из одной статьи наладить тысячу» – дружным строем идут нахер.
Потому что получившееся на выходе говно – останется говном.
И даже если говно вышло очень качественным – это ровным счетом ничего не изменит.
Искалка просекает все это на раз.
И говно – заслуженно отправляется в положенный ему калоотстойник.
Как работает синонимайзер?
Он заменяет определенные слова их синонимами, которые употребляются достаточно редко.
Получившийся на выходе бред – по идее, должен бы считаться «уникальным текстом».
Но вот беда – он таковым не считается.
Вопрос: а почему?
А потому.
Заголовок – видно хорошо?
Вот.
Оказывается, довольно наивно думать, что корректная и правильная замена в тексте части слов на их синонимы сделает этот текст «уникальным» в глазах поисковой системы.
Еще более наивно считать текст «уникальным», если он – успешно прошел проверку каким-нибудь сервисом типа «копискайпа».
Все эти сервисы – ни разу не гарантия того, что искалка – ТОЖЕ воспримет полученный текст как «уникальный».
Да, прошло.
Да, написано «копий нет».
И да – кучно ушло в «сопли».
В глубокой древности прошлого века жил да был один дядечка.
Звали дядечку – Джордж Кингсли Зипф (George Kingsley Zipf).
Дядечка тот – работал в Гарварде.
Профессором.
(А Гарвард, дорогие друзья – это вам не мухосранский заборостроительный, куда любой дурак может попасть за взятку. Гарвард – это о-го-го).
Работал дядечка, работал, и доработался до того, что в 49 году вывел пару простых эмпирических законов, которые в дальнейшем – получили название «законы Зипфа».
В основу законов Зипфа легла не математика, а статистика.
Поскольку с интернетами в 49 году был явный напряг, то подтвердить дядечкины законы было не так-то просто.
Но с появлением интернетов теоретические выкладки нашли свое практическое подтверждение, и оказалось, что дядечка – обнаружил вполне себе работающие закономерности.
С тех пор пресловутые законы Зипфа – активно используются поисковыми системами для анализа текстов на сайтах.
Я не стану тут повторять тысячу раз написанное, и парить вам голову насчет всяких там «констант», «рангов частоты» и прочих интересных вещей.
Вместо этого – дам вам вот .
Курите на здоровье.
Если покурите вдумчиво, то вам станет понятно, сколь наивны любые попытки обмануть систему ранга гугла с помощью всяких там «синонимайзеров».
Также станет ясно, что для анализа «человекообразности текста» – поисковыми системами используются куда более сложные механизмы, чем тупой поиск копий текста в сети, и последующая сверка найденных копий с индексируемым текстом.
И потому любая «синонимизация» готового текста (даже самая продвинутая и умная) – обречена на провал.
Что и было блестяще подтверждено в случае с байдой, которую я затеял.
Поделись заметкой с друзьями:
Да, для синонимизированного текста , скорее всего
твои выводы верны. А как быть с текстом переведенным на другой язык. Через месяц гугл даст ответ ))
Судя по всему, статья навеяна последними размышлениями мастера Ласто.
Судя по всему, сюда не надо совать ссылки на свои говносплоги, по уши забитые копипастой.