| Зачем Google нужен вики, а Microsoft — игры? |
В связи с выходом в свет bing’а, тема поисковых движков стала гораздо живее обсуждаться в программистском сообществе. Я тоже решил ее коснуться, поскольку в связи с темой аспера это мне близко и я могу по-человечески объяснить некоторые вещи.
Я не буду говорить о технологической стороне поиска (federated search и т.д.), а остановлюсь на алгоритмической.
Вероятно, все обратили внимание, что в поиске у гугла появилась вики. С ее помощью можно поднимать понравившийся результат поиска или, наоборот, удалять из списка. Недавно bing запустил игру, которая призвана собрать информацию о соответствии запросов ответам.
|
| Они хотят повысить релевантность (корректность выдачи) |
Догадливые коллеги догадались, что все это затеяно не просто так, а с великой и светлой целью — повысить релевантность поиска. Каков идеально релевантный поиск? Это когда 1000 ваших копий перечитывают весь интернет и выбирают для вас 10 самых удачных страниц по запросу «сиськи Анны Семенович». |
| Для этого им нужно «обучить» машину думать как эксперта по поиску. А для этого им нужны обучающие данные (мы). |
Каково приближение идеального поиска? Это когда 1000 людей, которые являются «идеальной выборкой человечества», перечитывают весь интернет и выбирают по 10 самых удачных страниц на каждый запрос.
Что такое идеальная выборка человечества? Это выборка, в которой доли людей по любому признаку совпадают с долями в человечестве в целом (столько же геев, столько же евреев, столько же айтишников и т.д.)
Как найти экспертов? Очень просто — нужно предложить людям простой способ оставлять свое мнение о поиске. Для этого и нужны вики и игры.
Как выбрать среди экспертов самых адекватных? Нужно выбрать экспертов, мнения которых минимально отличаются от мнений всех остальных экспертов.
Итак, мы получили группу экспертов, мнению которых можно доверять.
Что дальше делать с их мнением? В игру вступают алгоритмы классификации и машинного обучения. О них я поведаю чуть позже.
|
| Результат? Смерть черного и серого SEO. |
Что же это значит для нас? Из поисковых результатов наконец-то выпадут спам и SEO-шные сайты. А останется только реальный контент. По-моему это круто. |
| И махинации тут практически невозможны. |
А что может помешать махинациям? О, ответ на этот вопрос самые внимательные читатели уже нашли. Допустим, злобные сеошники решат сделать ботов, которые будут в гугло-вики проставлять плюсы на их сайте. Попадут они в категорию экспертов? Нет! Потому что они будут отличаться от других людей (см. выше). Значит придется делать ботов, которые как-то притворяются другими людьми и отмечают в вики свой сайт только в 1% от остальных действий. Тогда, возможно, они смогут попасть в результаты. Однако их также легко будет отсеять по активности на почте и т.д. В итоге, по сути единственная адекватная возможность для CEO-шника — это заплатить реальным пользователям чтобы они поставили «+». А теперь вопрос, как вы думаете, сколько это будет стоить? =) |
| А может все-таки можно похимичить? Неа =) |
А что если все-таки, а?
Дело в том, что компании интересует не сырое мнение экспертов (по запросу «титьки Анны Семенович» лидирует сайт http://machovik.ru ), это просто платформа для обучения машины классификации релевантен/нерелевантен. А значит что:
а) не нужна большая группа экспертов, достаточно данных, собранных например внутри компании Microsoft (ну по темам, в которых сотрудники компании адекватны)
б) не нужна постоянная подпитка информацией, на долго хватит данных, собранных за несколько месяцев
в) не нужна информация по всем запросам, т.к. машина сама научится работать как эти люди.
|
Итоги: - SEO-шники идут лесом - контент дорожает - ссылки и реклама в поисковиках серьезно дорожает |
Итак, что же нас ожидает после ввода в строй такой супер-машины. Индустрия оптимизации сайтов, когда без реального контента можно было за счет ссылок, жирных шрифтов и бла-бла-бла продвинуть сайт в поиске практически изживет себя. На ее смену придет индустрия, когда на сайте появляется реальный контент и сайт становится реально полезен. Для рядовых пользователей интернета это очень круто: меньше времени будут тратить на поиск. Для владельцев сайтов — это существенное удорожание рекламы и раскрутки. Куда утекут деньги от SEO? Фирмы-то останутся, надо же еще племяннику директора порш кайен покупать. Очевидно что деньги начнут утекать в рекламу, и прежде всего в контекстную. Я думаю что цены на показ баннеров и ссылок могут легко подняться в 2 раза. А купленные слова легко поднимутся в цене раз в 5. Другой способ оптимизации — накачка реально полезного контента. Скорее всего существенно подорожает содержимое профессиональных блогов. Скорее всего его будут покупать за денежку. |