Алгоритм "Колибри"

18.10.2013

Билл Славски — директор по SEO в Go Fish Digital. Начал заниматься интернет-маркетингом и продвижением сайтов в 1996 году, проводя консультации по оптимизации веб-ресурсов, юзабилити и повышению конверсии. Имеет большой опыт в создании SEO-стратегий, увеличении трафика целевой аудитории на сайт и переходов из поиска по ключевым словам. Работал над продвижением как некоммерческих ресурсов, так и сайтов крупных корпораций, образовательных, e-commerce и b2b ресурсов, а также сайтов компаний, предлагающих профессиональные услуги и товары. Билл находит патенты на нововведения поисковых систем и пишет статьи о них, а также на другие темы, связанные с поисковой оптимизацией и интернет-маркетингом, в блоге www.seobythesea.com.

Google во время празднования 15-летия компании в гараже, в котором были заложены основы предприятия, представил миру новый алгоритм под названием Hummingbird — “Колибри”. Похоже, Google не заменил предыдущие алгоритмы, такие как PageRank и многие другие, которые он использовал для сортировки страниц. Во время анонса нового алгоритма представители компании сообщили, что Google начал использовать Hummingbird несколько недель назад и что он охватывает 90 % всех поисковых запросов.

1.jpg

Схема работы нового алгоритма

Данный алгоритм направлен на расширение запроса или расширение подхода, который поможет лучше понять длинные естественные языковые запросы, которые используются в речи вместо коротких ключевых слов запроса, которые могут быть набраны в поисковой строке.

Например, запрос, в котором алгоритм может проявить свой потенциал, выглядит так: «Самое лучшее заведение, в котором можно попробовать пиццу по-чикагски». Google может использовать синоним и правила эквивалентного запроса в сочетании с анализом других слов, не отбрасывая их в самом запросе, чтобы понять контекст термина запроса и возможную замену для него, чтобы перефразировать или поменять термины поиска и показать лучшие результаты.

Google может проанализировать запрос «Самое лучшее заведение, в котором можно попробовать пиццу по-чикагски» и понять, что пользователь ищет результаты, в которых предпочтительнее использовать слово “ресторан” вместо “заведение”.

Слово “ресторан” вместо “заведение” может рассматриваться как возможный синоним или эквивалент на основе правил замены, сфокусированных на сочетаемых условиях, которые могут появиться в результатах запроса при поиске данных условий или на сочетаемых терминах при сеансах запроса.

Анализ Google различных объектов поиска, таких как связь между запросами, может быть в некоторых случаях более подходящим для пользователя. В данном случае результаты поиска основываются на таком факторе, как длительность нахождения на странице, когда пользователь выбирает ее из списка результатов поиска.

2.jpg

Механизм анализа поисковых запросов

На этой неделе Google опубликовал патент, который основывается на трех патентах, где описывается процесс, который очень сильно напоминает алгоритм Hummingbird:

"Опознание синонимов на базе сочетаемых терминов"

Автор: Абхит А. Махабал, Такахиро Накаджима, Закари А. Гарретт, Кенджи Иноэ

Владелец: Google

Патент США номер 8.538.984

Выдан: 2013.09.17

Запатентован: 2012.04.03

Реферат: методы, системы и оборудование, включая компьютерные программы, закодированы на запоминающем средстве ЭВМ для:

  • Идентификации определенного термина запроса исходного поискового запроса;
  • Идентификации подходящего синонима для определенного термина запроса в контексте с другим несмежным термином запроса исходного поискового запроса, который не является смежным с определенным термином запроса в исходном поисковом запросе;
  • Доступа к хранимым данным, который указывает на пару терминов, включающих конкретный термин запроса и подходящий синоним конкретного термина запроса, соответствующего уровню достоверности для несмежного термина запроса;
  • Определения того, что в хранимых данных уровень достоверности несмежного термина запроса соответствует параметрам;
  • Определения пересмотра исходного поискового запроса для включения подходящего синонима конкретного термина запроса, основанного на определении, что уровень достоверности несмежного термина запроса соответствует параметрам.

В патенте говорится, что мера сочетаемости используется для оценки подходящих терминологических/синонимических пар, основанных на том, как часто эти термины (сложные слова или фразы) появляются вместе или в похожих запросах пользователя (например, в последовательных запросах в сеансе запроса) либо, как правило, показываются вместе в похожих результатах запроса.

Google может рассмотреть ряд синонимов из базы синонимичных данных, чтобы выяснить, насколько хорошо они вписываются в контекст всего запроса. Например, слова car (машина) и auto (авто) часто рассматриваются как синонимы, особенно когда они могут появиться в запросах, таких как «car mechanic» (автослесарь) и «auto mechanic» (автомеханик), но они не будут являться синонимами в контексте запроса «railroad car» (железнодорожный вагон) и «railroad auto» (железнодорожное авто).

Маловероятно, что пользователь, ищущий «railroad car», хотел бы увидеть в списке запросов «railroad auto», не говоря уже о замене. В моей статье, опубликованной ранее, говорится о том, что в правилах замены запросов для синонимов могут быть созданы аналогичные правила, и те и другие могут быть использованы для создания синонимической и эквивалентной базы данных. Такая база может содержать данные о степени уверенности, что термины могут быть синонимами или эквивалентами, в основе которых лежат сочетаемые данные, вне зависимости от того, могут ли они быть синонимами или эквивалентами, основанными на правилах с участием других терминов, которые могут быть частью этого же запроса.

3.jpg

Механизм оценки контекста поискового запроса

Почему Hummingbird?

Патент, поданный Google на рассмотрение в 2005 году, имеет много общего с нынешним патентом. Эксперт патентного ведомства описал его как родственный с патентом “Определение синонимов термина запроса в контексте запроса”. Таким образом, основные идеи расширения запроса существовали в Google в течение многих лет.

Несмотря на то, что пользователи вводят ключевые слова в поисковую строку, похоже, что при голосовом запросе они забывают о ключевых фразах. При вводе запроса в поисковую строку он будет выглядеть так: «ресторан с пиццей по-чикагски», в то время как при голосовом запросе данная фраза будет звучать так: «Самое лучшее заведение, в котором можно попробовать пиццу по-чикагски».

В патенте представлен ряд дополнительных примеров того, как слова в запросе могут быть использованы контекстуально для лучшего понимания других слов, которые могут быть заменены в данном запросе синонимами или эквивалентами.

Мнение эксперта

Андрей Канунников, руководитель отдела маркетинга сервиса Rookee:

“Изменения в технологиях взаимодействия IT-систем с человеком удивительны. Давайте посмотрим чуть шире: Alpha от Wolfram, Siri от Apple, Watson от IBM, Hummingbird от Google, Google Glass, а ещё есть Google Car, наработки Boston Dynamics и т.д. Очевиден технологический вектор на приобретение машинами способности действовать через понимание и принятие решений на основе смысловой составляющей человеческих коммуникаций. И Google здесь явно метит в лидеры с его весьма любопытным трио. Интернет для Google — не только информационная монополия и деньги, но ещё и колоссальная лаборатория. Hummingbird — это шаг навстречу смыслу. Статистикой эта проблема не решается, мы это хорошо поняли, работая над проектом babkee.ru — системой мониторинга социальных сетей, когда перед нами возникла проблема оценки тональности сообщений. Именно поэтому я активно придерживался идеи использования семантических деревьев. С точки зрения SEO, на мой взгляд, всё весьма неплохо. Расширение вариаций поисковых запросов при должном подходе со стороны SEO-компаний позволит снизить градус конкуренции по запросам, породит новые запросные ниши с невысокими ценами, существенно разнообразит тексты ссылок, увеличив релевантность донорно-акцепторных связей через обыгрывание смыслов, позволит точнее выявлять потребность человека в отношении объекта поиска, его дополнительных свойств и готовности совершить действия. Позволит предлагать более релевантные поисковые результаты. Ну и контекстные объявления”.

Вполне возможно, что алгоритм Hummingbird работает несколько иначе, чем описано в формуле изобретения и/или описании патента, но они очень похожи. Это ли патент Google Hummingbird? Как вы думаете? 

Комментарии (0)Просмотров (376)