Яндекс Палех — креативный подход к делу

На открытой СЕО-конференции «Оптимизация», А.Садовским была затронута тема креативных методологий ранжирования Яндекса. Принцип функционирования нового алгоритма «Палех» был подробно расписан главой поисковых систем сети. 

Яндекс Палех

Наивно полагать, что исключительно отсутствие клика является основной характеристикой соответствия веб-документа. Утверждение, что отмеченные юзером веб-документы — это утвердительные примеры, а не отмеченные – негативные, в корню неверно. Тот факт, что клик отсутствует – не показатель отсутствия релевантности. Справедливее тот факт, что наличие клика не гарантирует то, что веб-документ будет соответствовать запросу юзера. Для этого можно рассмотреть простейший пример:

Яндекс Палех

Загвоздка заключается в том, что пользователь понимал под РНО – работу над ошибками.
По словам Александра, благодаря появлению алгоритма система научилась обнаруживать точные примеры. По версии Yandex утвердительные примеры – это те, модель которых предвещает, что юзер задержится на странице надолго. Сегодня существует множество метрик, свидетельствующих об удовлетворенности юзерского запроса. Также в Палехе была заменена стратегия подбора негативных примеров. Чтобы максимально достичь основоположной цели – семантической близости – оптимальными негативными примерами считаются документы, изначально нерелевантные запросу пользователя, однако которые способствуют более понятному разъяснению слов для нейросети.

К таким документам относят: 

• Веб-документы, попадающие в случайном порядке.
• Hard negative mining.
• Веб-файлы с подсоединением ключевых слов.

Стержневой основой Палеха является нейронная сеть. При выдаче информационного запроса, если производить сравнение результативности нейронной сети и традиционного текстового фактора, сформированного на совпадении текста и запрашиваемых слов, БМ25 для расплывчатых запросов, то можно наблюдать подобные результаты:

Алгоритм Яндекс Палех

Также рассмотрим, что получается, при выдаче запросов коммерческого предназначения:

Алгоритм Яндекс Палех

Алгоритм Яндекс Палех

Для «устаревшего» BM25 обычная переформулирование юзерского запроса оборачивается в ЧП — выдача 0-факторов на соответствующих заголовках. В то время как Палеху такое под силу – алгоритм показывает стабильность к изменениям в формулировке.

Александр акцентировал внимание на том, что задача стоит не в том, чтобы обогнать BM25. Разработчики Палеха стремились к максимальному улучшению, на фоне массы работающих моделей, методологий и факторов ранжирования. Тем более, что новый алгоритм применим к запросам любого типа, заданного на языке любого континента в любом регионе на любую тематику (исключение — цитаты).

В последнее время veb-мастера могли наблюдать некоторые изменения траффика и по словам Садовского – это прямая работа алгоритма. Ведь результативность Палеха – pFound1+1,6%.