Это совершенно новая версия поисковой системы Яндекс, включающая в себя более 2000 улучшений. Основу её функционала составляют две выдающиеся технологии, привязанные к машинному обучению: глубокие нейросети-трансформеры, тщательно проработанные алгоритмы YATI и YALM (Yet another Language Model), характерные для Яндекса. По факту, это соединение разнообразных функций, включая мгновенные ответы, видео-поиск, анализ отзывов, визуальный поиск, повышение уровня безопасности и прочие инновации. Стоит рассмотреть основные особенности Y1 подробнее.
Что нового в выдаче Яндекса
Стоит подробнее рассмотреть те новшества, которые появились в поисковой выдаче Яндекса после введения алгоритма Y1. Изменений достаточно много, и они затронут всех веб-мастеров. Именно поэтому о них нужно знать.
Быстрые ответы и дополнительные вопросы
Это первое, на что стоит обратить внимание. Акцент нейронной сети YALM сделан на языковой модели, способной генерировать запросы и вопросы, схожие с пользовательскими. Если воспользоваться поиском в Яндексе с запросом «что такое нейросеть Midjourney», она предложит максимально близкие по смыслу вопросы, такие как «что такое нейросеть Midjourney простыми словами» или «что такое Midjourney» и прочие.
Таким образом, система автоматически формирует обширный список запросов, подобранных из различных источников. Задача по генерации этих запросов возлагается на нейронную сеть. Экспериментировать с новыми функциями можно в сервисе «Balaboba». Многие уже приступили к использованию его текстов для создания дорвеев.
Важно отметить, что расширенные ответы появились еще в 2011 году, но в настоящее время их количество резко возрастает. Яндекс продолжает тренд привлечения трафика к себе.
Модель нейронных сетей
Нейросети, а также всевозможные ИИ продолжают распространение практически во все сферы жизни и деятельности человека: диагностика заболеваний, распознавание речи и лиц, управление транспортным средством и так далее. Поэтому нет ничего удивительного в том, что Яндекс внедрил ИИ в свой поиск. На этом этапе искусственный интеллект применяется для распознавания того, что изображено на картинке или видео, считывания информации о том, какой текст произносит спикер в видеоролике, а также распознавания того, куда ведут ссылки, которые вы показываете в видео.
Блокировки за накрутку поведенческих факторов (ПФ)
Корректнее называть этот процесс не блокировкой, а пессимизацией, поскольку сайты остаются в индексе, но попадают в выдачу крайне редко. На самом деле достаточно много сайтов накручивают ПФ, но система Яндекса не умеет моментально реагировать на это. Тем не менее, за последний год было забанено около 35 веб-ресурсов только в тематике создания и продвижения сайтов. А в других тематиках ситуация ещё печальнее. Интересно, что по всем признакам портал Яндекс Услуги тоже вовсю накручивает ПФ. Но «это – другое».
Машинное обучение везде
Практически все современные поисковики и крупные ресурсы используют машинное обучение: например, Google, Facebook, IBM и так далее. Понятно, что Яндекс также внедрил в свою систему такую возможность. Для этого потребовалось загрузить гигантские объёмы данных. Но результат в долгосрочной перспективе себя оправдает. На данный момент с машинным обучением работают такие сервисы, как Я.Погода, Я.Пробки, Алиса, рекомендательные системы Яндекса, система фильтрации отзывов и так далее. В дальнейшем планируется внедрение МО повсеместно.
Усовершенствованный антиспам
Система антиспама, используемая в Яндексе, также была существенно переработана для того, чтобы можно было повысить её эффективность. К антиспаму относятся: система фильтрации и модерации отзывов, система фильтрации мошеннических сайтов (тех, которые замаскированы под банки и платёжные системы), система рейтинга отзывов о сайте в адресной строке. Не сказать, чтобы алгоритмы антиспама стали идеальными, но прогресс наметился. Вероятно, в последующих обновлениях систему доведут до ума.
Улучшенные сниппеты быстрых ответов
Быстрые ответы, или сниппеты, в Яндексе — это особые выделенные блоки информации, которые показываются в верхней части страницы с результатами поиска. Они предназначены для того, чтобы непосредственно отвечать на конкретные запросы пользователей без необходимости перехода на веб-сайт.
Вот некоторые характеристики сниппетов:
- Разнообразие типов. Быстрые ответы могут включать в себя различные типы информации, такие как текстовые описания, таблицы, графику, калькуляторы, карты и многое другое.
- Источники данных. Информация для быстрых ответов берется из разных источников, включая официальные сайты, справочники, базы данных и другие надежные источники.
- Критерии отбора. Яндекс использует различные алгоритмы и критерии, чтобы определить, какой контент подходит для быстрого ответа. Это включает в себя структурированность данных, точность информации и ее актуальность.
- Улучшенный пользовательский опыт. Быстрые ответы позволяют пользователям быстро получать нужную информацию прямо из результатов поиска, что делает процесс поиска более эффективным и удобным.
- Роль в SEO. Для владельцев веб-сайтов, появление их контента в качестве быстрого ответа может привлечь дополнительное внимание к их ресурсу и повысить его авторитет.
- Динамическое обновление. Быстрые ответы могут изменяться в зависимости от конкретных запросов и актуальности данных.
- Поиск по изображениям и видео. Быстрые ответы также могут включать в себя информацию из разделов по изображениям и видео, предоставляя пользователю более разнообразные результаты.
Быстрые ответы в Яндексе играют важную роль в улучшении пользовательского опыта и ускорении процесса получения нужной информации из результатов поиска.
Что такое YALM
YALM (Yet Another Language Model) – это своеобразная нейросеть, некий алгоритм от Яндекса, который способен создать определённый текст по параметрам, которые были предоставлены на входе. На данный момент возможно такое его применение: создание подзаголовков для объектных ответов, ранжирование сниппетов для быстрых ответов, генерация ответов для Алисы.
YALM может стать хорошей базой для создания отечественного аналога нейросети ChatGPT. Компания Яндекс уже рассматривает эту возможность и, вероятнее всего, в скором времени будет создана соответствующая команда.
Языковые модели в поиске
Языковые модели находят свое применение в поисковых системах уже на протяжении десятилетий. Они не только используются для расчета текстовой релевантности, но и для многих других задач.
Рассматриваются следующие аспекты:
- Применение униграммной языковой модели для анализа документа с учетом частоты встречаемости слова. Различные вероятности того, что заголовок правильно сформулирован, текст написан человеком, а не создан автоматически, а также соответствует ли он обвязке и верхней части.
- Языковая модель с «окном из N слов», учитывающая удаленность от начала страницы. Например, взяв окно из 20 слов, мы анализируем текст и оцениваем, насколько эти фрагменты соответствуют языковой модели. При этом вводится весовая функция с убыванием от начала страницы. Чем дальше текст от начала, тем меньшую роль он играет.
- Классификация документов и сайтов по тематикам. Это позволяет определить, какая тематика соответствует словам и терминам, встречающимся на странице, и подробно классифицировать документы.
- Переход от униграммных моделей к более сложным должен был повысить качество информационного поиска, хотя это не всегда очевидно.
В целом, поисковые системы нацелены на улучшение и развитие более точных и грамотных языковых моделей, которые могут быть применены в поиске.