Как формируются результаты
При том огромном объеме информации, который есть в интернете, найти нужные сведения без сортировки было бы практически невозможно. Чтобы пользователи за доли секунды получали актуальные и полезные результаты, инструменты ранжирования Google упорядочивают сотни миллиардов страниц и материалов в поисковом индексе.
Строка поиска с запросом "парикмахерская рядом"
Основные факторы, определяющие результат
Наши поисковые алгоритмы учитывают множество факторов, в том числе текст поискового запроса, релевантность и удобство найденных страниц, качество и достоверность источников информации, а также ваше местоположение и используемые настройки. Вес каждого фактора зависит от характера запроса. Например, дате публикации контента придается большее значение, когда вы ищете актуальные новости, и меньшее, если вас интересует определение из словаря.
Ниже приведены дополнительные сведения о ключевых факторах, от которых зависят результаты поиска.
Смысл вашего запроса

Чтобы подобрать для вас подходящие результаты, мы сначала должны понять смысл, заключенный в запросе. Для этого создаются языковые модели, позволяющие сопоставить относительно короткие запросы с наиболее полезным контентом.

Этот процесс включает разные этапы – от простого исправления орфографических ошибок до применения синонимических соответствий, позволяющих находить нужные ресурсы, даже если в них нет слов из поискового запроса. Так, например, пользователь может ввести в строке поиска "изменить яркость экрана ноутбука", а в инструкции производителя написано "регулировка яркости экрана ноутбука". Наш алгоритм понимает значение, которое выражают слова запроса, и предлагает подходящие результаты. Эта система разрабатывалась более пяти лет. Она позволяет существенно повысить качество результатов более чем по 30 % запросов на разных языках.

Запрос

Наши системы также пытаются понять, какой тип данных вас интересует. Если указать в запросе слова вроде "приготовить" или "картинки", поисковый алгоритм догадается, что вам больше всего подойдут рецепты или изображения. Если запрос сформулирован на французском, большая часть результатов будет на этом языке, чего вы, скорее всего, и хотели. Наши системы также понимают, что многие запросы связаны с местоположением. Поэтому при поиске блюда, например пиццы, в результатах показываются ближайшие рестораны со службой доставки.

Если вы используете популярные ключевые слова, наши системы понимают, что актуальные данные будут полезнее, чем устаревшие. Другими словами, если вы ищете результаты спортивных матчей или сведения о прибыли компании, то получите самые свежие данные.

Релевантность контента

Наши системы анализируют контент на наличие информации, которая может иметь отношение к вашему запросу.

О релевантности страницы в первую очередь говорит наличие на ней тех же ключевых слов, что и в поисковом запросе. Если они действительно есть, например в заголовках или основном тексте, значит страница с большей вероятностью соответствует введенному запросу.

Просмотр сайта сквозь лупу

Соответствие контента запросу определяется не только сравнением ключевых слов. Например, релевантность оценивается на основе обобщенных и анонимизированных данных о том, как пользователи взаимодействуют с результатами поиска. Мы преобразуем эти данные в сигналы, которые позволяют нашим алгоритмам машинного обучения лучше справляться с оценкой. К примеру, при поиске по запросу "собака" пользователя вряд ли заинтересует страница, на которой сотни раз написано искомое слово. Поэтому алгоритмы Google стремятся обнаружить не только ключевые слова, но и другой соответствующий запросу контент. В нашем примере это могут быть изображения собак, видео с их участием или даже список пород.

Обратите внимание, что при оценке релевантности наши системы учитывают только сигналы на основе измеримых объективных характеристик, к которым не относятся выраженные на странице взгляды, политические предпочтения и т. д.

Качество контента

Определив подходящие материалы, наши системы стараются расположить их в порядке убывания полезности. Для этого используются сигналы, позволяющие определять достоверную и авторитетную информацию по заданной теме.

Одним из таких сигналов является наличие ссылок на контент с других известных сайтов. Часто это хороший показатель достоверности информации. Чтобы научить наши системы ещё точнее определять качество информации, мы используем обобщенные данные оценки качества результатов в Google Поиске.

Анализ сайта с помощью алгоритма

Контент в интернете и информационная экосистема в целом непрерывно меняются, поэтому мы снова и снова оцениваем работу своих алгоритмов, чтобы поддерживать равновесие между релевантностью и надежностью информации и не терять ваше доверие.
Удобство просмотра веб-страниц

Наши системы также оценивают удобство просмотра контента. При прочих равных обстоятельствах более доступный контент может оказаться полезнее.

Например, наши системы оценивают удобство работы со страницей, в том числе оптимизацию для мобильных устройств. Также проверяется скорость загрузки контента, которая играет немаловажную роль для пользователей телефонов и планшетов.

Сайт с золотым значком

Контекст и настройки

Чтобы предоставлять пользователям наиболее подходящую и актуальную информацию, мы учитываем сведения об их местоположении, предыдущих запросах, настройках Google Поиска и другие данные.

Мы показываем результаты поиска, исходя из данных о стране и местоположении пользователя. Например, если житель Чикаго вводит запрос "футбол", ему в первую очередь будут показаны сведения об американском футболе и клубе "Чикаго Беарз". Если же запрос "футбол" исходит от пользователя из Москвы, на более высоких позициях окажутся результаты, связанные с обычным футболом и Российской премьер-лигой. Кроме того, при подборе наиболее подходящих результатов принимаются во внимание настройки Поиска, в частности язык и фильтры Безопасного поиска (этот инструмент позволяет исключать неприемлемые результаты).

Один сайт посвящен футболу, а другой – американскому футболу

Некоторые функции Поиска также дают возможность персонализировать результаты на основе данных о действиях пользователя в аккаунте Google. Например, по запросу "мероприятия рядом" могут быть показаны те мероприятия, которые относятся к потенциально интересным вам категориям.

При этом наши алгоритмы не определяют расу пользователя, его религию, принадлежность к политической партии и прочие признаки, раскрытие которых нежелательно.

Чтобы указать, какие сведения из вашей истории поиска мы можем использовать и какие данные должны сохраняться в вашем аккаунте Google, перейдите на страницу myaccount.google.com. Если вы хотите отказаться от персонализации результатов с учетом действий в аккаунте, отключите настройку "История приложений и веб-поиска".

Чтобы скрывать результаты с откровенными сценами насилия или неприятными изображениями, в настройках можно задать и другие параметры для контента, например "Безопасный поиск".