Оглавление
Первопроходцем стала поисковая система Archie, разработанная в 1990 году. Ее простой алгоритм позволял искать файлы на публичных серверах и понимать их точное название. Но организовывать и сохранять содержимое файла в своей памяти Archie не умел — это процесс называется индексированием.
Индексация дает возможность упорядочить и структурировать информацию о страницах сайта в базе поисковой системе, чтобы заново не обходить интернет, а обратиться к текущей сохраненной копии страниц при поиске данных.
В 1993 году появился поисковик JumpStation, который индексировал заголовок внутри файла и URL, но не полный текст страниц. Основатель этого поисковика Джон Хендерсон впервые разработал понятия «поисковый робот», «поисковый индекс»» и «поисковый запрос». В 1994 году технология была доработана и новая система поиска WebCrawler уже смогла индексировать полный текст документов.
Революция в поиске — появление в 1998 году Google на основе поисковой системы BackRub и алгоритма PageRank. Алгоритм анализировал не только внутреннее содержание страницы, но и количество ссылок на нее. С этого момента и по сей день Google вне конкуренции: около 90% всего населения Земли использует его как основной поисковик. Доли остальных: Bing 3%, Яндекс 1,8%, Yahoo 1,22, Baidu 1%.
Поисковые системы не менялись концептуально уже около 20 лет, и сегодня мы снова становимся свидетелями революционных изменений. В ответ на запрос поисковик не просто выдает список документов, а пытается сформулировать готовый текстовый ответ.
Первый шаг в разработке этого направления снова сделал Google: в 2001 году он начал использовать простую версию машинного обучения для корректировки орфографии в поисковых запросах. В 2015-м компания сделала искусственный интеллект частью полноценного поискового алгоритма под названием RankBrain.
RankBrain считается первым значимым искусственным интеллектом в поисковике, потому что не просто обрабатывает заданные правила, как это делают традиционные алгоритмы, а использует машинное обучение для адаптации к новым ситуациям.
30 ноября 2022 года вышел ChatGPT от Open.ai и произвел фурор в мире поиска и работы с текстовой информацией. Он положил начало гонке поисковиков за возможность вести более натуральные разговоры, как человек.
Через два месяца корпорация Microsoft на закрытой презентации представила обновленную версию поисковика Bing на основе ИИ, где пользователь может общаться с поиском.
Google создал конкурента под названием Bard, но на данном этапе это скорее копия функционала Bing без особых инноваций.
Яндекс тоже последовал за трендом и разработал генеративную модель YandexGPT, которую встроил в поиск и свои проекты. Например, в «Яндекс Практикум», где GPT подводит резюме урока, может прояснить непонятный термин или расшифровать нюансы кода, если вы учитесь на разработчика.
В результате в ответ на свой запрос пользователь может получить как привычную картину — список ссылок, так и сгенерированный ответ от нейросети. По такому пути следуют Bing и Google. Выглядит это так:
Вторая новая концепция — сделать поиск ассистентом. Для этого эксперимента Google создал проект bard.google.com, а Bing добавил отдельную вкладку в основной поиск, чтобы пользователь мог выбрать, чем ему пользоваться удобнее: классическим поиском или чат-ботом. Выглядит это так:
Разработчики идут дальше и встраивают ИИ в браузеры. Microsoft Edge имеет встроенный чат-бот Bing и режим сочинений. Инструмент называется Copilot. Пользователь может открыть любую страницу в этом же окне и попросить чат-бота найти информацию, пересказать ее или объединить. В режиме сочинения можно написать любой текст — от электронного письма и статьи для сайта до постов для соцсетей. Браузер Arc встроил поддержку ChatGPT и умный поиск через CTR+F и теперь ищет информацию не по точному совпадению, а по смыслу.
Искусственный интеллект меняет роль поисковых движков. Например, Forbes, желая нарастить число пользователей и их вовлеченность в поиск, выпустил свою генеративную поисковую платформу Adelaide. Она обучена на данных сайта за последние 12 месяцев и уже выглядит скорее как ассистент, нежели бездушная поисковая машина. Платформа выдает ответ на запрос в виде сгенерированного текста, близкого к речи человека. Возможно, в ближайшее время не только поисковые движки станут умными, но и внутренние поисковые системы смогут также конкурировать с гигантами.
Что могли делать пользователи через поиск до февраля 2023 года:
Что смогли делать пользователи через поиск после февраля 2023 года:
Скорость цифровизации жизни и потребления информации увеличивается. Но глобальные инновации, которые меняют рынок и задают тренды на десятилетия, такие как появление Google или телефонов Apple с полностью сенсорным экраном, происходят редко. На ближайшие несколько лет такая инновация уже родилась — это генеративная модель в виде ChatGPT. Ее изобретение сродни изобретению языка, на котором позже начали общаться и писать книги. Все, что появится в следующие пять лет, будет результатом усовершенствования генеративных моделей:
Доказать людям, что поиск в виде чат-бота удобнее классического, а готовые ответы лучше перехода по ссылкам — сложная задача и в силу природного консерватизма человечества, и потому, что имеет множество политических и этических аспектов.
Сегодня существует проблема с точностью выдаваемой на запрос информации, но она решится в ближайшие годы благодаря дальнейшей оптимизации алгоритмов. Это позволит сделать ответы чат-ботов максимально качественными.
Умный поиск выдает готовый ответ, сформулированный на основе информации из нескольких источников и тем самым забирает у человека ощущение контроля ситуации. Это не всегда нравится пользователю.
Компании вкладывают много денег, чтобы продавать свои товары через поисковые системы и ранжироваться как можно выше. Концепция ChatGPT, Google и Bing предполагает ограниченный показ поисковой выдачи, что идет вразрез с целями бизнеса и монетизации. Решение проблемы — в прозрачности модели продажи товара через сгенерированный ответ от нейросети.
В июне 2023 года Google уже тестировал модель продажи товаров через генеративную модель, но осенью товары стали реже появляться в этой выдачи. Причины пока что неизвестны.
Сопротивление новому поиску могут оказать медиа. Нейросеть может сформулировать ответ, основываясь на их оригинальных материалах, но не выдать на них ссылку или ссылка будет и вовсе не нужна, а значит, трафик на сайты медиа упадет.
Еще одна нерешенная проблема: как нейросети выдавать инфографику, ведь показывать ее без указания авторства не получится. Со временем нейросети сделают с веб-поиском то же, что интернет сделал с телефонными справочниками, но время в запасе у нас еще есть.
Google has two main indexing bots (actually there are more, but you will find the…
Стоимость контекстной рекламы в сфере финуслуг постоянно растет. Цена одного клика порой достигает 500 рублей.…
Содержание: Арбитраж трафика: определение и роль арбитражника Арбитраж трафика — это вид интернет-бизнеса, где…
Получить выгоду от пользовательских запросов на «вдохновляющие» фото и понять, почему даже при продвижении картинок…
What is Local SEO Local SEO is a promotion strategy aimed at optimizing a company's…
Домены с истекшим сроком регистрации играют ключевую роль в стратегии продвижения в интернете. Расскажем, что…