18 марта 2007 г. Автор: Михаил Дубицкий

Мэтт Каттс о технологиях поиска будущего


Недавно сайт Read/WriteWeb опубликовал интервью с Мэтом Каттс - руководителем отдела Google по борьбе со спамом. Мэт поделился своими мыслями о технологиях поиска будущего.

— Расскажите о работе Google над поисковой системой следующего поколения.

— Основное новшество поисковой системы будущего — возможность персонализированного поиска, когда пользователь получает только актуальную и нужную ему информацию. То есть человек вводит простой запрос, а Google заботится о деталях. Например, житель Новой Зеландии вводит слово «Банк» и получает список банков только его страны. Это самый примитивный отбор, по месту нахождения, идею легко развить, у нее большой потенциал.

— С недавнего времени сервис персонализации доступен через Google Accounts. Это первый шаг к персонализированному поиску?

— Да, пользователю не требуется каждый раз настраивать параметры поиска. Пока он в системе, она адаптирует под него результаты поиска. Если же эта функция окажется лишней, пользователь всегда вправе нажать на ссылку в правом верхнем углу и отказаться от нее, выйдя из системы.

— А как насчет семантики языка? Насколько важно понимать естественный язык человека для технологий поиска, и как далеко продвинулась Google в этом направлении?

— Мы используем разные технологии и семантику языка в том числе. Семантику пытаются реализовать в том или ином виде все существующие поисковые машины, но нельзя делать ставки на какую-то одну технологию. В этом случае подход Google очень практичен, и его можно проследить в уже существующем механизме поиска.

— Сейчас существует множество альтернативных технологий поиска информации в сети. Какие из них вы считаете самыми перспективными?

— Самыми естественными кажутся уже упомянутая технология персонализированного поиска и идея искусственного интеллекта. Также стоит упомянуть визуализацию, реструктуризацию введенного запроса. Иногда внизу страницы вместе с результатами поиска появляется предложение поискать по автоматически реструктурированному или родственному запросу, который, по мнению поисковой машины, позволит получить более качественные результаты поиска. Этот механизм Google тестирует уже давно, но мы не хотим его запускать полностью, пока не отладим до достаточно качественного уровня.

— В конце прошлого года был запущен экспериментальный поисковый сайт SearchMash, который обладает множеством инновационных функций и построен с использованием технологии Ajax. Это прототип новой версии google.com?

— Возможность, конечно, есть, но далеко не факт, что все особенности SearchMash будут реализованы в поисковой машине Google. Всегда приходится идти на компромисс из-за совместимости между разными браузерами, потребностями пользователей, занимаемыми размерами виджетов и временем реализации функции. Например, в SearchMash можно начать печатать в любом месте страницы, но текст окажется в окне запроса — полезная функция, которая будет работать далеко не во всех браузерах. SearchMash — это своего рода поле для экспериментов с интерфейсом пользователя. Мы можем опробовать разные подходы и увидеть, как потребители реагируют на них. Все технологии проходят длительное тестирование перед тем, как быть реализованными в google.com.

— У вас есть планы по внедрению функции специализированного поиска по блогам, техническим ресурсам и т. д.?

— Предлагаю вспомнить уже реализованные функции поиска патентов, исходников программного кода, книг и прочих ресурсов достаточно узкой специализации. Google Calendar осуществляет поиск в записях календаря, Gmail — в электронных письмах. Кроме того, существует Google Custom Search Engine (CSE), технология, позволяющая построить фактически свою поисковую машину, осуществляющую поиск по конкретным ресурсам. Пользователь может легко добавить 5000 адресов, а затем осуществлять фильтрацию между ними. Таким образом, если человек желает найти, например, ряд подкастов на техническую тематику, можно использовать уже настроенные по технологии CSE поисковики или создать собственный. Думаю, это очень правильный подход, и он очень популярен.

— Вы участвовали в создании технологии фильтрации спама. Расскажите, как Google удается выделять веб-спам на фоне результатов поиска?

— За последний год мы серьезно улучшили наши антиспам-фильтры и даже создали специальную систему измерений, показывающую, насколько мы продвинулись. В прошлом году мы много внимания уделили иноязычному спаму, чтобы поиск на любом языке оказался релевантным.

— В прошлом году Google приобрела ресурс YouTube и запустила Google Video, а также сервис поиска видеоклипов. Каких направлений в области поиска видео компания придерживается сейчас?

— Видео само по себе более интересно и информативно, чем текст, картинки или подкасты, ведь оно содержит еще и видеоряд. В то же время его намного сложнее индексировать и внести в базу поиска. Мы используем систему рейтингов, обращаем внимание на количество сайтов, ссылающихся на видеоролик и на сайт, его содержащий. Таким образом, результаты поиска обычно удовлетворительные.

Источник - www.habrahabr.ru

Читать другие похожие записи:

RSS-подписка

Powered by FeedBurner

Мы рекомендуем

Searchengines.Ru - Первый сайт о SEO.

Sape.Ru - Лучшая биржа ссылок за 2007 год.

Yazzle.Ru - Программа для оценки бюджетов и анализа конкурентов.