Google
мало анализа только текста на сайте, компания стремится предоставлять
пользователю всю информацию с веб-страницы. Именно для этого в
поисковую системупланируется добавить функцию анализа табличных
данных, сообщает PC World.
«В интернете находится много классифицированной информации, но мы все еще не слишком хорошо представляем ее нашим пользователям», - говорит Алон Хэлеви
(Alon Halevy). По данным исследователей, сейчас в сети около 14
миллиардов таблиц. К полезным, с информационной точки зрения, относятся
только 2% таблиц. Но и эти 2% составляют большое количество
таблиц - 154 миллиона. Google собирается выводить таблицы в результатах
поиска. Подобная выдача будет удобна при ответе поисковика на такие
запросы, как «курс валюты», «путешествия». То есть, пользователь уже в
выдаче сможет увидеть необходимую информацию.
Новая технология призвана поможет Google в анализе «Недоступного Веба»
(deep Web). То есть тех частей сети, которые поисковые системы обычно
либо не индексируют, либо не в состоянии представить пользователям.
Причем это не первый шаг Google на пути к познанию «Недоступного Веба»:
весной прошлого года поисковик начал индексировать страницы, доступ к которым возможен только через HTML-формы.