JesCid (jescid) wrote,
JesCid
jescid

Category:

Про поисковые системы сравнительно-описательное.

А не интересует ли вас, товарищи, качество индексации и релевантность выдачи поисковых систем? Технический сравнительный анализ по абстрактным ключевым словам полезен и показателен, но иллюстрации лучше всего удаются на конкретных примерах.
Понадобилось мне всвязи с предыдущей записью найти известный текст выступления т.Сталина от 3 июля 1941г.. - набираю в Rambler, Yandex и Google "захват нашего хлеба" (в кавычках, но желающие могут подивиться этому же запросу без кавычек - особенно у Яндекса...) - и что же я вижу? То же, что и вы, щёлкнув на нижеприведённые ссылки:
- найдено сайтов: 70, документов: 192 (Rambler)
- результат поиска: страниц — 165, сайтов — не менее 10 (Yandex показал 10 ссылок и предложил, как всегда, ещё и купить слова :))
- примерно 149 (Google)

Но вы на выдачу посмотрите - ну, Яндекса, разумеется...! И сравните с выдачей Рамблера... .

А теперь пройдусь-ка я простыми тех. запросами и посмотрю как эти же поисковики индексируют безусловно очень достойный сайт www.a2m.ru - Авиация Второй Мировой, на котором найдена явно релевантная (и по Гуглю, и по Рамблеру) страница, соответствующая вышецитированному запросу:

- найдено документов: 223 - Rambler - обратите внимание, что он выдал по этому тех. запросу...
- Результат поиска: страниц — 188 - Yandex - и вы посмотрите, что Яндекс выдал в начале выдачи по этому тех. запросу!...
- приблизительно 178 из домена www.a2m.ru - Google

Если посмотреть внимательно на результат выдачи Яндекса по тех. запросу о числе проиндексированных страниц на сервере, то можно сделать вывод, что в индексную базу Яндекс спокойно заливает страницы форума (причём стандартного и легко распознаваемого) - из всех наблюдаемых в базе Яндекса страниц www.a2m.ru, страниц форума не менее трети.
Упомянутого текста выступления Сталина в базе Яндекса (публично показываемой по крайней мере) по этому сайту действительно нет. Зато есть Выступление по радио В. М. Молотова от 22 июня 1941 года - со знаменитыми Наше дело правое. Враг будет разбит. Победа будет за нами. и отрывок из Майн Кампф Гитлера (пруссонацистам понравится...).
Эти же документы есть в индексной базе и Гугля, и Рамблера... (и, кстати, тексты выступления Сталина, Молотова, отрывок из Майн Кампф связаны на анализируемом сайте ссылочным навигатором! - как Яндекс потерял текст выступления Сталина - просто загадка :))

Разумеется, во-первых, это данные на текущий момент, а во-вторых - это только примеры, желающие могут самостоятельно проверить качество индексации и выдачи указанных поисковых систем на других запросах.

Но я всё же осмелюсь сделать следующие выводы:
- Yandex явно и всё более рекламирует через выдачу рефераты, цитаты и аннотации книг, а не конкретные документы, отвечающие данному запросу. То, что технически не составляет особого труда выявить спрос именно на документы, а не их куски - это вообще не вопрос. Вопрос в том - случайное ли это совпадение, попустительство или намеренная политика?
- Аналогичный вывод можно сделать и по Google в англоязычном секторе - Google всё более фортит сайтам, предоставляющим платный доступ к документам и продажу книг (через аннотации или рецензии к книгам). Желающие могут внимательно посмотреть выдачу, например, по запросу Antanta Civil war. Тут и сомнения быть не может в намеренной политике.
- Технически выдача ссылок на куски текстов, а не ссылок на целые тексты (NB: при наличии ограниченного/платного доступа ко всему тексту как пользователю, так и стороннему к данному сайту поисковику) проще и, при росте объёма информации, - самое лёгкое решение задачи поиска документов и построения их релевантного ранжирования по запросу с ключевыми словами...
Tags: google, rambler, yandex, поисковые системы
Subscribe

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 4 comments