Поиск ПО САЙТУ

Скрипт поиска по  ВАШЕМУ САЙТУ
find@technospider.ru
Описание СКРИПТА:



Настройки:
поиска для вашего сайта

указанный при получении скрипта
ТОП 10:
запросов на сайтах установивших скрипт поиска
Адреса сайтов
TOP 20
Запросов
в день
http://www.batata.ru/view_page_1/o_nashey_ferme.html
5
 


Алгоритм ранжирования поиска по сайту



Таблица релевантности (первое поколение)




После значительного улучшения алгоритмов работы поискового сервиса - поиск стал вестись не только по тексту, но и по заголовкам страниц:

<title></title>

Левее приведена таблица релевантности суть которой - показать как происходит выбор наиболее релевантной страницы.

«Строгое соответствие» означает что найдено точное совпадение запроса с текстом страницы
«Не строгое соответствие» означает что найдено не точное (со склонениями) совпадение запроса с текстом страницы
«Не найден» означает что запрос не найден в тексте страницы

Наиболее релевантной считается та страница, которая набрала наибольшее количество очков.






Переработана таблица релевантности с учетом поиска по ссылкам (второе поколение )

Реализована возможность поиска по тексту ссылок. Т.е. если на какую либо страницу идет ссылка с текстом релевантным запросу пользователя то такая страница считается релевантной.

При выводе страницы найденной по ссылке – под сниппетом отображается надпись «Найдено по ссылке» за которой следует текст ссылок на эту страницу в который была найдена искомая фраза.

Выше приведена таблица релевантности суть, которой - показать, как происходит выбор наиболее релевантной страницы.

Данная таблиц релевантности учитывает поиск по ссылкам внутри сайта!

В самом левом столбце отображается вес страницы, в которой была найдена искомая фраза.
Наиболее релевантной считается та страница, которая имеет наибольший вес.

Реализовано условие:

  • 8>4+2+1
  • 15>4+2+8
  • 28>4+15+8
т.е. строгое (текст) должно быть выше чем сумма НЕСТРОГОГО ТЕКУЩЕГО порядка (ссылка) плюс сумма всех СТРОГИХ НИЖНЕГО (заголовок) порядка

Основное отличие данной таблицы заключается не только в появлении еще одного столбца, но и в неравномерном распределение весов для страниц, т.е. в предыдущей таблицы левый столбец с весами страниц равномерно нарастал с верху в низ от 0 до 8 а в новой он имеет скачкообразный вид. Максимальное значение веса имеет страница, в которой искомая фраза была найдена в тексте заголовке и тексте ссылки ведущей на нее с какой либо другой страницы.

Основные принципы, выраженные в данной таблице:

  • Страница, в которой искомая фраза найдена в тексте релевантнее чем страница в которой искомая фраза была найдена в заголовке и тексте ссылки ведущей на нее с какой либо другой страницы;
  • Страница, в которой искомая фраза найдена заголовке релевантнее чем страница в которой искомая фраза была найдена в тексте ссылки ведущей на нее с какой либо другой страницы;
  • Страница, в которой искомая фраза найдена в тексте ссылки ведущей на нее с какой либо другой страницы - имеет наименьший вес.

Но как мы видим по таблице - распределение весов неравномерно - это накладывает следующие свойства:

  • Страница в которой искомая фраза найдена по строгому соответствию в тексте ссылки ведущей на нее с какой либо другой страницы релевантнее чем страница, в которой искомая фраза была найдена в заголовке и тексте по нестрогому соответствию;
  • Страница в которой искомая фраза найдена по строгому соответствию в заголовке релевантнее чем страница, в которой искомая фраза была найдена в тексте по нестрогому соответствию.

«Строгое» означает что найдено точное совпадение запроса с текстом страницы
«Не строгое» означает что найдено не точное (со склонениями) совпадение запроса с текстом страницы
«Не найден» означает что запрос не найден в тексте страницы




Достигнута цель!
В поиске релевантной страницы учитывается 12 оценок соответствия ее запросу.

 

Последнее и текущее поколение таблицы релевантности, учитывает
12 факторов соответствия страницы сайта введенному запросу!

    Нахождение в тексте странцы:
  1. строгое соответствие
  2. не строгое
  3. отстутствие текста запроса на странице
    Нахождение в заголовке странцы:
  1. строгое соответствие
  2. не строгое
  3. отстутствие текста запроса в заголовке


    Нахождение текста запроса в ссылке ведущей на страницу:
  1. запрос присутствует в тексте ссылки
  2. запрос частично присутствует в тексте ссылки
  3. ссылка с текстом запроса отсутствует
    Уровень вложенности страницы исходя от главной страницы сайта:
  1. страница на первом уровле вложенности - доступна в один клик
  2. страница на втором уровле вложенности - доступна в два клика
  3. страница на третьем или более уровне вложенности
Мы, программисты сервиса, считаем, что данное количество оценок страницы на ее релевантность запросу - достаточно и отвечает самым строгим требованиям!
Всегда приветствуем критику и новые идеи по почте find@technospider.ru
 

Логотип

find@technospider.ru

Внимание! Все материалы данного сайта являются объектами авторского права. Копирование и распространение любых материалов сайта (в том числе путем копирования на другие сайты и ресурсы в Интернете) без предварительного согласия владельца сайта (правообладателя) и активной ссылки на сайт запрещено.
Сайт носит исключительно информационный характер, и ни при каких условиях не является публичной офертой, определяемой положениями статьи 437(2) Гражданского кодекса Российской Федерации.