Создание распределенной информационной системы поиска на основе тематико-ориентированных методов в пиринговых сетях
Номер проекта
05-07-90266-в, РФФИ
Руководитель
Лукьянов А.В.
Период
2005 – 2007 гг.
Аннотация
Огромный объем доступной в Интернет информации делает невозможным посещение всех доступных ресурсов с целью проверки их на соответствие заданной тематике. Более того, значительная вычислительная трудоемкость методов определения соответствия документа заданной тематике, которая значительно превышает трудоемкость посещения документа, еще больше понижает пропускную способность системы. Предлагаемый метод поиска пытается решить эти проблемы за счет использования тематической ориентации искомых документов и распределенных технологий для:
разработки архитектуры распределенной поисковой системы;
построения распределенного индекса путем распределения коллекции документов, распределения словаря и инвертированного списка;
выбора специализированной стратегии обхода ресурсов Интернет, максимизирующей число обнаруженных документов искомой тематики,
организации вычислительно-эффективного отсева посещенных документов, которые не относятся к искомой тематике.
проведение экспериментов по проверке эффективности предложенной стратегии.