Компания Searchdaimon объявила (http://www.searchdaimon.com/blog/searchdaimon_enterprise_sea.../) об открытии исходных текстов своего поискового движка, ориентированного на организацию работы корпоративной поисковой системы, индексирующей как данные на web-ресурсах компании, так и информацию из внутренних систем, таких как базы данных и хранилища документов.
Код открыт (https://github.com/searchdaimon/enterprise-search) под лицензией GPLv2 и насчитывает около 100 тысяч строк кода на языках Си и Perl . В качестве платформы для дальнейшей разработки системы будет использоваться GitHub. После перехода на открытую модель разработки компания намерена обеспечить получение прибыли за счёт оказания консалтинговых услуг и технической поддержки, а также через продажу аппаратных решений и облачных сервисов на базе поискового движка. Некоторые из компонентов из-за наличия сторонней интеллектуальной собственности открыть не удалось, например, к таким компонентам относится модуль для преобразования DWG-файлов и распределённый механизм индексации.
Ориентация системы на поиск корпоративной информации отразилась в наличии расширенных функций фильтрации и сортировки контента, удовлетворяющего поисковому запросу. Например, можно фильтровать вывод по формату документов, типу информации, делать выборки за определённые промежутки времени, учитывать объединение данных в коллекции. Кроме вывода в соответствии с коэффициентом релевантности предусмотрены возможности прямой и обратной сортировки по дате. При выводе результатов возможно отображение разобранных структурированных данных без необходимости обращения к источнику данных. Searchdaimon также поддерживает такие типичные для современных поисковых систем возможности, как корректировка ошибок в поисковом запросе и автоматическое предложение близких вариантов запроса (Suggest).
<center><a href="http://static.searchdaimon.com/images/sd_images/filter2.png&... src="http://www.opennet.dev/opennews/pics_base/0_1373367578.png" style="border-style: solid; border-color: #606060; border-width: 1px;" title="" border=0></a></center>
<center><a href="http://www.searchdaimon.com/images/sd_images/ferie_i_res.jpg... src="http://www.opennet.dev/opennews/pics_base/0_1373369358.jpg" style="border-style: solid; border-color: #e9ead6; border-width: 15px;" title="" border=0></a></center>
<center><a href="http://www.searchdaimon.com/images/sd_images/suggest.jpg&quo... src="http://www.opennet.dev/opennews/pics_base/0_1373369385.jpg" style="border-style: solid; border-color: #e9ead6; border-width: 15px;" title="" border=0></a></center>
Управление системой производится через web-интерфейс администратора, через который доступны функции добавления и удаления источников данных, управления коллекциями (SMB, Exchange и т.п.), анализа статистики (популярные запросы, активные пользователи) и просмотра логов. В качестве источников для индексации могут выступать web-сайты, документы в файловых хранизлищах (Word, PDF, Excel), SQL-базы, SharePoint, Exchange и т.п. Индексаторы дополнительных типов данных подключаются в форме плагинов.
<center><a href="http://static.searchdaimon.com/images/sd_images/admin_overvi... src="http://www.opennet.dev/opennews/pics_base/0_1373368440.png" style="border-style: solid; border-color: #e9ead6; border-width: 15px;" title="" border=0></a></center>
<center><a href="http://static.searchdaimon.com/images/sd_images/admin_statis... src="http://www.opennet.dev/opennews/pics_base/0_1373369413.png" style="border-style: solid; border-color: #e9ead6; border-width: 15px;" title="" border=0></a></center>
URL: http://www.searchdaimon.com/blog/searchdaimon_enterprise_sea.../
Новость: http://www.opennet.dev/opennews/art.shtml?num=37383