The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

форумы  помощь  поиск  регистрация  майллист  вход/выход  слежка  RSS
"Подборка расширений к SQLite и полнотекстовая система поиска..."
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Подборка расширений к SQLite и полнотекстовая система поиска..."  +/
Сообщение от opennews on 29-Июн-11, 00:18 
Представлен (http://sqlite.mobigroup.ru/wiki?name=extensions) список расширений для БД SQLite, среди которых ICU (http://mobigroup.ru/debian/pool-squeeze/main/s/sqlite3-ext-icu/), FTS3 (http://mobigroup.ru/debian/pool-squeeze/main/s/sqlite3-ext-fts3/), реализация (http://sqlite.mobigroup.ru/dir?name=ext/compress) функций упаковки и распаковки данных с использованием zlib, подборка (http://sqlite.mobigroup.ru/wiki?name=ext_inet) функций для манипулирования IPv4 адресами, генератор UUID (http://sqlite.mobigroup.ru/dir?name=ext/uuid), реализация хэшей MD5 (http://sqlite.mobigroup.ru/dir?name=ext/md5) и SHA1 (http://mobigroup.ru/debian/pool-squeeze/main/s/sqlite3-ext-sha1/). Также поддерживается набор утилит (http://sqlite.mobigroup.ru/wiki?name=utils) для работы со справочником адресов КЛАДР, конвертацией баз данных XBase в формат SQLite и репликации БД SQLite.


Кроме того, обновлена поисковая система Poisk (http://sqlite.mobigroup.ru/wiki?name=poisk), для работы которой теперь достато...

URL: http://sqlite.mobigroup.ru/wiki?name=extensions
Новость: http://www.opennet.dev/opennews/art.shtml?num=31025

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения по теме [Сортировка по времени | RSS]


1. "Подборка расширений к SQLite и полнотекстовая система поиска..."  +/
Сообщение от Иван Лох on 29-Июн-11, 00:18 
А с gtk filechooser он интегрируется?
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

2. "Подборка расширений к SQLite и полнотекстовая система поиска..."  +/
Сообщение от Veter (??) on 29-Июн-11, 01:19 
Нет. Но если означенный gtk filechooser умеет общаться через пайпы (и без DBUS), то можно и сделать.
Ответить | Правка | ^ к родителю #1 | Наверх | Cообщить модератору

3. "Подборка расширений к SQLite и полнотекстовая система поиска..."  +/
Сообщение от СуперАноним on 29-Июн-11, 08:49 
А что за негативизм по отношению к D-Bus? Ведь, это десктопстандарт от freedesktop.org.
Ответить | Правка | ^ к родителю #2 | Наверх | Cообщить модератору

4. "Подборка расширений к SQLite и полнотекстовая система поиска..."  +2 +/
Сообщение от anonymous (??) on 29-Июн-11, 14:57 
>freedesktop.org

мне они всегда казались вредителями. у них просто невероятный талант придумывать ненужные костыли. единственное, что более или менее полезного было ими написано - это gstreamer.

Ответить | Правка | ^ к родителю #3 | Наверх | Cообщить модератору

5. "Подборка расширений к SQLite и система полнотекстового поиск..."  +/
Сообщение от lhoi email on 29-Июн-11, 15:32 
На оффсайте Поиска "В настоящий момент нет поддержки морфологии для полнотекстового поиска", а в заголовке "система полнотекстового поиска с поддержкой словоформ". Как это понимать?
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

6. "Подборка расширений к SQLite и система полнотекстового поиск..."  +/
Сообщение от Veter (??) on 29-Июн-11, 19:17 
Поиск по словоформам может выполняться и без морфологического анализа, путем стемминга (более простая задача), что в нашем случае и делается.

Из вики "Стемминг":

"Стемматизация (стемминг) — это процесс нахождения основы слова для заданного исходного слова. Основа слова необязательно совпадает с морфологическим корнем слова."

Проще говоря, мы отбрасываем те части слова, которые считаем незначащими. Но вовсе не обязательно то, что остается, будет совпадать с корнем слова.
Пример из вики "Корень (лингвистика)": "В сложных словах (композитах) несколько корней: желез-н-о-дорож-н-ый". Но стемминг (Snowball) дает совершенно другой результат:

$ echo железнодорожный | stemwords -l russian
железнодорожн

Есть еще и поиск по soundex-хэшу (их много разных реализаций), можно найти и написанные с ошибками слова, и опять же без морфологического анализа. Правда, тот, кто пишет саму реализацию хэша, опирается как раз на знание морфологии... но это совсем другая история :)

Ответить | Правка | ^ к родителю #5 | Наверх | Cообщить модератору

7. "Подборка расширений к SQLite и система полнотекстового поиск..."  +/
Сообщение от Anonymouse on 30-Июн-11, 18:12 
За fossil - спасибо! :) Остальное не пригодилось пока ....
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

8. "Подборка расширений к SQLite и система полнотекстового поиск..."  +/
Сообщение от lhoi on 30-Июн-11, 20:37 
Спасибо! Очень познавательно. А есть ли программа/библиотека под линукс для поиска русского текста по словоформам? (stemwords посмотрю. Тоже для меня новое)
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

9. "Подборка расширений к SQLite и система полнотекстового поиск..."  +/
Сообщение от Veter (??) on 01-Июл-11, 12:08 
Это и есть тема новости, что утилиты Poisk индексируют русский текст и ищут по словоформам :)
Непосредственно поиск (по индексированным документам) описан по ссылке
http://sqlite.mobigroup.ru/wiki?name=sqlite3-poisk-client

А можно и просто в SQLite модуль поиска загрузить и искать в БД, см.
http://sqlite.mobigroup.ru/wiki?name=FTS3+Snowball+Stemmer

Ответить | Правка | ^ к родителю #8 | Наверх | Cообщить модератору

10. "Подборка расширений к SQLite и система полнотекстового поиск..."  +/
Сообщение от Alexey email(??) on 22-Ноя-12, 15:30 
Еще один вариант прикручивания snowball стемминга к sqlite: https://github.com/littlesavage/sqlite3-unicodesn
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру