Вариант для распечатки |
Пред. тема | След. тема | ||
Форум WEB технологии (Базы данных) | |||
---|---|---|---|
Изначальное сообщение | [ Отслеживать ] |
"Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от datahub.1 (ok), 04-Дек-19, 20:06 | ||
Доброго дня | ||
Ответить | Правка | Cообщить модератору |
Оглавление |
Сообщения | [Сортировка по времени | RSS] |
1. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от ыы (?), 04-Дек-19, 20:22 | ||
>[оверквотинг удален] | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
2. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от datahub.1 (ok), 04-Дек-19, 20:29 | ||
>[оверквотинг удален] | ||
Ответить | Правка | ^ к родителю #1 | Наверх | Cообщить модератору |
3. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от Licha Morada (ok), 04-Дек-19, 23:31 | ||
> Есть ~50M pdf документов, средний размер каждого ~1Mb, минимальный 10Kb, максимальный 50Mb. | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
6. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от Аноним (6), 06-Дек-19, 02:53 | ||
Какой-нибудь cudagrep может помочь. Чем не на халяву? | ||
Ответить | Правка | ^ к родителю #3 | Наверх | Cообщить модератору |
16. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от Licha Morada (ok), 08-Дек-19, 05:21 | ||
> Какой-нибудь cudagrep может помочь. Чем не на халяву? | ||
Ответить | Правка | ^ к родителю #6 | Наверх | Cообщить модератору |
17. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от Аноним (6), 10-Дек-19, 14:29 | ||
>> Какой-нибудь cudagrep может помочь. Чем не на халяву? | ||
Ответить | Правка | ^ к родителю #16 | Наверх | Cообщить модератору |
4. "Посоветуйте решение для поиска по большому объёму данных" | +1 +/– | |
Сообщение от Аноним (4), 05-Дек-19, 10:35 | ||
Полнотекстовый поиск - это Sphinx, Elastic, Solr. Копайте в этих направлениях. На ютубе есть про них достаточно докладов в контексте большого кол-ва данных и высоких нагрузок. | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
23. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от Миха (??), 11-Дек-19, 18:17 | ||
> Полнотекстовый поиск - это Sphinx, Elastic, Solr. Копайте в этих направлениях. На | ||
Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору |
5. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от datahub.1 (ok), 06-Дек-19, 02:14 | ||
спасибо большое всем откликнувшимся | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
7. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от ACCA (ok), 06-Дек-19, 04:02 | ||
50Т это много для начинающего. | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
8. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от Pahanivo (ok), 06-Дек-19, 11:14 | ||
Ммм а история задачи какая? Откуда столько файлов и зачем такой объем в pdf? | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
9. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от fantom (??), 06-Дек-19, 12:20 | ||
>[оверквотинг удален] | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
10. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от fantom (??), 06-Дек-19, 12:36 | ||
>[оверквотинг удален] | ||
Ответить | Правка | ^ к родителю #9 | Наверх | Cообщить модератору |
11. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от Pahanivo (ok), 06-Дек-19, 13:29 | ||
> 10 шт. вот таких 8тб интелов, + которочку к ним соотв. и | ||
Ответить | Правка | ^ к родителю #10 | Наверх | Cообщить модератору |
12. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от Pahanivo (ok), 06-Дек-19, 13:30 | ||
> | ||
Ответить | Правка | ^ к родителю #11 | Наверх | Cообщить модератору |
13. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от fantom (??), 06-Дек-19, 14:15 | ||
>> 10 шт. вот таких 8тб интелов, + которочку к ним соотв. и | ||
Ответить | Правка | ^ к родителю #11 | Наверх | Cообщить модератору |
14. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от Pahanivo (ok), 07-Дек-19, 00:01 | ||
тут индексы надо ... | ||
Ответить | Правка | ^ к родителю #13 | Наверх | Cообщить модератору |
15. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от cool29 (?), 07-Дек-19, 02:22 | ||
>[оверквотинг удален] | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
18. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от ACCA (ok), 10-Дек-19, 22:48 | ||
> 1. штампуем 50000 баз. (50 000 * 1 000 000 записей * | ||
Ответить | Правка | ^ к родителю #15 | Наверх | Cообщить модератору |
19. "Посоветуйте решение для поиска по большому объёму данных" | +1 +/– | |
Сообщение от cool29 (?), 10-Дек-19, 23:51 | ||
>[оверквотинг удален] | ||
Ответить | Правка | ^ к родителю #18 | Наверх | Cообщить модератору |
20. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от cool29 (?), 11-Дек-19, 00:00 | ||
вот кстати и как конвертер для извлечения текста из pdf | ||
Ответить | Правка | ^ к родителю #19 | Наверх | Cообщить модератору |
21. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от cool29 (?), 11-Дек-19, 00:12 | ||
Ну и как совсем тупой вариант: аннотация. | ||
Ответить | Правка | ^ к родителю #20 | Наверх | Cообщить модератору |
22. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от ACCA (ok), 11-Дек-19, 13:39 | ||
> Ну и как совсем тупой вариант: аннотация. | ||
Ответить | Правка | ^ к родителю #21 | Наверх | Cообщить модератору |
26. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от cool29 (?), 11-Дек-19, 22:06 | ||
>> Ну и как совсем тупой вариант: аннотация. | ||
Ответить | Правка | ^ к родителю #22 | Наверх | Cообщить модератору |
25. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от Миха (??), 11-Дек-19, 18:27 | ||
структура разных версий pdf известна. Задача определить кодировку документа тревиальна. Как и язык символов тоже. | ||
Ответить | Правка | ^ к родителю #18 | Наверх | Cообщить модератору |
27. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от ACCA (ok), 17-Дек-19, 06:47 | ||
> структура разных версий pdf известна. Задача определить кодировку документа тревиальна. | ||
Ответить | Правка | ^ к родителю #25 | Наверх | Cообщить модератору |
24. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от Миха (??), 11-Дек-19, 18:24 | ||
Нет какого-то волшебного средства для "полнотекстового поиска". Есть много шумихи вокруг этой темы, но как и любая прочая шумиха, шумиха эта не про решение проблемы, а про продвижение личностей тех, кто шумит. | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
28. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
Сообщение от ACCA (ok), 17-Дек-19, 06:52 | ||
Тебя обманули. | ||
Ответить | Правка | ^ к родителю #24 | Наверх | Cообщить модератору |
Архив | Удалить |
Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема |
Оцените тред (1=ужас, 5=супер)? [ 1 | 2 | 3 | 4 | 5 ] [Рекомендовать для помещения в FAQ] |
Закладки на сайте Проследить за страницей |
Created 1996-2024 by Maxim Chirkov Добавить, Поддержать, Вебмастеру |