Вариант для распечатки |
Пред. тема | След. тема | ||
| Форум WEB технологии (Базы данных) | |||
|---|---|---|---|
| Изначальное сообщение | [ Отслеживать ] | ||
| "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от datahub.1 (ok), 04-Дек-19, 20:06 | ||
Доброго дня | ||
| Ответить | Правка | Cообщить модератору | ||
| Оглавление |
| Сообщения | [Сортировка по времени | RSS] |
| 1. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от ыы (?), 04-Дек-19, 20:22 | ||
>[оверквотинг удален] | ||
| Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору | ||
| 2. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от datahub.1 (ok), 04-Дек-19, 20:29 | ||
>[оверквотинг удален] | ||
| Ответить | Правка | ^ к родителю #1 | Наверх | Cообщить модератору | ||
| 3. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от Licha Morada (ok), 04-Дек-19, 23:31 | ||
> Есть ~50M pdf документов, средний размер каждого ~1Mb, минимальный 10Kb, максимальный 50Mb. | ||
| Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору | ||
| 6. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от Аноним (6), 06-Дек-19, 02:53 | ||
Какой-нибудь cudagrep может помочь. Чем не на халяву? | ||
| Ответить | Правка | ^ к родителю #3 | Наверх | Cообщить модератору | ||
| 16. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от Licha Morada (ok), 08-Дек-19, 05:21 | ||
> Какой-нибудь cudagrep может помочь. Чем не на халяву? | ||
| Ответить | Правка | ^ к родителю #6 | Наверх | Cообщить модератору | ||
| 17. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от Аноним (6), 10-Дек-19, 14:29 | ||
>> Какой-нибудь cudagrep может помочь. Чем не на халяву? | ||
| Ответить | Правка | ^ к родителю #16 | Наверх | Cообщить модератору | ||
| 4. "Посоветуйте решение для поиска по большому объёму данных" | +1 +/– | |
| Сообщение от Аноним (4), 05-Дек-19, 10:35 | ||
Полнотекстовый поиск - это Sphinx, Elastic, Solr. Копайте в этих направлениях. На ютубе есть про них достаточно докладов в контексте большого кол-ва данных и высоких нагрузок. | ||
| Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору | ||
| 23. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от Миха (??), 11-Дек-19, 18:17 | ||
> Полнотекстовый поиск - это Sphinx, Elastic, Solr. Копайте в этих направлениях. На | ||
| Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору | ||
| 5. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от datahub.1 (ok), 06-Дек-19, 02:14 | ||
спасибо большое всем откликнувшимся | ||
| Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору | ||
| 7. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от ACCA (ok), 06-Дек-19, 04:02 | ||
50Т это много для начинающего. | ||
| Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору | ||
| 8. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от Pahanivo (ok), 06-Дек-19, 11:14 | ||
Ммм а история задачи какая? Откуда столько файлов и зачем такой объем в pdf? | ||
| Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору | ||
| 9. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от fantom (??), 06-Дек-19, 12:20 | ||
>[оверквотинг удален] | ||
| Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору | ||
| 10. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от fantom (??), 06-Дек-19, 12:36 | ||
>[оверквотинг удален] | ||
| Ответить | Правка | ^ к родителю #9 | Наверх | Cообщить модератору | ||
| 11. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от Pahanivo (ok), 06-Дек-19, 13:29 | ||
> 10 шт. вот таких 8тб интелов, + которочку к ним соотв. и | ||
| Ответить | Правка | ^ к родителю #10 | Наверх | Cообщить модератору | ||
| 12. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от Pahanivo (ok), 06-Дек-19, 13:30 | ||
> | ||
| Ответить | Правка | ^ к родителю #11 | Наверх | Cообщить модератору | ||
| 13. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от fantom (??), 06-Дек-19, 14:15 | ||
>> 10 шт. вот таких 8тб интелов, + которочку к ним соотв. и | ||
| Ответить | Правка | ^ к родителю #11 | Наверх | Cообщить модератору | ||
| 14. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от Pahanivo (ok), 07-Дек-19, 00:01 | ||
тут индексы надо ... | ||
| Ответить | Правка | ^ к родителю #13 | Наверх | Cообщить модератору | ||
| 15. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от cool29 (?), 07-Дек-19, 02:22 | ||
>[оверквотинг удален] | ||
| Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору | ||
| 18. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от ACCA (ok), 10-Дек-19, 22:48 | ||
> 1. штампуем 50000 баз. (50 000 * 1 000 000 записей * | ||
| Ответить | Правка | ^ к родителю #15 | Наверх | Cообщить модератору | ||
| 19. "Посоветуйте решение для поиска по большому объёму данных" | +1 +/– | |
| Сообщение от cool29 (?), 10-Дек-19, 23:51 | ||
>[оверквотинг удален] | ||
| Ответить | Правка | ^ к родителю #18 | Наверх | Cообщить модератору | ||
| 20. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от cool29 (?), 11-Дек-19, 00:00 | ||
вот кстати и как конвертер для извлечения текста из pdf | ||
| Ответить | Правка | ^ к родителю #19 | Наверх | Cообщить модератору | ||
| 21. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от cool29 (?), 11-Дек-19, 00:12 | ||
Ну и как совсем тупой вариант: аннотация. | ||
| Ответить | Правка | ^ к родителю #20 | Наверх | Cообщить модератору | ||
| 22. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от ACCA (ok), 11-Дек-19, 13:39 | ||
> Ну и как совсем тупой вариант: аннотация. | ||
| Ответить | Правка | ^ к родителю #21 | Наверх | Cообщить модератору | ||
| 26. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от cool29 (?), 11-Дек-19, 22:06 | ||
>> Ну и как совсем тупой вариант: аннотация. | ||
| Ответить | Правка | ^ к родителю #22 | Наверх | Cообщить модератору | ||
| 25. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от Миха (??), 11-Дек-19, 18:27 | ||
структура разных версий pdf известна. Задача определить кодировку документа тревиальна. Как и язык символов тоже. | ||
| Ответить | Правка | ^ к родителю #18 | Наверх | Cообщить модератору | ||
| 27. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от ACCA (ok), 17-Дек-19, 06:47 | ||
> структура разных версий pdf известна. Задача определить кодировку документа тревиальна. | ||
| Ответить | Правка | ^ к родителю #25 | Наверх | Cообщить модератору | ||
| 24. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от Миха (??), 11-Дек-19, 18:24 | ||
Нет какого-то волшебного средства для "полнотекстового поиска". Есть много шумихи вокруг этой темы, но как и любая прочая шумиха, шумиха эта не про решение проблемы, а про продвижение личностей тех, кто шумит. | ||
| Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору | ||
| 28. "Посоветуйте решение для поиска по большому объёму данных" | +/– | |
| Сообщение от ACCA (ok), 17-Дек-19, 06:52 | ||
Тебя обманули. | ||
| Ответить | Правка | ^ к родителю #24 | Наверх | Cообщить модератору | ||
|
Архив | Удалить |
Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема |
| Оцените тред (1=ужас, 5=супер)? [ 1 | 2 | 3 | 4 | 5 ] [Рекомендовать для помещения в FAQ] | |
|
Закладки на сайте Проследить за страницей |
Created 1996-2025 by Maxim Chirkov Добавить, Поддержать, Вебмастеру |