<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: Посоветуйте что-нибудь быстрое иудобное для хранения пар текста</title>
    <link>https://www.opennet.me/openforum/vsluhforumID9/10346.html</link>
    <description>Здравствуйте.&lt;br&gt;&lt;br&gt;Нужно искать текст (в пределах 1 кб наверно) и возвращать из базы соответствующий ему другой текст (ещё несколько кб) если тот найден, в один поток одному пользователю. Хранится всё будет в файле на диске. Я собирался взять tokyocabinet, но у него биндинги что-то не очень живые.&lt;br&gt;&lt;br&gt;Желательно ещё иметь какое-нибудь разделение на категории, ну либо хранить категории в раздельных файлах но тогда доступ к куче файлов должен быть быстрый. Поиск должен быть максимально быстрым -пользователь и так ждёт слишком долго. Запись можно корутиной кидать, нормально будет я думаю.&lt;br&gt;&lt;br&gt;Скулите это конечно хорошо, но мне нет нужды в сикуле. Есть подозрение, что будет просаживаться когда база разрастётся на гигабайты, да и не очень удобно без алхимии.&lt;br&gt;&lt;br&gt;Спасибо.&lt;br&gt;</description>

<item>
    <title>Посоветуйте что-нибудь быстрое иудобное для хранения пар текста (ыы)</title>
    <link>https://www.opennet.me/openforum/vsluhforumID9/10346.html#8</link>
    <pubDate>Sat, 16 Jan 2021 09:06:38 GMT</pubDate>
    <description>&amp;gt; Мне надо чтобы это быстро работало. &lt;br&gt;&lt;br&gt;Возьмите Майкрософт SQL Server (он есть бесплатный), и постройте по своей табличке кластеризованный индекс.&lt;br&gt;&lt;br&gt;быстродействие и иерархическое дерево &quot;на нативном языке&quot; прилагается бесплатно.&lt;br&gt;</description>
</item>

<item>
    <title>Посоветуйте что-нибудь быстрое иудобное для хранения пар текста (Аноним)</title>
    <link>https://www.opennet.me/openforum/vsluhforumID9/10346.html#7</link>
    <pubDate>Sat, 16 Jan 2021 09:01:51 GMT</pubDate>
    <description>Но сколько времени потеряется при допустим 100 базах по 1000 префиксов? 1 ключом по 100 базам должно быть заметно проще чем пройтись 1 ключом по 100000 &quot;баз&quot;.&lt;br&gt;</description>
</item>

<item>
    <title>Посоветуйте что-нибудь быстрое иудобное для хранения пар текста (Аноним)</title>
    <link>https://www.opennet.me/openforum/vsluhforumID9/10346.html#6</link>
    <pubDate>Sat, 16 Jan 2021 08:58:16 GMT</pubDate>
    <description>Хотя хотелось бы замерить. Префиксов больше 1000 на базу не планируется пока что.&lt;br&gt;</description>
</item>

<item>
    <title>Посоветуйте что-нибудь быстрое иудобное для хранения пар текста (Аноним)</title>
    <link>https://www.opennet.me/openforum/vsluhforumID9/10346.html#5</link>
    <pubDate>Sat, 16 Jan 2021 08:55:05 GMT</pubDate>
    <description>С другой стороны, пройтись по всем префиксам будет ненамного дороже чем пройтись сразу по всем данным. Да, пожалуй leveldb пока подходит всем. HDF5 тоже рассматривался, но это очевидно уже оверкил будет.&lt;br&gt;</description>
</item>

<item>
    <title>Посоветуйте что-нибудь быстрое иудобное для хранения пар текста (Аноним)</title>
    <link>https://www.opennet.me/openforum/vsluhforumID9/10346.html#4</link>
    <pubDate>Sat, 16 Jan 2021 08:42:47 GMT</pubDate>
    <description>Мне надо чтобы это быстро работало. Ключ от 1 байта до 1500-2000 (в теории, но я точно знаю, что такие будут, потому что один символ утф-8 до 4 байт и даже до 6 в будущем). Интересует готовое решение на нативном языке. Сишный lmdb в принципе норм, только с питоновыми биндингами совсем беда. Плюсовый leveldb похуже, однако на моём кейсе вроде норм. Бонусом сжимает содержимое на диске, судя по бенчмаркам в интернете потребляет в 3 раза меньше места на несжимаемых данных, производительности пока что хватает, префиксы вроде то что нужно для разграничения данных (но только мне необходимо писать с разделением, а искать игнорируя префиксы, хм? так наверное нельзя, да?). Из минусов разве что ресурсоёмкость и вероятность развалить случайно. Интересно, а ситуации с кончившимся местом она переживёт нормально? Все браузеры теряют все (&quot;временные&quot;) данные в таких условиях.&lt;br&gt;</description>
</item>

<item>
    <title>Посоветуйте что-нибудь быстрое иудобное для хранения пар текста (ыы)</title>
    <link>https://www.opennet.me/openforum/vsluhforumID9/10346.html#3</link>
    <pubDate>Sat, 16 Jan 2021 08:15:49 GMT</pubDate>
    <description>&amp;gt;&#091;оверквотинг удален&#093;&lt;br&gt;&amp;gt; Я собирался взять tokyocabinet, но у него биндинги что-то не очень &lt;br&gt;&amp;gt; живые.&lt;br&gt;&amp;gt; Желательно ещё иметь какое-нибудь разделение на категории, ну либо хранить категории в &lt;br&gt;&amp;gt; раздельных файлах но тогда доступ к куче файлов должен быть быстрый. &lt;br&gt;&amp;gt; Поиск должен быть максимально быстрым -пользователь и так ждёт слишком долго. &lt;br&gt;&amp;gt; Запись можно корутиной кидать, нормально будет я думаю.&lt;br&gt;&amp;gt; Скулите это конечно хорошо, но мне нет нужды в сикуле. Есть подозрение, &lt;br&gt;&amp;gt; что будет просаживаться когда база разрастётся на гигабайты, да и не &lt;br&gt;&amp;gt; очень удобно без алхимии.&lt;br&gt;&amp;gt; Спасибо.&lt;br&gt;&lt;br&gt;То есть у вас ключ длинной килобайт? Хм... бейте его на блоки по 100 байт засовывайте  иерархию в mapreduсe и за 10 хопов вы получите ответ  на любой запрос на любом размере базы.&lt;br&gt;</description>
</item>

<item>
    <title>Посоветуйте что-нибудь быстрое иудобное для хранения пар текста (Аноним)</title>
    <link>https://www.opennet.me/openforum/vsluhforumID9/10346.html#2</link>
    <pubDate>Fri, 15 Jan 2021 10:18:26 GMT</pubDate>
    <description>Этот lmdb такая-то дрянь, ни cffi не работает, ни системный ни хочет, ни из pip не переопределить размер ключа. И по факту ограничено 2000 байт ключ + значение, иначе ты хочешь проблем. Потом, пухнет и не удаляет ничего, кошмарные объёмы места сжирает просто так&amp;#8230;&lt;br&gt;&lt;br&gt;Вот leveldb вроде ок, пришлось поискать. Интересно, сколько можно данных запихнуть, прежде чем начнёт ощутимо тормозить.&lt;br&gt;</description>
</item>

<item>
    <title>Посоветуйте что-нибудь быстрое иудобное для хранения пар текста (Аноним)</title>
    <link>https://www.opennet.me/openforum/vsluhforumID9/10346.html#1</link>
    <pubDate>Fri, 15 Jan 2021 05:42:56 GMT</pubDate>
    <description>Бонус если очень быстро можно сравнить на совпадение без различий в пунктуации или хотя бы игнорировать различия вроде &amp;#12290;/. и &amp;#65288;/( ну и &amp;#8230;/... заодно.&lt;br&gt;</description>
</item>

</channel>
</rss>
