<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: Увидела свет открытая система обработки терабайтных массивов информации - CloudBase</title>
    <link>https://ns.opennet.ru/openforum/vsluhforumID3/45475.html</link>
    <description>Разработчик CloudBase, высокопроизводительного менеджера данных с открытым исходным кодом, компания Business.com объявила (http://cloudcomputing.sys-con.com/node/757629) о выходе под лицензией GPLv2 релиза CloudBase. Система спроектирована для работы на &amp;#171;обычном железе&amp;#187; и поддерживает распределенную сетевую архитектуру. Основное ее предназначение &amp;#8212; это предоставление малобюджетным компаниям высокоэффективных сервисов бизнес анализа.&lt;br&gt;&lt;br&gt;&lt;br&gt;Построенная с использованием технологии Map-Reduce (http://ru.wikipedia.org/wiki/MapReduce), CloudBase может обрабатывать терабайтные и петабайтные массивы информации, и позволяет составлять запросы к обычным плоским текстовым log-файлам в формате ANSI SQL. Текущая реализация  алгоритма Map-Reduce основана на базе наработок проекта Apache Hadoop (http://hadoop.apache.org/core/). CloudBase имеет в своем составе драйвер JDBC, что позволяет выбрать любую подходящую графическую оболочку, позволяющую формировать SQL-запросы.&lt;br&gt;&lt;br&gt;Среди других во...&lt;br&gt;&lt;br&gt;URL: http://cloudco</description>

<item>
    <title>Увидела свет открытая система обработки терабайтных массивов (PereresusNeVlezaetBuggy)</title>
    <link>https://ns.opennet.ru/openforum/vsluhforumID3/45475.html#10</link>
    <pubDate>Mon, 24 Nov 2008 12:30:49 GMT</pubDate>
    <description>&amp;gt;А Вы действительно считаете, что это простая задача??? :) &lt;br&gt;&amp;gt;Ну, и если с анализом логов того же апача все и так &lt;br&gt;&amp;gt;ясно, то как Вам такая задача: &lt;br&gt;&amp;gt;прочесать _все_ логи со _всех_ серваков и просчитать корреляции событий, а по &lt;br&gt;&amp;gt;результатам вычленить, например, вяло текущий скан портов... &lt;br&gt;&lt;br&gt;Я не говорил, что это простая или тем более ненужная задача, либо что её не надо автоматизировать:). Просто из новости сложилось ощущение, что это полноценное как-бы-СУБД, стало интересно (в качестве общего развития пока что, а там чем чёрт не шутит). Логи анализировать - задача намного более узкая, согласитесь:).&lt;br&gt;</description>
</item>

<item>
    <title>Увидела свет открытая система обработки терабайтных массивов (Алхимик)</title>
    <link>https://ns.opennet.ru/openforum/vsluhforumID3/45475.html#9</link>
    <pubDate>Mon, 24 Nov 2008 08:23:47 GMT</pubDate>
    <description>Легко. HP Operations Manager ;)&lt;br&gt;</description>
</item>

<item>
    <title>Увидела свет открытая система обработки терабайтных массивов (sabitov)</title>
    <link>https://ns.opennet.ru/openforum/vsluhforumID3/45475.html#8</link>
    <pubDate>Mon, 24 Nov 2008 04:25:12 GMT</pubDate>
    <description>А Вы действительно считаете, что это простая задача??? :) &lt;br&gt;Ну, и если с анализом логов того же апача все и так ясно, то как Вам такая задача: &lt;br&gt;прочесать _все_ логи со _всех_ серваков и просчитать корреляции событий, а по результатам вычленить, например, вяло текущий скан портов... &lt;br&gt;</description>
</item>

<item>
    <title>Увидела свет открытая система обработки терабайтных массивов (enp)</title>
    <link>https://ns.opennet.ru/openforum/vsluhforumID3/45475.html#7</link>
    <pubDate>Sun, 23 Nov 2008 18:05:00 GMT</pubDate>
    <description>Новость вышла информативнее оригинальной статьи - там даже ссылки на сайт проекта не было ;) Гугл, конечно, помогает, но, опять-таки, с документацией там туго. Как его завести-то, как логи подкладывать и т.д.?&lt;br&gt;</description>
</item>

<item>
    <title>Увидела свет открытая система обработки терабайтных массивов... (PereresusNeVlezaetBuggy)</title>
    <link>https://ns.opennet.ru/openforum/vsluhforumID3/45475.html#6</link>
    <pubDate>Sun, 23 Nov 2008 13:59:44 GMT</pubDate>
    <description>&amp;gt;Дело в том, что фс, со временем, все более и более приобретает &lt;br&gt;&amp;gt;черты СУБД. Я думаю, будущее за таким подходом. Или, по крайней &lt;br&gt;&amp;gt;мере, за специализированними фс, в которых сразу работаешь как в среде &lt;br&gt;&amp;gt;СУБД. Зачем, например, лишняя прослойка из ОС(которая тоже требует ресурсов), если &lt;br&gt;&amp;gt;от сервера требуются только функции СУБД? &lt;br&gt;&lt;br&gt;Даже если СУБД не размещает свои данные на собственном разделе, содержимым которого и рулит, - а такая возможность есть в любой приличной СУБД Enterprise-класса - то всё равно накладные расходы из-за наличия &quot;прочей&quot; ОС пренебрежимо малы. Кроме разве что пограничных случаев, когда не используются запросы сложнее &quot;SELECT * FROM table&quot; - но тогда нафиг &quot;навороченная&quot; СУБД?&lt;br&gt;&lt;br&gt;Если звучит неубедительно, давайте разберём, где возникают накладные расходы:&lt;br&gt;&lt;br&gt;1. Переключение контекста (юзерспейс &amp;lt;-&amp;gt; ядро &amp;lt;-&amp;gt; юзерспейс в простейшем случае синхронного ввода-вывода);&lt;br&gt;2. Уровень абстракции ФС в ядре (более тонкий в случае работы с выделенным разделом, но всё равно есть);&lt;br&gt;3. Занятое др</description>
</item>

<item>
    <title>Увидела свет открытая система обработки терабайтных массивов... (Аноним)</title>
    <link>https://ns.opennet.ru/openforum/vsluhforumID3/45475.html#5</link>
    <pubDate>Sun, 23 Nov 2008 04:54:11 GMT</pubDate>
    <description>Дело в том, что фс, со временем, все более и более приобретает черты СУБД. Я думаю, будущее за таким подходом. Или, по крайней мере, за специализированними фс, в которых сразу работаешь как в среде СУБД. Зачем, например, лишняя прослойка из ОС(которая тоже требует ресурсов), если от сервера требуются только функции СУБД?&lt;br&gt;</description>
</item>

<item>
    <title>Увидела свет открытая система обработки терабайтных массивов информации - CloudBase (PereresusNeVlezaetBuggy)</title>
    <link>https://ns.opennet.ru/openforum/vsluhforumID3/45475.html#4</link>
    <pubDate>Sat, 22 Nov 2008 19:40:13 GMT</pubDate>
    <description>&quot;We developed CloudBase to drastically improve the speed and efficiency of transforming terabyte-scale web log files into actionable insights for improving user experience and business results,&quot; said Paul Dagum, Chief Scientist and Strategy Officer, R.H. Donnelley Interactive (RHDi).&lt;br&gt;&lt;br&gt;То есть главная и единственная задача - анализ лог-файлов??&lt;br&gt;</description>
</item>

<item>
    <title>Увидела свет открытая система обработки терабайтных массивов (Аноним)</title>
    <link>https://ns.opennet.ru/openforum/vsluhforumID3/45475.html#3</link>
    <pubDate>Sat, 22 Nov 2008 17:47:05 GMT</pubDate>
    <description>высокопроизводительный менеджер данных&lt;br&gt;</description>
</item>

<item>
    <title>Увидела свет открытая система обработки терабайтных массивов информации - CloudBase (fedorovod)</title>
    <link>https://ns.opennet.ru/openforum/vsluhforumID3/45475.html#1</link>
    <pubDate>Sat, 22 Nov 2008 17:01:44 GMT</pubDate>
    <description>т.е. это всетаки база данных или фс ?&lt;br&gt;</description>
</item>

</channel>
</rss>
