<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: Hadoop установил новый мировой рекорд</title>
    <link>https://opennet.ru/openforum/vsluhforumID3/54454.html</link>
    <description>Команда разработчиков системы распределенных вычислений Yahoo объявила (http://developer.yahoo.net/blogs/hadoop/2009/05/hadoop_sorts_a_petabyte_in_162.html) о том, что используя Apache Hadoop, они смогли побить мировой рекорд в сортировке неспецифичных (general purpose) данных. Новое значение рекорда &amp;#8212; 1 терабайт за 62 секунды или петабайт за 16.25 часа. Измерения проводились на кластере Yahoo Hammer, который содержит приблизительно 3800 серверов, в каждом из которых по 2 четырех ядерных процессора Xeon 2.5ГГц, 4 SATA диска, 16Гб ОЗУ, 1Гбит сетевая карта. В качестве ОС используется REHL 5.1, а для обработки данных Sun Java JDK версий 1.6.0_05-b13 и 1.6.0_13-b03.&lt;br&gt;&lt;br&gt;Apache Hadoop &amp;#8212; это открытая среда для проведения процессороемких распределенных вычислений. Ее использование позволяет приложениям получать доступ к массивам не структурированной информации петабайтного объема. Проект начал развиваться в качестве открытой альтернативы Google File System (GFS) и приприетарной реал...&lt;br&gt;&lt;br&gt;URL: http://news.cn</description>

<item>
    <title>Hadoop установил новый мировой рекорд (Аноним)</title>
    <link>https://opennet.ru/openforum/vsluhforumID3/54454.html#67</link>
    <pubDate>Tue, 19 May 2009 10:38:38 GMT</pubDate>
    <description>&amp;gt;вынесем за скобки сомнительный пассаж про неподдатливых программеров. &lt;br&gt;&amp;gt;платформа java популярна, потому что крупным игрокам дешевле прикупить железа, чем нанять &lt;br&gt;&amp;gt;хороших специалистов. &lt;br&gt;&lt;br&gt;И это правильно!&lt;br&gt;50 грамм кремния должны стоить дешевле двух кило мозга!&lt;br&gt;</description>
</item>

<item>
    <title>Hadoop установил новый мировой рекорд (аноним)</title>
    <link>https://opennet.ru/openforum/vsluhforumID3/54454.html#66</link>
    <pubDate>Tue, 19 May 2009 10:20:10 GMT</pubDate>
    <description>&amp;gt;почему Java стал и остаётся одним из самых популярных языков программирования.&lt;br&gt;&amp;gt;Отнюдь не из-за пиара, в программерской среде он не играет роли.&lt;br&gt;&lt;br&gt;вынесем за скобки сомнительный пассаж про неподдатливых программеров.&lt;br&gt;платформа java популярна, потому что крупным игрокам дешевле прикупить железа, чем нанять хороших специалистов.&lt;br&gt;</description>
</item>

<item>
    <title>Hadoop установил новый мировой рекорд (Интегратор Императора)</title>
    <link>https://opennet.ru/openforum/vsluhforumID3/54454.html#65</link>
    <pubDate>Tue, 19 May 2009 08:29:51 GMT</pubDate>
    <description>Под виртуальную машину сотню мегабайт на каждом компьютере - и всё. Остальное так же. Пора бы вам признать поражение, а также то, почему Java стал и остаётся одним из самых популярных языков программирования. Отнюдь не из-за пиара, в программерской среде он не играет роли.&lt;br&gt;</description>
</item>

<item>
    <title>Hadoop установил новый мировой рекорд (аноним)</title>
    <link>https://opennet.ru/openforum/vsluhforumID3/54454.html#64</link>
    <pubDate>Tue, 19 May 2009 04:15:20 GMT</pubDate>
    <description>&amp;gt;Вы что - будете генерировать 10 выполнимых файлов под все возможные процессоры?&lt;br&gt;&lt;br&gt;Компилятор, не?&lt;br&gt;&lt;br&gt;&amp;gt;JIT может все&lt;br&gt;&lt;br&gt;Никто не сомневался, что java - зрелая и развитая технология.&lt;br&gt;Только для исполнения она требует немного - а если считать память, то в десятки и сотни раз - больше машинного ресурса. Вот собственно всё.&lt;br&gt;</description>
</item>

<item>
    <title>Hadoop установил новый мировой рекорд (Volodymyr Lisivka)</title>
    <link>https://opennet.ru/openforum/vsluhforumID3/54454.html#63</link>
    <pubDate>Mon, 18 May 2009 23:59:29 GMT</pubDate>
    <description>&amp;gt;(и я не даю методу завершится, чтоб не вынуждать JVM делать замену кода на лету). &lt;br&gt;&lt;br&gt;s/и я не даю/и я даю/&lt;br&gt;</description>
</item>

<item>
    <title>Hadoop установил новый мировой рекорд (Volodymyr Lisivka)</title>
    <link>https://opennet.ru/openforum/vsluhforumID3/54454.html#62</link>
    <pubDate>Mon, 18 May 2009 23:57:58 GMT</pubDate>
    <description>&amp;gt;Ну так побейте вон сишную версию того же quicklz хотя-бы на яве.&lt;br&gt;&lt;br&gt;Ну я запустил этот QuickLZ. У меня на 2GHz Celeron 550 оно показывает скорость сжатия в ~380MBps после того, как код отработает хотя-бы секунду (и я не даю методу завершится, чтоб не вынуждать JVM делать замену кода на лету). У него на Core 2 Duo 2.6GHz сишный код сжимает со скоростю 263MBps. Может он просто ошибся в бенчмарке (там много граблей)?&lt;br&gt;&lt;br&gt;У меня:&lt;br&gt;Intel(R) Celeron(R) CPU          550  &#064; 2.00GHz&lt;br&gt;Linux 2.6.27.21-170.2.56.fc10.x86_64 #1 SMP Mon Mar 23 23:08:10 EDT 2009 x86_64 x86_64 x86_64 GNU/Linux&lt;br&gt;java version &quot;1.6.0_12&quot;&lt;br&gt;Java(TM) SE Runtime Environment (build 1.6.0_12-b04)&lt;br&gt;Java HotSpot(TM) 64-Bit Server VM (build 11.2-b01, mixed mode)&lt;br&gt;</description>
</item>

<item>
    <title>Hadoop установил новый мировой рекорд (Аноним)</title>
    <link>https://opennet.ru/openforum/vsluhforumID3/54454.html#61</link>
    <pubDate>Mon, 18 May 2009 18:53:57 GMT</pubDate>
    <description>&amp;gt;&lt;br&gt;&amp;gt;&amp;gt;А потому что JIT оптимизирует код под конкретный процессор с конкретной величиной &lt;br&gt;&amp;gt;&amp;gt;кеша и набором команд, а не под сферического коня в вакууме &lt;br&gt;&amp;gt;&amp;gt;как делает это Си компилятор. &lt;br&gt;&amp;gt;&lt;br&gt;&amp;gt;-march и про остальные опции вы, видимо, не слыхали. &lt;br&gt;&lt;br&gt;Слыхали, а вот вы не понял сути вопроса. Вы что - будете генерировать 10 выполнимых файлов под все возможные процессоры?&lt;br&gt;&lt;br&gt;&lt;br&gt;&amp;gt;Вообще-то это умеет и gcc, о чем вы снова не слыхали. Что &lt;br&gt;&amp;gt;такое openmp, знаете? В 4.4 есть то же самое, но &quot;на &lt;br&gt;&amp;gt;лету&quot;. &lt;br&gt;&lt;br&gt;Знаем, не надо наездов.&lt;br&gt;&lt;br&gt;&amp;gt;&lt;br&gt;&amp;gt;&amp;gt;Зная runtime информацию можно сгенерировать более оптимальный код нежели не зная ее. &lt;br&gt;&amp;gt;&lt;br&gt;&amp;gt;Конечно, так вас и допустят профилировать реальные процессы. А тестовый код, да, &lt;br&gt;&amp;gt;отпрофайлят на ура, только потом эту информацию никак не подсунуть jit &lt;br&gt;&amp;gt;с реальной задачей :) &lt;br&gt;&lt;br&gt;JIT может все. И чем дальше тем больше он будет уметь. Вот собственно все.&lt;br&gt;</description>
</item>

<item>
    <title>Hadoop установил новый мировой рекорд (Аноним)</title>
    <link>https://opennet.ru/openforum/vsluhforumID3/54454.html#60</link>
    <pubDate>Mon, 18 May 2009 18:49:52 GMT</pubDate>
    <description>&amp;gt;&amp;gt;МОЖЕТ!!! Да может же! &lt;br&gt;&amp;gt;&lt;br&gt;&amp;gt;А проверки характерные для managed кода куда денутся?Испарятся? &lt;br&gt;&amp;gt;&lt;br&gt;&lt;br&gt;На численных алгоритмах все обычно без managed проверок идет (их еще компилятор удаляет, до jit даже не доходят). А основное время как раз числодробилки и занимают.&lt;br&gt;&lt;br&gt;&amp;gt;&#091;оверквотинг удален&#093;&lt;br&gt;&amp;gt;&lt;br&gt;&amp;gt;&amp;gt;JIT может автоматически распараллеливать циклы на многопроцессорных машинах. &lt;br&gt;&amp;gt;&lt;br&gt;&amp;gt;Это не только JIT может.И?Кстати а что если сишники-сиплюсплюсники тоже отпрофилируют и &lt;br&gt;&amp;gt;заинлайнят?Они то с включенным мозгом могут это и получше безмозглой железяки &lt;br&gt;&amp;gt;сделать в принципе.Или вообще читерство: мелкий кус на асме оптимизнуть.Вон кодеки-когда &lt;br&gt;&amp;gt;скорости мало - програмеры творят чудеса.&lt;br&gt;&amp;gt;А так - у меня есть H.264 файлик который мой процессор еле-еле &lt;br&gt;&amp;gt;декодирует в реалтайме юзая x264 (с его си+асм вставками).А давайте вы &lt;br&gt;&amp;gt;его на яве натянете?&lt;br&gt;&lt;br&gt;А ведь никто не спорил что руки творят чудеса. Да, включив мозг можно побить и сишный компилер и jit, но мы вроде речь ведем про обычную написанную программу.&lt;br&gt;&lt;br&gt;Но уверен </description>
</item>

<item>
    <title>Hadoop установил новый мировой рекорд (Аноним)</title>
    <link>https://opennet.ru/openforum/vsluhforumID3/54454.html#59</link>
    <pubDate>Mon, 18 May 2009 18:01:17 GMT</pubDate>
    <description>&lt;br&gt;&amp;gt;А потому что JIT оптимизирует код под конкретный процессор с конкретной величиной &lt;br&gt;&amp;gt;кеша и набором команд, а не под сферического коня в вакууме &lt;br&gt;&amp;gt;как делает это Си компилятор. &lt;br&gt;&lt;br&gt;-march и про остальные опции вы, видимо, не слыхали.&lt;br&gt;&lt;br&gt;&amp;gt;А также JIT например ничего не мешает профилировать методы на лету, инлайнить &lt;br&gt;&amp;gt;наиболее часто выполняющиеся, а не все и т.п. &lt;br&gt;&lt;br&gt;Любая профилировка - огромные накладные расходы, так что такую статистику собирать не станут, а заинлайнят согласно статическому анализу - как в С,  так и jit.&lt;br&gt;&lt;br&gt;&amp;gt;JIT может автоматически распараллеливать циклы на многопроцессорных машинах. И отрыв от Си &lt;br&gt;&amp;gt;все дальше и дальше. &lt;br&gt;&lt;br&gt;Вообще-то это умеет и gcc, о чем вы снова не слыхали. Что такое openmp, знаете? В 4.4 есть то же самое, но &quot;на лету&quot;.&lt;br&gt;&lt;br&gt;&amp;gt;Зная runtime информацию можно сгенерировать более оптимальный код нежели не зная ее. &lt;br&gt;&lt;br&gt;Конечно, так вас и допустят профилировать реальные процессы. А тестовый код, да, отпрофайлят на ура, только потом эту информацию никак не подсунуть jit с реально</description>
</item>

</channel>
</rss>
