Компания Intel передала (https://lists.freedesktop.org/archives/mesa-dev/2016-Februar...) разработчикам проекта Mesa набор патчей с реализацией нового высокопроизводительного программного растеризатора OpenSWR (http://openswr.org/), предоставляющего средства для программной отрисовки OpenGL силами центрального процессора, без привлечения GPU. OpenSWR может рассматриваться как программный GPU, который поддерживает OpenGL 3.3 и способен работать на широком спектре потребительских и серверных устройств. Наработки проекта OpenSWR распространяются (https://github.com/OpenSWR/openswr-mesa) под лицензией MIT.
При отрисовке сцен со сложной геометрией OpenSWR обеспечивает (http://openswr.org/perf.html) существенный прирост производительности по сравнению с ныне предлагаемым в Mesa однопоточным растеризатором llvmpipe. Например, при расчёте сцены из 2.9 млн треугольников OpenSWR обгоняет llvmpipe по производительности в 29 раз, а на сцене из 106.2 млн треугольников - в 51 раз. Подобной производительности удалось добиться за счёт эффективного распараллеливания операций на многоядерных процессорах (операции отрисовки разбиваются на части для параллельной обработки вершин), применения JIT-компиляции шейдеров и задействования специализированных векторных наборов инструкций, таких как SSE (Streaming SIMD Extensions), AVX и AVX2 (Advanced Vector Extensions).OpenSWR создан в рамках проекта визуализации научных расчётов Software Defined Visualization (http://sdvis.org/) (SDVis) как механизм визуализации в крупных кластерах, не укомплектованных GPU, но используемых для работы с очень большими геометрическими моделями. В рамках проекта SDVis также развиваются библиотека трассировки лучей Embree (https://embree.github.io/), система фотореалистичной отрисовки GLuRay (https://tacc.github.io/GLuRay/), ParaView-плагин pvOSPRay (https://tacc.github.io/pvOSPRay/) и распределённая инфраструктура трассировки лучей OSPRay (https://ospray.github.io/).
URL: https://lists.freedesktop.org/archives/mesa-dev/2016-Februar...
Новость: http://www.opennet.dev/opennews/art.shtml?num=43899
то есть для визуализации данных, полученных на суперкомпах, им оказалось проще написать патчи для Меса, которые будут напрягать один из центральных процессоров (или ВСЕ вообще) не целевой нагрузкой, чем установить ОДНУ видяшку на весь суперкомп и через нее визуализацию гонять? Я правильно понял?
нет. это значит что при равных задачах llvm слился gcc в большое количество раз
Откуда тут такой мозговитый регистрант? Немедля баньте его, пока он ещё что-нибудь толковое не сказал
gcc головного мозга же
нет. это значит что при равных задачах 8 800 2000 600
нет
Это значит, что задача *визуализации* (не отображения) не укладывается в "ОДНУ видяшку".
Круто, на виртуалках Ubuntu графическое окружение отрисовывается через llvmpipe, тормозит. Может в будущем не будет :)
Может, стоит запихнуть туда окружение, которое без OpenGL обходится? Ну там, LXDE какой, или вообще без DE?
А как же тогда мы на "суперкомпе" увидим и услышем суперсвист и суперпердёжь?!? :D
Слишком простое решение, не подходит
> Например, при расчёте сцены из 2.9 млн треугольников OpenSWR обгоняет llvmpipe по производительности в 29 раз, а на сцене из 106.2 млн треугольников - в 51 раз.В тексте новости стоило бы отметить, что делается это на довольно таки многоядерной машине:
> Intel® Xeon® E5-2699 v3 Processor, 2 x 18 cores, 2.3GHz
36 ядер, в каждом 2 гипертреда, и обгоняет однопоточный llvmpipe в 29 раз. Ну ладно.
Было бы странно, если Интел не сделала бы такой софт, использущий возможности своих процессоров. Не зря же они клевают этих гиперядерных монстров
36 ядер сделало в 29 раз быстрее то, что сделало одно ядро... "ну, ладно... v.2.0"
Так при наличии 36 ядер хотелось бы в 29 раз быстрее, а не "одно ядро". Так что win.
> 36 ядер сделало в 29 раз быстрее то, что сделало одно ядро...
> "ну, ладно... v.2.0"ну так даж при 2 ядрах грубо 2*(29/36)=1,6
норм будет, а у многих и 4 ядра
не совсем. но в целом, да AVX2 и AVX3 код - паралелится лучше SSE3/4 ощутимо.
а еще - новые процы у них - SIMD/FPU имеют 512-битный !!! то есть в AVX3 потенциально ВДВОЕ быстрее !! что "дочига", в общем-то )
Когда загружены все мультимедийные вычислительные блоки о HT можно забыть.
> Когда загружены все мультимедийные вычислительные блоки о HT можно забыть.Вам так кажется. На самом деле, мультимедийные блоки далеко не всегда полностью нагружены даже в числодробильном коде, да и помимо вычислений есть работа.
>36 ядер, в каждом 2 гипертреда, и обгоняет однопоточный llvmpipe в 29 раз. Ну ладно.А что быстрее, такая программная отрисовка или Nvidia GTX980 ?
> при расчёте сцены из 2.9 млн треугольников OpenSWR обгоняет llvmpipe по производительности в 29 раз, а на сцене из 106.2 млн треугольников - в 51 раз. Подобной производительности удалось добиться за счёт эффективного распараллеливания операций на многоядерных процессорах ...Вовремя подоспело. С момента начала выпуска многоядерных процессоров прошло всего каких-то 10 лет. Но лучше поздно, чем никогда. :)
> многоядерных процессоровДо сих пор в тренде двухядерный формат, и интел не собирается его списывать
>в тренде двухядерный форматНа барахолках? Наверное, не знаю. Тебе, как спецу, виднее.
> SSE (Streaming SIMD Extensions), AVX и AVX2 (Advanced Vector Extensions)какой хитрый vendor-lock, главное — никто и не догадается
В предыдущей новости говорилось о том, что AVX2 отключается, так что и на многих AMD-шных тоже должно работать.
AVX уже поддерживается в процах от AMD, а AVX2 на подходе.
Ну да, о том и речь. В предыдущей новости было сказано, что поддержка AVX в CPU обязательна, а AVX2 — опциональна. Так что на AMD CPU с поддержкой AVX тоже должно работать.
Intel никогда не умела полноценный GPU. Это не обсуждается.Для вытеснения присутствия NVIDIA в Linux протащила KMS. AMD прочувствовала фишку и, заглотнув наживку, уцепилась за модный Gallium и реализовала графический стек рендеринга на основе LLVM.
Внезапно оказалось, что он однопоточный и не распараллеливается.
Наконец, Intel наносит сокрушительный удар, предлагая патчи для Mesa под свои ЦПУ.
AMD и тем более NVIDIA со своими медленными LLVM-решениями остались в дураках.
Конечно же, это всё касается открытых драйверов.
Nvidia – ССЗБ, AMD в гонке графических ускорителей всегда побеждала Intel и вряд ли уступит место, а ты ищешь лишний скрытый смысл./thread