Добрый день, уважаемые форумчане!Пол года назад на специализированном форуме по молекулярной биологии в ветке биофизика/матметоды решил обсудить конфигурацию ПК для моделирования структуры и динамики белка (GROMACS 4.5, на CUDA), а так же докинга (AutoDoc)низкомолекулярных соединений к белку.
Но вместо обсуждения получился монолог.
Очень прошу прокомментировать и обсудить, так как возможно для этой цели буду брать/собирать БУ сервер с необходимыми видеокартами. Об этом ниже.
******
GROMACS 4.5 и выше на CUDA
Для вычеслений необходимо, чтобы видеокарта обладала широкой шиной данных ( от 380 бит и больше), большим количеством шейдеров (от 512), высокой тактовой частотой памяти и ядра, большим объемом памяти с высокой частотой, но меньшим, чем для графики. Геймерские карты не подходят - у них 128 битные шины, это слишком узко. А у предназначенных для дизайна и графики - много памяти, но слабая вычислительная мощность. Видеокарты такого типа должны хорошо справляться с рассчетами преобразований Фурье, целочисленными операциями и вычислениями с плавающей запятой. Этим требованиям удовлетворяет EVGA GTX 580 (40nm) , архитектура Ферми или Коперник. Данный агрегат потребляет мощность в 600 Вт и требует установки дополнительного блока питания только для видеокарты, а так же надежной системы охлаждения, возможно водяной.
Работать она будет хорошо в архитектуре Intel Потребуется процессор Core i7, материнская плата Gigabyte, 8-16 Гб ОЗУ с частотой 2400 Мгц, блок питания для компьютера от 650 Вт, жесткий диск или SSD, дисковод и переферия - по усмотрению. ОС Linux Debian 9.4 x64.
Такая видеокарта, б.у. на eBay стоит вот столько - EVGA GTX 580 (590 USD - 740 USD - разные модификации новых карт с сайта производителя)
https://www.ebay.com/bhp/gtx-580
А вот ее модификации, с водяным охлаждением и увеличенным объемом памяти - https://3dnews.ru/610882
Тесты в GROMACS: http://www.gromacs.org/Downloads/Installation_Instructions/G...
Картинка http://www.gromacs.org/@api/deki/files/146/=gmx-4.5_DHF...
Как видим по тестам она превосходит более дорогую и новую Tesla, что связано с шириной шины, и уж подавно - вычисления на ЦП. Жалко, что GROMACS не поддерживает параллельные вычисления на двух видеокартах, или я ошибаюсь?
Цена такого проекта от 1500 USD до 2000 USD, это не дешево, но толька такая система способна тягаться с кластером и выдавать от 160 до 170 наносекунд динамики в GROMACS за 24 часа работы.
Экономически по цене и потребляемой электроэнергии это выгоднее, чем кластер из б.у. копьютеров.
Можно ли заниматься по тому же механизму докингом? Что для этого нужно? Какие еще программы можно выполнять в такой системе?
У кого какие мнения или советы по данной конфигурации и ПО?
Важный вопрос: Можно ли использовать не одну EVGA GTX580, а 2, в паре? Или ферму из четырех?
"понимает" ли это GROMACS - в поисковиках ответа не нашел...
***
Что касается наносекунд за 24 часа, то в рассмотренном примере 160 наносекунд были получены для белка с 2489 атомами в воде, общее количество атомов в системе 23569. В более простых задачах можно получить и 900 наносекунд за 24 часа.
А теперь что касается рассчетов на ЦП и объема оперативной памяти. Для физических расчетов использовали многоядерные процессоры и ОЗУ с большой частотой объемом 64 Гб. Оказалось, что не столько количество ядер, сколько частота ядер и памяти а так же ее объем оказались главным фактором, определяющим производительность системы. Т.е. вся задача должна быть в ОЗУ. На производительность влияют в таком порядке следующие факторы :
1. Maximum clock frequency
2. Maximum memory bandwidth/core
3. number of cores
Т.е. количество ядер конечно влияет, но не на первом месте.
Детальнее об этом по ссылке
https://www.comsol.ru/forum/thread/127801/cpu-comparison-for...
В принципе, в данных задачах использовался объем ОЗУ 10 Гб из 64 Гб. Исходя из этого лучше брать многоядерный Xeon чем Core i7. Это так же подтверждается тестом на GROMACS.
http://www.gromacs.org/@api/deki/files/146/=gmx-4.5_DHF...
*****
Подобрал такие конфигурации.
1. Масштабируемый мощный вариант.
Процессор - Intel Xeon E5-2630v2 x 1шт.
Материнская плата - Intel S2600CP
Охлаждение - Охлаждение - Башенное Performa + 3 корпусных вентилятора 120 мм
Оперативная память - 32Gb DDR3 ECC
Сеть - 2*1 Gbe LAN port
Управление - IPMI
Видеокарта - встроенная (возможно установить любую)
Жесткий диск - 1*2Tb
Блок питания - 1200W
Корпус - Vinga Titan
950 - 1000 USD без EVGA GTX 580
Память можно поставить максимум 1600 Gb, выше нет смысла процессор не понимает. Еще можно установить 1 дополнительный многоядерный многопоточный процессор Intel Xeon E5-2630v2 и дополнительные жесткие диски. Итого 1600 USD с EVGA GTX 580. Корпус компьютера позволяет организовать хорошее охлаждение и процессора и видеокарты.
2. Бюджетный вариант.
Socket 1151
1. Процессор Intel Core i3-7100 (BX80677I37100)
2. Мат плата Gigabyte GA-B250M-D3H
3. оперативная память TEAM 8 GB DDR4 2400 MHz (TPRD48G2400HC1601)
или Kingston DDR4-3000 8192MB PC4-24000 HyperX Predator Black (HX430C15PB3/8)
4. SSD/HDD Western Digital Red 1TB 5400rpm 64MB WD10EFRX 3.5 SATA III или
Kingston SSDNow A400 120 GB (SA400S37/120G)
5. БП Raidmax Cobra 1200W (RX-1200AE-B)
6. Корпус Vinga Titan или Zalman Z3 Black
7 кулер под процессор Deepcool Iceedge Mini FS V2.0 и еще несколько корпусных вентилятора 120 мм
Итого 480 USD без EVGA GTX 580, или 1100 USD с EVGA GTX 580.
У кого какие предложения, замечания , пожелания?
********
Кстати, вот сравнение видеокарт, где Radeon RX Vega 64 демонстирует лучшие характеристики по сравнению с EVGA GTX 580. (шина 2048 бит и 4096 унифицированных шейдерных блока).
https://www.overclockers.ua/video/gpu/compare/452-280-353-28.../
********
Для проведения докинга низкомолекулярных соединений (ингибиторов к ферментам, например), используют программу Autodock.
Ее последняя модификация Vina: http://vina.scripps.edu/
Сравнение Autodock 4 vs Vina:
https://www.researchgate.net/post/What_is_the_major_differen...
https://www.researchgate.net/post/Is_the_AutoDock_Vina_the_b...
Сравнение на примере ингибитора фермента протеазы ВИЧ:
https://journals.plos.org/plosone/article?id=10.1371/journal...
Технические требования к ПК/кластеру:
http://vina.scripps.edu/manual.html
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4801993/
Автоконфигурируемая система MOLA:
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2987878/
Я так понял, мне хватит 4-8 ядерного Xeon желательно с гипертрейдингом?
Или серверной материнки с двумя ксеонами?
Стоит ли брать отдельно ПК для структуры и динамики на CUDA, отдельно для докинга? Или можно совместить?
Докинг можно выполнять только на ЦП, на двух ЦП, на кластере, а на видеокарте через CUDA нельзя?
*********
Извиняюсь за ДЛИННОПОСТ и МНОГОБУКФ, но вопрос стоит остро и требует компетентного обсуждения...
Буду признателен за любую помощь.