ИМ СО РАН
Вход для сотрудников

Суперкомпьютер

ВСВ «Сергей Годунов»

ВСВ Сергей ГодуновВысокопроизводительная система вычислений (ВСВ, суперкомпьютер) - это сложный технический объект с развитой инженерной инфраструктурой. Система жидкостного охлаждения обеспечивает высокую энергоэффективность. ВСВ применяются в математике для решения сложных вычислительных задач, таких как моделирование физических систем, поиск простых чисел, анализ статистических данных и оптимизация процессов.

Суперкомпьютер ориентирован на выполнение государственных заданий и доступен для аренды машинного времени для решения задач, связанных с грантовыми проектами.

Высокопроизводительная система вычислений с общей пиковой производительностью 114,67 ТФлопс состоит из 13 двухпроцессорных (Intel Xeon Platinum 8368) вычислительных узлов РСК Торнадо TDN711 - кластер с пиковой производительностью 75,87 Тфлопс, и одного вычислительного узла с GPU на 4 графических ускорителях Nvidia A100 80 Gb с пиковой производительностью 38,8 Тфлопс. Они соединены между собой высокоскоростной коммуникационной сетью InfinBand 200 Гбит/с. Суперкомпьютер обладает высочайшей производительностью и эффективностью, что делает его идеальным инструментом для выполнения сложных вычислительных задач.

Принцип работы суперкомпьютера из кластеров на CPU с использованием системы управления заданиями Slurm включает организацию выполнения задач и управление доступом к ресурсам компьютерного кластера. Slurm (Simple Linux Utility for Resource Management) предоставляет функциональность для планирования, выделения ресурсов и мониторинга задач на кластере. Когда пользователь отправляет задание на суперкомпьютер, Slurm принимает эти задания, распределяет их между вычислительными узлами кластера на CPU с учетом доступной вычислительной мощности и приоритетов задач. Очередность выполнения заданий определяется в соответствии с их приоритетами, ресурсами и доступностью узлов. Slurm также управляет процессом запуска вычислительных задач, контролирует их выполнение, а также обеспечивает мониторинг использования ресурсов. Эта система позволяет эффективно использовать мощности суперкомпьютера, обеспечивая оптимальное распределение задач и управление их выполнением. Таким образом, принцип работы суперкомпьютера из кластеров на CPU с очередностью Slurm включает централизованное управление и координацию задач, обеспечивая оптимальное использование ресурсов кластера и выполнение задач в соответствии с их приоритетами.

Перечень оборудования

Вычислительный узел с ГПУ RSC BS R208L

Процессор Xeon Gold 6342 2 шт.
Частота 2,8 ГГц  
Кэш-память 36 МБ  
Ядра 24  
Память 1024 Гбайт DDR4 3200 ECC Reg. DIMM 16x64Gb
Тип графических ускорителей NVIDIA Tesla A100 PCIe Gen4, 80 ГБ 4 шт
Подсистема хранения данных SSD NVMe 2,5” 3,2 тбайт 2 шт
Производитель RSC  

 

 

Сервер визуализации с ГП RSC BS R212L

Процессор Intel Xeon Platinum 8368 2 шт.
Частота 2.40 ГГц  
Кэш-память 57 Мбайт  
Ядра 38  
Память 4096 Гбайт DDR4 3200 ECC Reg. DIMM 32x128 GB
Тип графических ускорителей NVIDIA RTX 5000 Ada PCIe Gen3, 32 ГБ 2 шт
Подсистема хранения данных SSD NVMe 2,5” 3,84 тбайт 2 шт
Производитель RSC  

 

Вычислительный узел РСК Торнадо TDN711 (13 шт)

Процессор Intel Xeon Platinum 8368 2 шт.
Частота 2.40 ГГц  
Кэш-память 57 Мбайт  
Ядра 38  
Память 512 Гбайт DDR4 3200 ECC Reg. DIMM 16x32 GB
Подсистема хранения данных 960 Гбайт SSD NVMe M.2 1 шт
Производитель RSC  

 

Система хранения данных

Процессор Intel Xeon Gold 6334 2 шт.
Частота 3.60 ГГц  
Кэш-память 18 Мбайт  
Ядра 8  
Память 256 Гбайт DDR4 3200 ECC Reg. DIMM 16x16 GB
Подсистема хранения данных 18 тбайт HDD SAS 7200 24 шт
Производитель RSC  

 

Прейскурант
Название Описание Количество Услуга Стоимость 1 часа в руб.
Вычислительный узел РСК Торнадо TDN711 Процессор Intel Xeon Platinum 8368 (2,4 ГГц, 38 ядер, кэш 57 Мбайт) - 2 шт.
– Память DDR4 Registered ECC DIMM, 512 Гбайт
– Диск SSD NVMe 512 Гбайт
Совокупная пиковая производительность вычислительных узлов (ВУ), поставляемых в составе комплекта оборудования, должна быть не менее 35 Тфлопс.
13 шт. Предоставление 1 узла вычислительных мощностей 390.00
Вычислительный узел с ГПУ RSC BS R208L Процессор Intel Xeon Gold 6342 (2,8 ГГц, 24 ядра, кэш 36 Мбайт) – 2 шт.
– Память DDR4 Registered ECC DIMM, 1024 Гбайт
– Диск SSD NVMe 3,2 тбайт - 2 шт.
– Графический ускоритель NVidia A100 PCI Express 80GB – 4 шт.
Суммарная пиковая производительность ГПУ поставляемого вычислительного узла с ГПУ должна быть не менее 19,4 Тфлопс.
1 шт. Предоставление вычислительных мощностей 1050.00
Сервер визуализации с ГП RSC BS R212L Процессор Intel Xeon Platinum 8368 (2,40 ГГц, 38 ядер, кэш 57 Мбайт) – 2 шт.
– Память 4096 Гбайт DDR4 3200 ECC Reg. DIMM, 32x128 GB
– SSD NVMe 2,5” 3,84 тбайт - 2 шт.
– Графический ускоритель NVIDIA RTX 5000 Ada PCIe Gen3, 32 ГБ – 2 шт.
1 шт. Предоставление вычислительных мощностей 590.00

 

Методики измерений
В настоящее время не существует общепринятых подходов к измерению характеристик параллельных приложений и вычислительных систем из-за динамики работы и специфики параллельных вычислений, что затрудняет получение точных и надежных данных о производительности.