Заказчики: Сколтех (Сколковский институт науки и технологий, Skoltech) Подрядчики: Lenovo Россия Продукт: Lenovo ThinkSystemДата проекта: 2020/12 — 2021/04
|
Технология: Серверные платформы
Технология: Центры обработки данных - технологии для ЦОД
|
30 июня 2021 года компания Lenovo сообщила о том, что ее подразделение Infrastructure Solutions Group (Lenovo ISG) предоставило серверы для вычислительного кластера Сколковского института науки и технологий (Сколтех). Серверы Lenovo ThinkSystem SD530 легли в основу 60-узловой системы для реализации метода компьютерного предсказания кристаллических структур. Этот метод компьютерного предсказания кристаллических структур USPEX был разработан в Лаборатории компьютерного дизайна материалов под руководством профессора Артема Оганова. Помимо структур кристаллов, USPEX дает возможность предсказывать структуры низкоразмерных материалов: наночастиц, полимеров, поверхностей, межзеренных границ и 2D-кристаллов.
Для выполнения этих задач требовался нестандартный суперкомпьютерный центр, который позволяет решать большое число распараллеливаемых задач. На каждую структуру требуется 4–5 стадий расчетов. Каждый расчет — это примерно 8 тыс. задач. А каждый из 25–30 пользователей системы проводит десятки таких расчетов ежемесячно.
Соответственно, основной проблемой было максимизировать число ядер и производительность системы для большого числа коротких задач. При проектировании кластера нужно было получить максимальное число ядер при минимизации бюджета. Для решения этих задач были выбраны серверы Lenovo ThinkSystem SD530.
Разработчикам системы удалось сэкономить на интерконнекте: внутри узла коммуникации между ядрами осуществляются очень быстро, однако скорость обмена данными между узлами была средняя. Определенную экономию дало и ограничение объема оперативной памяти. Те немногие задачи лаборатории, которые требуют большой емкости памяти, решаются на общеинститутском кластере и на суперкомпьютерах Академии наук и Нижегородского университета.
Сервер Lenovo ThinkSystem SD530 содержит до двух процессоров Intel Xeon на узел, ОЗУ емкостью до 2,75TB при использовании Intel Optane DC Persistent Memory, до 24 накопителей SFF SAS\SATA отсеков Hot Swap — по шесть на узел. Шасси в корпусе 2U предназначено для установки в стойку и включает в себя четыре независимых вычислительных узла с возможностью использования графических ускорителей.Помощник или конкурент? Чем ИИ может быть полезен в HR-процессах
Каждый узел ThinkSystem SD530 состоит из модульного шасси D2 высотой 2U, в который устанавливаются до четырех серверных модулей SD530. Каждый сервер содержит два процессора семейства Intel Xeon Processor Scalable. Благодаря поддержке модулей с GPU, а также модуля системы жидкостного охлаждения Lenovo Neptune Thermal Transfer Module сервер можно адаптировать к требованиям разных рабочих нагрузок.
Модули энергонезависимой памяти Intel Optane DC Persistent Memory позволяют создать универсальный уровень хранения данных, предназначенный для поддержки ресурсоемких рабочих нагрузок. Они дают возможность значительно увеличить ёмкость памяти сервера, уменьшить задержки и значительно повысить производительность ввода-вывода в IOPS.
ThinkSystem SD530 также поддерживает платформу LiCO, которая облегчает управление рабочими нагрузками и ресурсами кластера, связанными c высокопроизводительными вычислениями и искусственным интеллектом.
Команде HPC Team Сколтеха, строившей и тюнинговавшей данный кластер, совместно со специалистами Professional Services Lenovo и при поддержке инженеров Intel Performance Application удалось добиться высокой производительности системы с интерконнектом 10Gbps Ethernet, что повлияло на возможности вычислений на кластере — исследователи могут быстрее получать результаты расчетов новых материалов.
Используемое лабораторией программное обеспечение оптимизировано для многоядерных процессоров, дополнительно оптимизация достигается на этапе компиляции софта. Кроме того, при установке системы инженеры Lenovo оптимизировали производительность аппаратной платформы.
"Решение наших задач требует большого числа быстрых вычислительных ядер. Они очень хорошо распараллеливаются по 32 процессорным ядрам. Дальнейшее
масштабирование ведет к потерям. И таких задач у нас очень много, каждая задача включает в себя множество небольших расчетов, занимающих 2–4 часа», - отметил Артем Оганов. |
В лаборатории продолжают заниматься высокотемпературной сверхпроводимостью, и ряд высокотемпературных сверхпроводников были предсказаны ее исследователями и получены экспериментально. В числе результатов — гидрид тория, гидрид иттрия и ряд других соединений. Ученые также активно занимаются термоэлектрическими материалами. Они создали свою программу для расчета термоэлектрических свойств, и уже есть интересные результаты. Сейчас в разработке несколько материалов, для которых они уточняют теоретические предсказания, изучая фазы высокого давления и т. д. Нужные для этого инструменты постоянно совершенствуются.