Система хранения данных Сбера

Продукт
Разработчики: Сбербанк-Технологии (СберТех)
Отрасли: Финансовые услуги, инвестиции и аудит
Технологии: СХД

Как выяснил TAdviser, Сбербанк разрабатывает собственную СХД. Информация об этом содержится в ряде вакансий Сбербанка, опубликованных в октябре 2023 года на его сайте и на рекрутинговом портале HH. Речь идёт о «распределённой, отказоустойчивой, высоконагруженной программно-определяемой СХД».

«
Проект собственной системы хранения данных для Сбербанка – это амбициозная задача по созданию СХД из лучших мировых практик. Сложность уровня Big Enterprise, масштабируемость уровня Google, скорость на уровне современных суперкомпьютеров, – говорится в описании проекта по разработке.
»

Там же, в вакансиях, указано, что проект абсолютно новый, с полным отсутствием legacy, и полностью обеспечен «современным высокотехнологическим железом».

В Сбербанке ведётся амбициозный проект по созданию СХД «из лучших мировых практик» (фото: Вячеслав Прокофьев / ТАСС)

В обязанности разработчика С/C++, в частности, которого Сбербанк подыскивал под проект, входит разработка СХД, проектирование и разработка протоколов взаимодействия узлов кластера между собой, написание модулей СХД и вспомогательного ПО (мониторинг, автотесты и проч.), а также написание кода в ultra low latency стиле, с микросекундными задержками[1].

В Сбербанке предпочли не раскрывать детали этого проекта, в том числе, какое «железо» в нём применяется.

Не исключено, что в проекте может использоваться «железо» и экспертиза компании «Элпитех», которую в конце 2022 года приобрела ООО «Салютдевайсы» (до мая 2022-го она называлась «Сбердевайсы», SberDevices). Портфель «Элпитех» включает в себя, том числе, серверы, СХД. На сайте компании говорится, что одно из её продуктовых направлений – разработка и производство универсального и «блейд» серверов собственной торговой марки для применения в создании высокопроизводительных вычислительных кластеров, а также заявлены услуги в области HPC. В её команде присутствуют бывшие инженеры и архитекторы обанкротившегося производителя суперкомпьютеров «Т-Платформы», и возглавляет её выходец из «Т-Платформы» – Александр Грищенков. Игорь Лейпи, ГК Softline: Объем поставок российских операционных систем в ближайшие годы увеличится как минимум вдвое 2.6 т

Правда, в январе 2023 года в Сбербанке заявляли изданию CNews, что SberDevices больше не входит в группу Сбербанка в результате некой сделки[2]. Вместе с тем, в вакансиях банка сейчас можно видеть набор персонала в SberDevices – «департамент SberDevices в Сбербанке»[3]. И интернет-магазин ООО «Салютдевайсы» по состоянию на октябрь 2023 года продолжает работать под брендом SberDevices.

Сейчас в Сбербанке применяется широкий портфель высокопроизводительных СХД зарубежных производителей. От главного эксперта СХД для стека HPC в подразделении SberInfra, обеспечивающем базис инфраструктурного развития экосистемы банка, требуется опыт работы с вендорскими решениями Dell EMC, NetApp, Huawei, Hitachi, HPE, Pure Storage[4]. При этом Сбербанк заинтересован в поиске перспективных решений и разработок в области СХД.

Отметим, что в Сбербанке уже не первый год ведётся много собственных разработок в области хранения и обработки данных. Одна из наиболее известных – SberData Platform (SDP), которая представляет собой набор интегрированных сервисов работы с данными[5]. По заявлению разработчиков, она позволяет упростить развертывание и настройку сервисов работы с данными, сократить время на создание решений для работы с большими данными. В основе платформы – собственные разработки, а также инструменты на основе свободно распространяемого ПО.

Также, к примеру, банк ведёт разработку собственных СУБД с использованием различных open source технологий. Одна из них – собственная сборка Сбербанка на базе Greenplum. Перед командой стояли амбициозные цели построить «уникальную в мировом масштабе инфраструктуру по хранению и обработке данных» на основе этой СУБД. Отличительная особенность собственной сборки – возможность обработки огромных массивов данных объёмом более 1 ПБ одновременно большим количеством пользователей.

Примечания



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ITglobal.com (ИТглобалком Рус) (35)
  Рэйдикс (Raidix) (35)
  R-Style Softlab (Эр-Стайл Софтлаб) (27)
  BeringPro (БерингПойнт) ранее BearingPoint Russia (26)
  Сапран (Saprun) (22)
  Другие (529)

  Сапиенс солюшнс (Sapiens solutions) (7)
  ITglobal.com (ИТглобалком Рус) (6)
  Aerodisk (Аеро Диск) (4)
  Крикунов и Партнеры Бизнес Системы (КПБС, KPBS, Krikunov & Partners Business Systems) (3)
  BeringPro (БерингПойнт) ранее BearingPoint Russia (3)
  Другие (30)

  ActiveCloud by Softline (АктивХост РУ) (1)
  Aerodisk (Аеро Диск) (1)
  Hewlett Packard Enterprise (HPE) (1)
  ITglobal.com (ИТглобалком Рус) (1)
  Аквариус (Aquarius) (1)
  Другие (8)

  Киберпротект (ранее Акронис-Инфозащита, Acronis-Infoprotect) (3)
  Arenadata (Аренадата Софтвер) (1)
  Axenix (ранее Аксенчер Россия) Аксеникс (1)
  Beeline Cloud (DataFort) (1)
  Cloud4Y (ООО Флекс) (1)
  Другие (6)

  ITglobal.com (ИТглобалком Рус) (1)
  Lenovo (1)
  X-Com (Икс ком) (1)
  КНС Групп (Yadro) (1)
  Другие (0)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  SAP SE (1, 101)
  NetApp (25, 66)
  Рэйдикс (Raidix) (19, 50)
  IBM (30, 43)
  Dell EMC (68, 32)
  Другие (678, 337)

  SAP SE (1, 8)
  NetApp (5, 7)
  Aerodisk (Аеро Диск) (5, 6)
  Lenovo (1, 6)
  Lenovo Data Center Group (1, 6)
  Другие (18, 19)

  Aerodisk (Аеро Диск) (3, 2)
  ActiveCloud by Softline (АктивХост РУ) (1, 1)
  Dell EMC (1, 1)
  Lenovo (1, 1)
  Microsoft (1, 1)
  Другие (6, 6)

  Киберпротект (ранее Акронис-Инфозащита, Acronis-Infoprotect) (1, 3)
  Arenadata (Аренадата Софтвер) (1, 1)
  Lenovo (1, 1)
  ВымпелКом ПАО (1, 1)
  КНС Групп (Yadro) (1, 1)
  Другие (3, 3)

  Synology (SLMP PTE) (1, 1)
  NetApp (1, 1)
  КНС Групп (Yadro) (1, 1)
  Другие (0, 0)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  SAP NetWeaver Business Warehouse (SAP BW/4HANA) - 101
  NetApp FASx - 45
  Raidix СХД - 45
  RS-DataHouse - 24
  Lenovo ThinkSystem - 17
  Другие 348

  SAP NetWeaver Business Warehouse (SAP BW/4HANA) - 8
  Lenovo ThinkSystem - 6
  Аэродиск Восток СХД - 3
  IBM FlashSystem - 3
  NetApp FASx - 3
  Другие 23

  RT.Datalake Решение для хранения и обработки данных любых объемов - 1
  Yadro платформа хранения данных Tatlin - 1
  Microsoft Azure Data Lake - 1
  HPE Apollo 4000 Серверы - 1
  Aerodisk vAIR - 1
  Другие 7

  Кибер Инфраструктура (ранее Acronis Инфраструктура) - 3
  Yadro платформа хранения данных Tatlin - 1
  Lenovo ThinkSystem - 1
  EDP - Arenadata Enterprise Data Platform - 1
  SharxBase - 1
  Другие 2

  NetApp FASx - 1
  Yadro платформа хранения данных Tatlin - 1
  Synology NAS - DiskStation Manager - 1
  Другие 0