TATLIN.BACKUP: российская СХД для резервного копирования
Российский производитель ИТ-оборудования Компания YADRO представила новую систему хранения данных (СХД) TATLIN.BACKUP, предназначенную для резервного копирования и восстановления данных в среднем и крупном бизнесе. Резервное копирование и восстановление — один из важнейших элементов стратегии информационной безопасности и защиты данных для любой организации. После ухода из России зарубежных производителей СХД и разработчиков систем резервного копирования интерес отечественных заказчиков к этому сегменту значительно возрос.
Новая СХД TATLIN.BACKUP представляет собой эффективное решение, которое обеспечивает защиту данных и непрерывность рабочих процессов. Система обеспечивает построение E2E-интегрированного решения на базе продуктов отечественных компаний для защиты данных от сбоев и киберугроз.
Ключевой особенностью TATLIN.BACKUP является многопоточная дедупликация «на лету» блоками переменной длины. Расскажем поподробнее об этой технологии. Процесс дедупликации выполняется параллельно в нескольких потоках, что позволяет ускорить обработку больших объемов данных за счет задействования нескольких ядер процессора.
Благодаря использованию алгоритма Content Defined Chunking данные разбиваются на блоки переменной длины, что позволяет существенно сократить объем хранения. Кроме того, применяется online-дедупликация, идентифицирующая уже имеющиеся данные без обращения к HDD дискам. В отличие от дедупликации фиксированными блоками, использование блоков переменной длины позволяет разбить данные на блоки разного размера. Границы блоков определяются на основе содержимого данных, например, с помощью алгоритмов хеширования с раздвижными окнами (sliding window). Это позволяет более эффективно находить дубликаты при изменениях в данных. После разбиения данных на блоки, система сохраняет только один экземпляр каждого уникального блока. Для всех остальных копий блока вместо самих данных сохраняются только ссылки на сохраненный блок. Это позволяет существенно сократить объем хранимых данных. При необходимости доступа к данным, система собирает исходный файл или объект из сохраненных уникальных блоков по ссылкам.
Многопоточная дедупликация блоками переменной длины часто применяется в системах резервного копирования, хранилищах данных, облачных сервисах для экономии дискового пространства и повышения эффективности хранения и передачи данных. Она позволяет находить и устранять дубликаты как внутри отдельных файлов, так и между разными файлами и версиями данных. В целом, эта технология повышает производительность и масштабируемость системы.
Пока на рынке представлена первая модель линейки — TATLIN.BACKUP.M. Она состоит из одного контроллера с дисками и от 1 до 4 полок расширения, обеспечивая максимальный объем хранения до 690 Tbu. Решение предоставляет широкие возможности по расширению инфраструктуры заказчика, работе с любым ПО для резервного копирования и построению референсных архитектур.
ТATLIN.BACKUP обеспечивает беспрецедентный уровень защиты данных с помощью различных инструментов. Помимо классических механизмов, таких как технологии RAID, применяются дополнительные инструменты — копирование при записи (Copy-on-Write), защита корректности записей (T10 PI), упреждающая журнализация, проверка целостности записанных данных и собственный алгоритм T-RAID со схемой защиты 10+2. Копирование при записи (Copy-on-Write, COW) — это техника, используемая для оптимизации операций копирования и повышения эффективности использования дискового пространства. При создании копии (например, снэпшота или клона) данных, СХД на самом деле не копирует все данные физически, а создает новую логическую ссылку, указывающую на те же самые блоки данных на диске. Таким образом, копия и оригинал продолжают совместно использовать неизмененные блоки, а для измененных данных у каждого из них появляются свои собственные физические блоки. Это способствует безопасности данных, поскольку процесс копирования блоков при записи происходит прозрачно для приложений и пользователей, на уровне СХД. Защита корректности записей (T10 PI, или T10 Protection Information) — это технология для обеспечения целостности данных. Основная цель T10 PI — предотвратить незамеченные ошибки при передаче данных между узлами СХД, такими как диски, контроллеры, коммутаторы и т.д. Для этого к каждому блоку данных добавляется специальный контрольный код (тег), который вычисляется на основе самих данных. Когда данные перемещаются между узлами, принимающий узел пересчитывает контрольный код и сравнивает его с полученным тегом. Если они не совпадают, это означает, что данные были повреждены при передаче, и узел может запросить повторную передачу или предпринять другие действия.
Исходные и копируемые данные изначально совместно используют одни и те же физические блоки на диске. Это позволяет быстро создавать копии, экономя дисковое пространство.
Для защиты данных при сбоях в TATLIN.BACKUP используется техника упреждающей журнализации (Write-Ahead Logging, WAL), при которой информация об изменениях вносится в журнал предзаписи и фиксируется перед записью. Поскольку все изменения сначала записываются в WAL, можно восстановить все операции до момента последней записи в журнал, даже если произойдет сбой. Так как запись ведется сначала в журнал, который обычно оптимизирован для быстрой записи, общее время выполнения транзакций может быть сокращено. Техника упреждающей журнализации широко применяется не только в базах данных, но и в файловых системах, таких как NTFS и ext4, где она также играет ключевую роль в обеспечении целостности данных.
Еще одна технология, гарантирующая, что данные будут не только надежно сохранены в виде резервной копии, но и что из бэкапа можно будет их легко восстановить, является верификация. Верификация записи end-to-end (end-to-end data verification) в системах хранения данных — это процесс, при котором данные проверяются на целостность на всем пути от источника до конечного места хранения.
Еще одно преимущество TATLIN.BACKUP — это механизм передачи уникальных данных из источника T-Boost, оригинальная разработка инженеров YADRO. Это решение расширяет возможности систем TATLIN.BACKUP и кратно повышает скорость передачи данных, снижая нагрузку на сеть, что крайне важно для корпоративных заказчиков.
Бэкап и восстановление виртуальных машин являются критически важными аспектами управления ИТ-инфраструктурой, обеспечивая защиту данных, устойчивость бизнеса и оптимизацию ресурсов. Новая СХД позволяет восстанавливать одну, несколько или все виртуальные машины на других серверах при недоступности основной инфраструктуры или необходимости тестирования.
Итак, основными преимуществами для бизнеса новой СХД от компании YADRO можно назвать, во-первых, эффективное сжатие данных с помощью механизмов дедупликации и компрессии, во-вторых, разнообразные механизмы защиты хранения данных и ноу-хау компании YADRO (верификация записи end-to-end, аудит хранения и др.), а также соблюдение целевых показателей времени (RTO) и точки (RPO) восстановления данных.
Таким образом, TATLIN.BACKUP от YADRO представляет собой современное импортонезависимое и санкционно устойчивое решение для резервного копирования и восстановления данных, способное с успехом заменить продукты иностранных производителей, соответствующее современным требованиям скорости, отказоустойчивости и безопасности.