Иван Новоселов, DataCatalog: Рынок требовал оперативного реагирования
Как обстоит ситуация с импортозамещением продуктов для управления данными (Data Governance)? Как прошел подобный проект в одном из крупнейших банков страны? Об этом и не только TAdviser рассказал Иван Новоселов, генеральный директор компании DataCatalog (входит в Группу Arenadata).
Насколько сложна миграция с зарубежного ПО в разрезе таких инструментов, как бизнес-глоссарии и каталог данных?
Иван Новоселов: Сложность любого импортозамещения заключается в том, что нужно поменять что-то привычное, к чему в том числе адаптированы процессы, методология и привыкли люди, на что-то незнакомое, что нужно изучать, к чему необходимо приспосабливаться. Импортозамещение развитого бизнес-глоссария сложно как методологически, так и с точки зрения пользовательского опыта, однако компании с ним успешно справляются. Как пример приведу кейс уходящего года, реализованный в одном из крупнейших банков России — ВТБ. ВТБ было важно получить российский продукт для ведения бизнес-глоссария, не уступающий в функциональности зарубежному решению и даже превосходящий его. Первым приоритетом для банка было удобство и скорость поиска информации о данных для пользователей, что упрощает адаптацию нового инструмента и повышает ценность практик управления данными. Глоссарий — ключевой компонент системы управления данными банка, обеспечивающий учет их объектов, их связей с владельцем данных, офицером данных и другими участниками функционально-ролевой модели управления данными, связь бизнес-объектов с техническими метаданными, позволяющая объединять обширный ландшафт данных на уровне физических таблиц с их бизнес-смыслом, ведение реестра проверок качества данных и контрактов на поставку данных между системами и процессами. При миграции использовавшийся зарубежный глоссарий на базе Informatica Axon содержал более 37 тыс. бизнес-терминов, 12 тыс. проверок качества данных и обеспечивал работу более 50 тыс. потребителей данных. Arenadata Catalog смог успешно заменить зарубежный аналог, обеспечив удобный процесс ведения глоссария и эффективный поиск информации о данных для пользователей, что существенно сокращает время при проектировании новых процессов в банке и повышает уровень качества использования данных в новых проектах.
Поспевали ли отечественные решения за зарубежными на рынке инструментов Data Governance до начала активного импортозамещения?
Иван Новоселов: Увеличивающийся спрос на системы управления данными был очевиден еще перед пандемией. Это было связано с растущими потребностями бизнеса в обработке и анализе данных и постоянным усложнением ландшафта данных в компаниях. Уже в тот момент требовалось развитие управления данными, чтобы заказчики могли поддерживать прозрачность и не потерять контроль над развитием аналитических систем. В начале 2020 годов на российском рынке Data Governance были представлены только западные продукты, такие как Informatica, Alation, Ataccama, в отличие от уже появившихся тогда отечественных СУБД и BI продуктов. Мы запустили работу над созданием Arenadata Catalog в 2021 году, понимая растущую зрелость заказчиков в России и потребность обеспечить управление метаданными для экосистемы импортозамещенных продуктов.
После ухода западных поставщиков рынок претерпел существенные изменения в структуре спроса и разделился на три сегмента заказчиков. В первый можно выделить тех, у кого уже были внедрены западные продукты, и они продолжали их использовать. Во второй — тех, кто активно смотрел в сторону проектов на открытом исходном коде или внутреннюю разработку. В третьем сегменте оказались компании, заинтересованные в работе с отечественными разработчиками ПО.
Нам, как молодому игроку на рынке, нужно было работать со всеми этими сегментами: с одной стороны, обеспечив паритет функциональности и удобства с западными продуктами, с другой — предоставив заказчикам больше ценности, чем смогла бы создать внутренняя команда, используя открытые продукты или ведя свою разработку.
Также в период 2022–2023 гг. на рынок попробовали выйти непрофильные игроки со своими внутренними продуктами, которые появились в силу отсутствия зрелых отечественных решений. Эти попытки пока нельзя назвать успешными. Опыт конкуренции с ними показал нам, что преимуществом обладает продукт, который создается сразу для рынка как тиражируемый, в который закладывается гибкость, возможность адаптироваться под потребности, обладающий документацией. К тому же заказчики в текущих условиях обращают пристальное внимание на темп развития продукта, квалификацию команды, что гарантирует получение большей ценности на горизонте свыше двух лет.
Безусловно, уже сформированная опытная команда в 2022 году могла бы быстрее нас внедрить кастомизированное негибкое решение на открытом исходном коде под текущие потребности заказчика. Но такой подход связан с рядом ограничений. Во-первых, на рынке непросто найти подходящих специалистов. Во-вторых, существует зависимость от уникальных компетенций людей внутри с учетом довольно динамичного рынка труда в ИТ.
Получается, Arenadata Catalog появился в ответ на запрос рынка?
Иван Новоселов: Arenadata Catalog — это иллюстрация того, как долгосрочный стратегический подход в сочетании с регулярным взаимодействием с потенциальными заказчиками с самых ранних стадий развития продукта позволил разработчикам предложить рынку востребованное решение.
Команда DataCatalog в структуре Группы Arenadata написала первый код в январе 2022 года, а к маю был готов минимально жизнеспособный вариант продукта (MVP) Arenadata Catalog. Однако глобальные изменения на рынке потребовали оперативного реагирования. Мы вели активную работу с потенциальными клиентами: демонстрировали прототипы интерфейсов и собирали обратную связь. Изначальный план работы с рынком почти сразу стал неактуальным. Перед нами появились клиенты, которые уже готовы были внедрять решение, хотя оно еще находилось на стадии MVP.
Мы запустили стартовый пилотный проект в конце 2022 года и уже в феврале 2023 года привлекли первого заказчика. К концу 2023 года DataCatalog реализовал более 15 пилотных проектов, а Arenadata Catalog получил промышленные внедрения у 10 коммерческих клиентов, среди которых такие заметные компании, как БКС, Hoff, «Вкусно и точка» и целый ряд других крупных компаний. Кроме того, в 2023 году нам удалось запустить комплексный проект импортозамещения иностранного продукта.
Первые продажи осуществляла продуктовая команда: так мы сократили дистанцию между клиентами и разработчиками и сразу активно работали с партнерами. В дальнейшем DataCatalog начал использовать возможности канала продаж Arenadata, что дало возможность охватить большее количество потребителей. Для постоянного улучшения продукта и учета задач клиентов команда продолжает регулярно собирать обратную связь на всех этапах взаимодействия с Arenadata Catalog.
Очень важными для нас были обратная связь от наших партнеров, системных интеграторов и их интерес к развитию продукта с момента его появления. Поэтому нам удалось положить начало широкой партнерской сети: даже на упомянутые первые десять коммерческих клиентов у нас было семь партнеров, которые осуществляли внедрения.
Насколько активно проходит в вашей сфере импортозамещение?
Иван Новоселов: На этот вопрос опять же проще ответить, если сегментировать рынок. Комплексных внедрений инструментов для Data Governance в России в период до 2022 года было не так много. Проекты по импортозамещению крайне важны для нас, поскольку осуществляются с компетентными и опытными заказчиками, что безусловно позволяет сверять планы развития продукта и быстрее двигаться вперед. Однако основную долю наших проектов составляют новые внедрения в компаниях, которые столкнулись с необходимостью комплексной трансформации ИТ-систем и аналитических систем в частности, но не внедрявших специализированные инструменты для управления данными.
Необходимость импортозамещения ранее использовавшихся технологий и платформ в области обработки и анализа данных (как транзакционных, так и аналитических) сформировала потребность в развитии управления изменениями, интеграции метаданных, понимании порой очень нетривиального влияния проектов импортозамещения одних систем на другие, знании, какие бизнес-процессы в компании это затронет. В таких условиях становится очень актуальным инструмент, который позволяет описывать взаимосвязи между бизнес-объектами, процессами, цепочками (контрактами) поставки данных и связывать бизнес-взгляд на данные с техническими метаданными до уровня поля в таблице СУБД, топика Kafka или раздела BI- дашборда. Отмечу, дата-каталог также способен помочь в процессе импортозамещения, когда требуется дополнительно провести аудит существующих процессов, источников, потребителей данных и провести комплексную оптимизацию процессов.
Как будет развиваться продукт?
Иван Новоселов: Мы начинали с закрытия наиболее критичных потребностей, что позволило увеличить клиентскую базу Arenadata Catalog более чем до 20 компаний за 2024 год. Это гибкий бизнес-глоссарий с возможностями настройки под заказчика, обеспечение Data Linage, коннекторы метаданных к отечественным и иностранным продуктам — от до сих пор активно используемых Qlik Sence до очень зрелого китайского Fine BI, а также базовые возможности контроля качества данных.
Теперь мы планируем развивать функциональность качества данных, расширяем возможности коннекторов, занимаемся усилением функциональности ядра продукта. При этом будем активно выстраивать платформу управления данными вокруг стека продуктов Группы Arenadata и поэтапно реализовывать планы по ее расширению.