Элементы управления метаданными
Метаданные (от лат. meta — цель, конечный пункт, предел, край и данные) — информация о другой информации, или данные, относящиеся к дополнительной информации о содержимом или объекте. Метаданные раскрывают сведения о признаках и свойствах, характеризующих какие-либо сущности, которые позволяют автоматически искать и управлять ими в больших информационных потоках.
Содержание[Свернуть] |
Базы данных
Такая информация часто используется в базах данных:
- Метаданные — это субканальная информация об используемых данных.
- Структурированные данные, представляющие собой характеристики описываемых сущностей для целей их идентификации, поиска, оценки, управления ими. набор допустимых структурированных описаний, которые доступны в явном виде и предназначение которых может помочь найти объект. Термин используется в контексте поиска объектов, сущностей, ресурсов.
- Данные из более общей формальной системы, заданную с описывающей свойства системы данных.
- Информация о содержащейся на веб-странице свойств информации (создателе и т. п.). Пример: Имя автора правки в тексте. Этот термин в широком смысле слова используется для любой информации о данных: именах таблиц, колонок в таблице в реляционных базах данных, номер версии в файле программы (то есть как информативная часть в бинарном файле) и т. п[1].
Различие между данными и метаданными
Обычно невозможно провести однозначное разделение на данные и метаданные в документе, поскольку:
- Что-то может являться как данными, так и метаданными. Так, заголовок статьи можно одновременно отнести как к метаданным (как элемент метаданных — заголовок), так и к собственно данным (поскольку заголовок является частью самого текста).
- Данные и метаданные могут меняться ролями. На стихотворение, рассматриваемое как данные, может быть написана музыка, в этом случае всё стихотворение может быть «прикреплено» к музыкальному файлу и в этом случае рассматриваться как метаданные. Таким образом, отнесение к одной или другой категории зависит от точки зрения (или пространства имён, системы отсчёта).
- Возможно создание мета-мета-…-метаданных (см. аксиома выбора). Поскольку, в соответствии с обычным определением, метаданные являются данными, то можно создать метаданные на метаданные, метаданные для вывода на специальные устройства, либо чтения их описания с использованием программного обеспечения, преобразующего текст в речь.
Другие описательные метаданные могут использоваться автоматизированными рабочими потоками. Например, если некоторая «умная» программа «знает» содержимое и структуру данных, то данные могут быть автоматически преобразованы и переданы другой «умной» программе как входные данные. В результате, пользователи будут освобождены от необходимости выполнения множества рутинных операций, если данные предоставлены для работы такими «немногословными» программами.Минфин Челябинской области перевел свои информационные системы на отечественную СУБД Postgres Pro
Метаданные становятся важны в World Wide Web по причине необходимости обеспечения поиска полезной информации среди огромного количества доступной. Метаданные, созданные вручную, имеют большую ценность, поскольку это гарантирует осмысленность. Если веб-страница на какую-то определённую тему содержит слово или фразу, то все другие веб-страницы на эту тему могут содержать такое же слово или фразу. Метаданные также обладают разнообразием, поэтому если с какой-то темой связаны два значения, то каждое из них может быть использовано. Например, статья про Живой Журнал может быть обозначена с помощью нескольких значений: «Живой Журнал», «ЖЖ», «LiveJournal».
Метаданные используются для хранения информации о записях audio CD. Аналогично MP3 файлы хранят метаданные в формате ID3.
Редактировать метаданные графических файлов можно в специальных программах для работы с метаданными.
Классификация метаданных
Метаданные можно классифицировать по
- Содержанию. Метаданные могут либо описывать сам ресурс (например, название и размер файла), либо содержимое ресурса (например, «в этом видеофайле показано как парень играет в футбол»).
- По отношению к ресурсу в целом. Метаданные могут относиться к ресурсу в целом или к его частям. Например, «Title» (название фильма) относится к фильму в целом, а «Scene description» (описание эпизода фильма) отдельное для каждого эпизода фильма.
- По возможности логического вывода. Метаданные можно подразделить на три слоя: нижний слой — это «сырые» данные сами по себе; средний слой — метаданные, описывающие указанные «сырые» данные; и верхний слой — метаданные, которые позволяют делать логический вывод, используя второй слой.
Тремя наиболее используемыми классами метаданных являются:
- Внутренние метаданные, описывающие структуру или составные части вещи, то, чем вещь является. Например, формат и размер файла.
- Административные метаданные, требующиеся для процессов обработки информации, назначение вещи. Например, информация об авторе, редакторе, дата публикации и т. п.
- Описательные метаданные, которые описывают природу вещи, её признаки. Например, набор связанных с информацией категорий, ссылки на другие вещи, связанные с данной.
Управление метаданными
Управление метаданными - процесс управления данными , связанными с информационными активами организации по обеспечению интеграции, доступа, совместного использования, анализа и пр. для достижения наилучших результатов организации.
Элементы управления метаданными
- Metadata repositories (Репозиторий метаданных) - используется для хранения, документирования, анализа и управления метаданными. Содержит в себе все данные на протяжении всех этапов жизненного цикла проекта: разработка, тестирование, ввод в промышленную эксплуатацию.
- Business glossary (Бизнес словарь) - используется для управления бизнес-терминами наряду с соответствующими определениями и отношениями между этими терминами.
- Data lineage (Происхождение данных) - определяет происхождение данных, этапы преобразования и изменения данных, направление их движения.
- Impact analysis (Анализ влияния) - предоставление обширной информации относительно зависимостей между данными с последующим влиянием на целевые показатели.
- Rules management (Управление правилами) - автоматизация соблюдения бизнес-правил, которые привязаны к элементам данных и связанных с ними метаданных.
- Semantic frameworks (Семантический фреймворк) - поддержка таксономии, ER-модели, онтологии, моделирования языков таких как RDF, OWL и UML.
- Metadata ingestion and translation (Захват и передача метаданных) - технологии и коннекторы для различных источников данных: RDBMS, BI, DIS, XML, etc.
Источники метаданных
Примеры стандартов мета-моделей
Группировка метаданных
Практическое применение в Сбербанке
Основной целью создания единой базы метаданных является автоматизация и повышение качества бизнес-процессов[2]:
- Снижение стоимости анализа и проектирования решений
- Сокращение времени разработки и вывода кода на среды
- Повышение качества продуктов
- Контроль соответствия архитектурным требованиям
Единая база метаданных, объединяет результаты анализа и архитектуры проектных решений с метаданными реальных сред.
Аналитическое пространство, является высокоуровневым описанием тракта данных от систем источников до витрин. Разрабатывается на этапе анализа и проектирования решения.
Каталог информационных компонент, обеспечивает пользователя полной, оперативной и систематизированной информацией об используемых в комплексе ЦХД – объектах, связях между объектами, компонентах, метриках, размещении.
Примечания
- ↑ Материал из Википедии — свободной энциклопедии
- ↑ Из презентации Селиванова Ю.А. - Сбербанк-Технологии (СберТех) на TAdviser SummIT 2017