Стратегия, инструменты, практика

5 февраля 2020
Россия
Москва

Конференция «Качество данных 2020»

Данные сегодня – ключевой фактор бизнеса, однако грязные данные не позволят предприятиям получить ожидаемых преимуществ. Конференция о том, как обеспечить качество данных в соответствии с целями их использования , гарантировав полноту, точность, корректность и актуальность.

ДМИТРИЙ ВОЛКОВ
программный директор серии практических конференций издательства
«Открытые системы».
Магия новейших технологий завораживает и многие компании стремятся их использовать, основываясь на всех имеющихся ретроспективных и оперативных данных. Однако, независимо от объемов и темпов генерации данных, верные управленческие решения возможны лишь на основе данных надлежащего качества, обсуждению процессов обеспечения которого и посвящена конференция.
Что мешает превращению корпоративных данных в бизнес-активы?
Что означает «качество данных»: проблемы и метрики оценки?
Как построить стратегию управления качеством данных?
Архитектура корпоративного «озера» с чистыми данными?
Как создать управляемый каталог подсистемы качества данных?
Где найти эффективные инструменты очистки данных?
В программе:
Стратегии
Конвейер обеспечения качества данных
Метрики, аудит и мониторинг качества данных
Управление качеством данных и DataOps
Качество и связность данных из разных источников
Очистка, преобразование и обогащение данных
    Инструменты
    Критерии выбора
    Универсальные:
    Data Ladder; Informatica Quality Data, Master Data Management; Experian

    Интеграция, очистка:
    Talend Data Quality; Syncsort Trillium; SAS Data Management; TIBCO Clarity

    Аналитика, хранение:
    IBM InfoSphere QualityStage, OpenRefine и др.
    Кейсы
    Конференция для:
    • бизнес-руководителей и руководителей проектов;
    • аналитиков, консультантов, специалистов по данным, экспертов по качеству данных;
    • архитекторов ИТ-систем и ИТ-директоров;
    • руководителей подразделений разработки и технических директоров;
    • администраторов систем управления данными.
    Спикеры:
    ЗАЯВКА НА ДОКЛАД
    Вернуться
    к докладчикам
    Алексей Незнанов,
    НИУ ВШЭ
    Закончил МЭИ, кандидат технических наук. Работал программистом, аналитиком,
    научным сотрудником, преподавателем высшей школы (МЭИ, МФТИ, ВШЭ и др.) –
    подготовил несколько авторских курсов, включая «Проектирование взаимодействия с
    пользователем», «Распределенные системы» и «Прикладная теория графов». С 2002 года
    участвовал в различных проектах комплексной корпоративной автоматизации и
    аналитики, в частности, в ФГБУ «Федеральный научно-клинический центр детской
    гематологии, онкологии и иммунологии имени Дмитрия Рогачева». Имеет опыт
    разработки архитектуры и реализации систем интеллектуального анализа данных. Сейчас
    – старший научный сотрудник НИУ ВШЭ Международной научно-учебной лаборатории
    интеллектуальных систем и структурного анализа, а также доцент Департамента анализа
    данных и искусственного интеллекта.
    Качество данных – альфа и омега корпоративной аналитики

    Лучший убийца любого проекта анализа данных – «грязные» исходные данные. «Что
    посеешь — то и пожнешь», причем независимо от уровня проекта: применяются ли
    лучшие в индустрии алгоритмы, уточняются ли бизнес-правила или обучаются нейросети.
    Тем не менее, в подавляющем большинстве проектов теме управления качеством данных
    (DQM) уделяется преступно мало внимания. Формализация мастер-данных? Сквозное
    версионирование справочников? Аудит исторических данных? Стандарты оценки
    качество данных? Что, вы – не знаем, не делаем.
    В докладе рассматриваются возможности, подходы и стандарты, инструменты и лучшие
    практики управления качеством данных. От отдельных наборов и источников данных до
    гармонизации гетерогенных хранилищ данных. От прикладных онтологий до
    неструктурированных многоязычных текстов. От простейших реквизитов документов до
    систем иерархических метаданных. От ГОСТ Р 56214–2014 до определения качества
    больших данных. От корпоративных DQM-решений до сообществ «открытых данных»
    (Open Data). Особое внимание уделено методологии управления процессом принятия
    бизнес-решений на базе точных, полных, актуальных и проверяемых данных (DDDM).
    Кроме этого разбираются особенности реализации процессов сбора, анализа и
    интерпретации данных с обеспечением непрерывного улучшения их качества.