3 сентября 2025 года Ассоциация больших данных на площадке Академии криптографии провела семинар «Теоретические основания синтеза данных. Проект серии национальных стандартов „Синтез данных“».
На мероприятии представители АБД — Алексей Нейман и Валерий Хватов — рассказали о проектах национальных стандартов в области синтеза данных.
Разработка проектов ведётся Ассоциацией при участии АНО «Национальный технологический центр цифровой криптографии». В документах отражены терминология, практики и подходы к оценке результатов применения методов создания синтетических данных с использованием систем искусственного интеллекта.
В ходе докладов были сформулированы ключевые термины и определения (в частности, «синтетические данные», «дифференциальная приватность», «гарантии приватности» и др.), представлены современные архитектуры систем синтеза данных с гарантиями приватности (включая решения на основе глубоких нейронных сетей), а также рассмотрены математические конструкции для оценки эффективности синтеза данных и качества синтетических данных.
На семинаре обсуждались вопросы целесообразности объединения в одном стандарте подходов к генерации синтетических данных и обеспечению дифференциальной приватности, необходимости четкого разделения понятий приватности и конфиденциальности, а также практической применимости стандартов при разработке реальных систем.
Отдельное внимание было уделено таким темам, как состоятельность предлагаемых методов генерации синтетических данных, корректности использования предлагаемых статистических метрик сходства распределений в многомерном случае, требования к объёму обучающей выборки в зависимости от размерности пространства характеристик синтетических данных, а также их зависимость, возникающая при применении GAN- и VAE-генераторов, преобразующих малоразмерный вектор эмбеддинга Z в полноразмерный вектор исходного пространства Х.
По итогам семинара Ассоциация больших данных и Академия криптографии отметили готовность продолжить совместную научную проработку методик и математических алгоритмов, заложенных в проекты стандартов.
Компания IDX представила кейс «Система удаленного удостоверения отдельных атрибутов персональных данных граждан без их раскрытия» в «Белую...
Точка Банк присоединился к Кодексу этики использования данных — отраслевому документу, который разработали в Ассоциации больших данных...
Ассоциация больших данных опубликовала открытую серию видеолекций Big Data Product Owner (BDPO). Материалы размещены на официальных каналах...