DISCO-TAB: A Hierarchical Reinforcement Learning Framework for Privacy-Preserving Synthesis of Complex Clinical Data

arxiv_cs_lg·2026/4/3 20:01·9

DISCO-TAB：複雑な臨床データのプライバシー保護合成のための階層型強化学習フレームワーク

DISCO-TAB: A Hierarchical Reinforcement Learning Framework for Privacy-Preserving Synthesis of Complex Clinical Data

Summary

「DISCO-TAB 」は、複雑な臨床データのプライバシーを保護しつつ高精度に合成するための新しいフレームワークです。ファインチューニングされた大規模言語モデル（LLM） と、強化学習 で最適化された多目的識別器システムを連携させます。

トークン、文、特徴、行の4つの粒度で合成を評価し、自動制約発見 と逆頻度報酬シェーピング を統合することで、潜在的な医療ロジックを保持し、少数クラスの崩壊を防ぎます。既存手法と比較して、下流の臨床分類器の有用性を最大38.2%向上させ、統計的忠実性とメンバーシップ推論攻撃 への耐性も確保し、医療分野での信頼性の高い合成データ生成の新たな標準を確立します。

Technical Impact

DISCO-TAB は、特に医療分野におけるプライバシー保護型合成データ生成 において、新たな最先端（SOTA） の標準を確立します。これにより、機密性の高い臨床データセットの利用可能性が大幅に向上し、臨床意思決定支援システム の開発を加速させることが期待されます。

大規模言語モデル（LLM） の応用範囲を、テキスト生成から構造化された表形式データ の合成へと拡大する画期的なアプローチを示しています。これは、LLMが多様なデータモダリティに対応できる可能性を強調するものです。

強化学習（RL） の高度な技術、特に階層型フィードバック 、多目的最適化 、報酬シェーピング を複雑なデータ生成問題に適用する具体例を提供します。これにより、データサイエンティストやMLエンジニアは、同様の課題に対するRLの活用方法を学ぶことができます。

データプライバシー とユーティリティ のバランスを取るための堅牢なソリューションを提供します。メンバーシップ推論攻撃 に対する強力な耐性を持ちながら、下流の臨床分類器の性能を大幅に向上させるため、規制の厳しい業界でのAI開発に不可欠な技術となるでしょう。

自動制約発見 と逆頻度報酬シェーピング は、データの潜在的な医療ロジックを自律的に保持し、少数クラスの崩壊 という一般的な課題を解決します。これは、不均衡なデータセットを扱う際の合成データの品質を保証する上で極めて重要です。

DISCO-TABGenerative Large Language Models (LLMs)Reinforcement LearningGANDiffusionElectronic Health Records (EHR)

元記事を読む