Skip to content

Instantly share code, notes, and snippets.

@gghatano
Last active September 16, 2022 02:15
Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save gghatano/78a723cbaa22139422a94ad9b132c746 to your computer and use it in GitHub Desktop.
Save gghatano/78a723cbaa22139422a94ad9b132c746 to your computer and use it in GitHub Desktop.

1. 厚労省_坂本享史さま NDBの最近の事情

NDB 概要

  • 高確法、健康保険法、社会福祉法等の改正により、NDBの利用・提供・活用の根拠法を定義している
    • 収集、第三者提供、介護DB等との連結
    • 社会福祉法の改正により、精緻な名寄せが可能になった(ID5?)
  • 規模  - レセプト229億、特定検診3億、特定保健指導1000万
  • リードタイム
    • レセプトは3か月、検診は1年

第三者提供の実績

  • 行政機関や公益的な研究を行う場合に第三者提供している(審査がある
    • 申請が大変かもだけど、第三者提供支援窓口がある
    • 審査は3か月に1回 スケジュールに注意
  • 提供の仕方:特別抽出、サンプリングデータセット、集計表情報、(オープンデータ)  - 特別抽出:条件に合うの個票 研究本番用?  - サンプリング:単月のデータ。練習用 (審査が簡単?)  - 集計表情報:集計後の情報 (時間はかかる、簡単な集計のみ受け付け
  • 提供件数  - 承諾件数は年間50件くらい。最近減少。提供データ行数は増えている
  • 公表された成果物の集計
    • 増加傾向
  • NDBオープンデータ:集計表を厚労省HPにて公表している  - Tableauでも提示している https://www.mhlw.go.jp/ndb/opendatasite/  - 提供項目の拡充は完了。今後は利便性向上が目標

NDBの今後

  • クラウド化:医療・介護データ等解析基盤(HIC)の構築  - データ探索、解析の環境を提供する予定。  - 2022年度に施行的利用、2023年度中にオープン
  • 他DBとの連結  - NDBには5種類のIDあがる。ID4,5を使って、外部DBと連結する?  - 保険者の変更や誤記により、被保険者番号や氏名等から生成したハッシュ値が変わるので、追跡には工夫が必要  - それぞれのハッシュ値の特徴把握が大事 IDを組み合わせて使う、など  -

NDBと死亡情報の連携に向けた検討

  • 統計法に基づいて受領している死亡票、は使えない  - 統計情報のみ使うとしている、など
  • 検討中 NDBにて死亡情報を別途収集する。市町村に依頼する、というスキームはどうか
    • 死亡情報の項目を最小限にする、などの検討中
    • 令和4,5年で法制化に向けた取り組みを進める

QA (一部拾えていない)

  • 過去のデータにさかのぼっての連結は?
    • 難しい
  • ID4,ID5を利用した連結成功率って公開される?あまり精度が良くない印象  - 特に予定が無い
  • 介護データやDPCとの連結データの利用申請はもうできる?  - 可能

2.1 NDBオンサイトセンターと臨床疫学研究基盤 NDBダミーシステム

NDBオンサイトセンター

  • 東大・京大にある 厚労省に承認を得られた研究を実施できる
    • 現地で分析作業をする 予約して使う
    • 3-6か月で一通りのデータ抽出・解析・成果とりまとめ、が必要 短い
  • 新NDBシステム(クラウド移行)に伴う、オンサイトセンターの更新
    • オンサイトセンターのシンクライアント(VDI端末)で分析するようになった
    • AWS上の解析環境にRDP接続できる
    • 分析環境を整備したコンテナの利用が可能になっている(docker環境がある) 自分のライセンスの利用が可能、など
    • 結果をS3に配置して、厚労省の承認が得られると、結果を手元に送信してもらえる
  • 留意点
    • 参照クエリ量で課金される ユーザからの利用料徴収は無い オンサイトセンターの予算から払う
      • 要注意(他の人が使えなくなるかも...
    • 他いろいろ

NDBオンサイトリサーチセンターでの研究

  • 計画策定、抽出、コホート化、解析
  • 計画...利用する情報を決める
    • 期間、抽出条件、etc... -(抽出のコツがある)
    • 症例の追跡
      • IDが変わる場合がある。キーレセプトを基準に、再帰的な抽出(変更後の変更後、を追いかけないといけない)
      • (ID1,ID2)が、(Z,a) (キー) -> (A,a) -> (B, a) -> (B,b) <- ここまで追跡できるように。(ID1=Z or ID1=a)だとダメ
    • 解析
  • (難しそう)

オンサイトダミーシステム

  • レセプト検索システムのテスト:オンサイトダミーシステムの構築
    • 自前でレセプトのダミーシステムを作った
    • 厚労省のCSV -> (分割) -> Glue -> Redshiftへ
    • テスト環境ができた
  • コホート化の検証
    • すごい
  • 利点
    • 国外の人とも研究できる、信頼性が上がる、etc...

QA

  • オンサイトセンター。他のクエリが走っていると、自分のクエリにも影響が出る?
    • 出る
  • seq_no2のみを利用するとダメ、ってどういうこと?
    • DPC総括情報を切らないと破損する

2.2 NDB利活用人材育成

医療データ人材教育拠点形成事業

  • 次世代医療基盤や、保険医療データPFを、ちゃんと活用できる人を育てる
    • 関東系と関西系がある?
  • いくつか育成コースがある
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment