リアルワールドデータ(RWD)の種類と活用について

投稿日

最終更新日

  • ビッグデータ

リアルワールドデータ(RWD)の種類と活用について

リアルワールドデータ(RWD)とは?

医療ビッグデータの活用は、診療、創薬、健康管理など多様な用途で利用されている。その医療ビッグデータのうちの一つがリアルワールドデータ(RWD)である。

具体的にRWDとは、医療ビッグデータのうち、医療現場での治療に関する医療データの総称である。しかしながら現在では、ウェアラブルデバイスやフィットネスアプリを通じて得たヘルスケアデータも活用されており、臨床現場で得られたデータのみならず健康に関するビッグデータへとその範囲を広げている。その取得データ例は以下の通りだ。

患者レジストリ
特定疾患に対するデータであり、その患者の病状、治療に関するデータ。

レセプト
病名に関する情報、医師による診療行為や処方した医薬品情報。

電子カルテデータ
血圧・心拍数のデータ、検査情報、診療前後の状態に関するデータ。

これらの情報は従来各医療機関で管理され、その中でしか共有されていなかったが、近年これらを統合することによってビッグデータを創り出すことで活用しようとする動きが活発化している。RWDを解析したことにより発見された事実をリアルワールドエビデンス(RWE)と呼ばれ、大学や研究機関のみならず製薬企業等でも利活用されている。

参考文献

RWDはどのようにして作られているのか?

それではこのRWDは実際どのようにして作られているのだろうか。
各医療機関からデータを集めることによって作成することが基本となっている。日常的に記録されている医療行為に関する記録を収集することによって、膨大なデータを集約し作成されるのだ。

その他にも前述したようにウェアラブルデバイスによるRWD作成も注目されている。
ウェアラブルデバイスは24時間装着することができ、被験者の負担が軽減されることから新たなデータソースとして今後の利用が見込まれている。

国内のRWD例: 民間企業の製品

一般社団法人National Clinical Database(NCD)

2010年に発足。登録医療機関における臨床データ(手術・治療・剖検情報)を集約しデータベースを作成している。
利用目的としては、執刀医がデータとして残っているため専門医申請に要する診療実績を証明するためのインフラや、手術実績の評価が挙げられる。
2014年からは、RWDの解析から作られた、手術リスクを分析することができるRisk Calculatorも運用している。

https://www.ncd.or.jp

一般社団法人健康・医療・教育情報評価推進機構(HCEI)

2015年より設置。学校健診情報、乳幼児健診情報を蓄積するSHRデータベースと電子カルテデータを元とするRWDデータベースを有する。
SHRは全国152自治体、約34万人の学校検診データと全国34自治体、約1.5万人の乳幼児検診情報を匿名加工し作成されている。
RWDは全国229医療機関からの約2560万人の電子カルテをもとに作成されており、生年月日等の患者基本情報から入退院、病名、検査情報、細菌検などの情報が蓄積されている。
研究に必要十分なデータ抽出がなされることもあり、場合によっては利用できないこともある。

https://www.hcei.or.jp/page/database

株式会社JMDC

保険者データベース、PHRデータベース、医療機関データベース、調剤薬局データベース、電子カルテデータベースの5つのデータベースを展開している。保険者データベースではレセプト、健康診断データ、加入者台帳をもとに2005年からの約1500万人のデータを貯めているなどそれぞれ全国から膨大なデータを集めている。

国内のRWD例: 公的機関のRWD(レジストリ等)

レセプト情報・特定健診等情報データベース(NDB)

厚生労働省による特定健診等における検査値のデータベース。公開されているNDBオープンデータでは、個人情報保護のため傷病名は含まれておらず、データの分析結果も公開されている。

https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000177182.html

国保データベース(KDB

2013年より始動したPDCAサイクルに沿ったデータヘルス計画を支援するためのデータベース。国保連合会が保有する健診・医療・介護の各種データを統合している。
https://www.kokuho.or.jp/hoken/kdb.htm

DPCデータ

2017年より、「日本再興戦略」に基づいて厚生労働省が保有しているデータ。公益性の高い学術研究に対しては、個人情報保護のため集計表情報の提供が行われている。また、医療機関の役割分析・評価等にも活用されている。多くの研究実績をあげている。

https://www.mhlw.go.jp/content/000501739.pdf

MID-NET(Medical Information Database NETwork)

厚生労働省と独立行政法人医薬品医療機器総合機構(PMDA)が平成30年4月より本格運用を開始した医療データベース。全国10拠点の協力医療機関からデータを収集し、400万人以上の医療情報(電子カルテ,レセプトなど) を収集・解析している。リアルタイムで情報が更新され、データの質も高いが量の少なさが課題である。

https://www.mhlw.go.jp/file/06-Seisakujouhou-11120000-Iyakushokuhinkyoku/0000197516.pdf

SCRUM-Japan

国立がん研究センター東病院が、希少肺がんの遺伝子スクリーニングネットワークである「LC-SCRUMA-Asia」と大腸がん遺伝子スクリーニングネットワーク「MONSTAR-SCREEN」を統合してできたデータベース。日本初の産学連携全国がんゲノムスクリーニングプロジェクトであり、がんの原因となる遺伝子変化を調べ治療に活かすことを目的としている。

http://www.scrum-japan.ncc.go.jp/index.html

RWDは万能ではない!?必要なバリデーション研究とは?

RWDは臨床試験データと異なり、収集される環境・方法の違いからデータの質も異なるため情報のバリデーション(選別)が必要である。

臨床研究とRWDの相違点

ここで臨床試験によるデータとRWDを比較したい。簡単にまとめると、以下のようになる。

対象

 データ

RWD

医療機関受診者

専門家による良質なデータ

臨床試験

治験者

ばらつきがある

臨床試験によるデータは、その条件がガイドラインにより規定されているため質が担保されているのに対し、RWDでは明確なガイドラインがなく、研究者自らが適宜判断する形になっている。
データの収集方法のみならず、臨床研究ではその特定データを利用することが一次目的であるが、RWDではデータ利用が二次目的となっている。このデータ収集時の目的の違いも、実際に利活用する際に影響する。

ゆえにRWDはばらつきのあるデータとして研究目的によって異なるバリデーションが必要だが、その評価軸として様々なものがある。以下に示すのはその例である。

The Institute for Clinical Evaluative Sciences; ICES

正確 (正確性)
信頼 (信頼性、妥当性)
完全 (完全性、網羅性)
利用可能 (匿名性、結合可能性、適時性、利用可能性、異時点間の一貫性)

https://ices-library.figshare.com/articles/report/Guide_to_ICES_advisory_framework_and_principles/18638000

バリデーション研究例

このようなガイドラインを利用するなどしているバリデーション研究がレセプトデータを中心に昨今行われている。
以下にその例を示す。

・NDBに対する同一患者の複数レセプトのバリデーション研究

野田らはレセプトデータ内にある同一患者の異なるIDとして登録されてしまっているデータに対する処理を研究した。その結果6〜7%の圧縮に成功し、従来の名寄せ方法から精度が向上した。

参考文献
野田龍也ら他7名 .(2017).『レセプト情報・特定健診等情報データベース(NDB)における患者突合(名寄せ)手法の改良と検証』.「厚生の指標」, 64,(12).
https://square.umin.ac.jp/ndb/PDF/NDB_UG_nayose-method_koseinoshihyo_200813.pdf

・NDB-SD、JMDCに対するデータウェアハウスからのデータセット抽出

NDB-SD、JMDCデータウェアハウスから、特定の症例に対する研究をする際に必要なデータセット抽出を行うためのメソッドの構築を行なった。この手法は他のRWDにも応用されることが期待されている。

Iwao, T., Kato, G., Otsuru, S., Kondoh, E., Nakayama, T., & Kuroda, T. (2019). "An Optimum Data Warehouse for Epidemiological Analysis using the National Database of Health Insurance Claims of Japan". EJBI, 15 (3).
https://www.ejbi.org/scholarly-articles/an-optimum-data-warehouse-for-epidemiological-analysis-using-the-national-database-of-health-insurance-claims-of-japan.pdf

このような研究が行われ始めているが、これらの研究は第三者によって行われることが重要であり、今求められているのだ。

今後はRWD全体のデータとしての質を担保するようなガイドラインの制定が求められる。RWDの課題点

バリデーション研究のみならず、RWDはそのほかにも様々な課題点を有している。

記録方法の違い

今まで各機関が、それぞれ独自の方法で分かれて記録していたがゆえに、ビッグデータとして統合する際に不備が生じている。データベースとして確立していく上で、異なる記録方法のデータでは必要なデータセットの抽出も容易ではない。今後は利活用しやすいデータとして記録様式の統一が求められている。

個人情報への配慮

RWDは日常的な医療行為によって集積されたデータである。ゆえに、患者は自身のデータが利用されることに対して同意しておらず、その是非が問われている。
原則として、研究に利用する際には「改正個人情報保護法」においてオプトインが求められている。今後は日常的にこの同意を得ることが、より充実したデータベースの構築に不可欠となる。
また、情報の匿名加工も重要である。認定された事業者は、オプトインされていないデータでも、オプトアウトされていない限りその利用が可能となっている。この時、患者個人が特定されないようにすること、またその基準・評価を設けることが早急に求められる。

各機関からのアクセスの容易化

実際にRWDがより広く利活用されるよう、様々な医療機関、研究機関、大学からのアクセスが可能となる必要がある。実態としては、アクセスの範囲が広いデータベースもあれば狭いものもあり、個人情報保護との兼ね合いが問題となっている。しかしながら、幅広いアクセスにより、その効力を広げることができ、より多くの成果をもたらすことができる。

同一患者の複数医療機関での受診データの統合

1人の患者が様々な医療機関を受診するケースは稀ではない。例えば眼科、歯科医院、皮膚科など異なる専門分野を有する病院への受診は多くの人が行なっているだろう。この時、同じ患者が異なる患者として登録されてしまう可能性がある。
これらのデータを連結することによって、今まで関連性がないと思われていた症状の発見などに役立てることができる。
しかしながら同時に、データを統合すればするほど個人特定のリスクが高まるため、より厳しい水準でのデータの保護が求められる。

まとめ

本記事ではRWDとは何かとその現状を見てきた。筆者自身執筆しながら特に早急に解決されるべきだと感じたのは

  • 記録様式の統一
  • 個人情報の管理
  • 統一的なガイドラインの制定

の3点である。データが日々蓄積され増えている中、記録様式の統一を行わなければ処理しなくてはならないデータ数が増大してしまう。実際の利活用のみならず、バリデーション研究を行う上でもこの様式の統一は基本であり、重要である。ゆえに対応が早く求められていると考える。また、今後医療分野に限らず活用が広がっていくであろうRWDであるが、人の命を救うことのできる可能性を十二分に秘めている反面、情報の機密性が高い。よって上記に示した点をまとめ、国家として適切な扱いがなされるようガイドラインを制定することで、安全にかつ広くデータを利用することができるのではないかと考える。

参考文献

Healthtech DB編集部です。Healthtech DBは国内のヘルステック領域に特化したビジネスDBです。日々のヘルステック業界の動向に関する記事作成やウェビナー運営、企業・サービスに関するビジネスDBの構築を行っています。