医療データベース(DB)とは
-
後日、医療データベースの研究内容について情報発信していこうかと考えていますので
その前に、「医療データベースとは」というテーマで先にお話しておきます。近年、経済ニュースを賑わすキーワードともなっている「ビッグデータ」ですが、
様々な分野でその活用方法が議論されています。
ビッグデータの定義はWikiにも載っていますし、各論者が語っていますのでそちらにお任せします。
本稿でのメインテーマの「医療データベース」は”まだ”ビッグデータにあらず(『ボリュームが少ない』『規模が小さい』)という論者もいますが、収集や処理の困難性という面を見るだけでも既にビッグデータの一つであると考えられます。先日我々が「医療DB研究」で取り扱った「解析対象」こそ数万人単位ですが、
入手時のボリュームはその二桁増でした。
CzeekVに搭載しているFAERSデータはすでに1,000万件を超える症例レポート数ですし、
医療DBの中では、テーマ・疾患(糖尿病など)で絞り込まれたレコード数が億単位を超えるものはざらとなってきました。
それでも否定論者は”そんなもんでしょ”という少なさを指摘し、雷を落としてきます。クワバラクワバラ。こうしたボリュームのDBを、例えばOS:Windows環境のもと、インストール型のパッケージソフトで扱うのは
PCスペックが向上しているとはいえ、まだまだ難しい/厳しいかと思われます。
処理に時間がかかる、途中で固まった、何度も再計算(抽出・検索等)を実施したというストレスを
経験した方もいらっしゃるのではないでしょうか?
そもそもDBベンダーから入手したDBファイルを読み込めないという声も聞いたことがあります。
統計ソフトは我々も経験値があり、操作性・検定法の充実・勘所の良い機能など、素晴らしいものもあります。
RCTにおいては欠かせないツールの一つだと思います。
ただし、RCTでも扱わないような(あるいは前向き研究に現実的ではない)大量規模データを対象とするときには
ソフトウェアが(あるいはPCが)その大きさに耐えられず解析できないデメリットが生じます。このような経験がこれまで無かった方も、
医療データベースを対象とした解析、研究がトレンドとなり、
医療データベースをもとに得られた”ヒント”を現場で応用・活用することが当たり前の時代が到来すると
こうしたことが直面する問題になる可能性はあります。根拠はあるのか?と問われてデータ自体がなかったこれまでと異なり、
医療DBが存在する(活用できる)これからの時代では、エビデンスを示した手法が重要となることは言うまでもないかと思います。嘘かマコトか、”ムーアの法則の終焉”という情報をまともに受けるとすれば、
手元に届くPCのスペック向上はそのうち限界が訪れ、
取り扱うデータベースの規模が大きくなるにつれて(データは日々収集され増えていきます)
パッケージソフトでの解析以外の手法に目を向ける必要性に迫られるのではないでしょうか?話が横道にそれ過ぎましたが、医療データベースも立派なビッグデータであり、
そうしたビッグデータを取扱うにはそれなりの”ノウハウ”が必要であるということの
一部背景が理解できたかと思います。(ノウハウについては本稿では言及しません)医療データベースの種類
では、医療に関するビッグデータ(データベース)にどのようなものがあるのか、
という質問に応えていきたいと思います。「医療情報」「医療情報DB」についての定義は下図のように発信されています。
医療DB(医療情報DB)には、診療・治療に関する記録(clinical DB)だけでなく、
保険請求申請のために必要なデータ(administrative DB)も含まれることがキーになるかと思います。
そして、医療DB研究ではそのデータを”二次利用する”ことである、という意識が欠かせないことも重要です。大きく医療DBを分けると下図のようになります。
それぞれの医療DBの特徴を簡単に下記します。
レセプトデータ
提供者:保険者
内容:診療報酬明細書(保険点数・手術・臨床・画像検査・処方箋・調剤・疾病等)
特定健診情報(身長・体重・血圧・生化学検査値・飲酒・喫煙・運動等)
メリット:患者単位で医療機関を問わず記録されているので追跡性・一貫性が高い
デメリット:レセプト病名記載なので、コーディング時に注意
:後期高齢者は含まれないDBが多いDPC
提供者:医療機関
内容:DPC患者臨床情報・新旅行位、急性期入院医療の診療分類に基づく包括評価制度
メリット:主の疾患名と程度、ステージ、転帰、入退院詳細が記載されている
:分析を前提としたフォーマット
デメリット:急性期(入院)限定、外来患者も含むことはある。患者単位の追跡性はない。HIS
提供者:医療気機関
内容:電子カルテ、オーダリング(処方、検査指示)、臨床検査値、画像等
メリット:臨床検査値を含む
デメリット:医療機関毎の仕様、コード(共通処理が困難)、追跡性なし処方・調剤
提供者:保険薬局
内容:処方箋・調剤情報(患者年齢・性別・処方箋・調剤日・SOAP等)
メリット:年齢制限なし。SOAPによる患者指導内容
デメリット:疾患名なし次に国内のデータベースを数例挙げます。
NDB(ナショナルデータベース)
レセプト情報および特定健診等情報
生DBを取り扱う、欲しい情報を入手するにはハードルがあり、まだまだ身近に使えるDBとはいえない印象があります。
半年に一度程の頻度で情報発信されており、サマリーについてはこれまで2回公表されています。
本DBを対象とした研究報告もあります。MID-NET
日本版センチネルプロジェクト
医療情報データベース基盤整備事業により、大学病院等10機関の電子カルテ情報を
(ある意味)統合して解析できるようになっています。
(ある意味)という表現を用いたのは、利用者は参画機関の中からどの機関のDBを用いるのかを
オーダーする方式になっているからです。
2018年4月から利用開始予定で、利活用するためにはセミナーを受講する必要があります。
項目名などはPMDAのHPから確認できます。
製薬企業は製販後データベース調査の際に、このDBの活用も一つの選択肢となります。JADER
有害事象自発報告DB
すでに別コラムにて説明していますので詳細は割愛します。以上が官が運営しているものです。
他に教育研究機関や民間営利企業が運営しているものがあります。
薬剤疫学に応用可能なDBの調査が
日本薬剤疫学会のタスクフォース活動として実施されており、
「日本における臨床疫学・薬剤疫学に応用可能なデータベース調査」において
その一覧が公開されています
日本薬剤疫学会のホームページからアクセスして確認してみてください。また、DBではありませんが医療DBの活用を目指して、
PMDAのもと、MIHARI-プロジェクトが進められています。
『副作用報告以外の情報源による安全性評価方法の構築を目的とした医療情報等のデータベース基盤整備及び活用』
安全対策業務の一貫で多くの調査が種々の研究デザインで行われています。MIHARI アーカイブ より 一部抜粋
https://www.pmda.go.jp/safety/surveillance-analysis/0007.html
参考まで世界の医療DB
国外のDBについても代表的なものを下記します。
CPRD
国:英国
運営:MHRA
内容:一般診療所500程の施設からのデータ
診療報酬、処方、患者情報検査結果等
規模:650万人THIN
国:英
運営:EPIC
内容:診療応報、処方、患者情報等、GPRDの代替として構築
規模:500万人HMO Research Netword
国:米
運営:保険会社コンソーシアム
内容:診療・処方レセプト、患者情報等
規模:4,000万人Medicare, Medicaid
国:米
運営:公的医療保険制度の会員登録DB
内容:診療・処方レセプト、患者情報等
規模:4,200万人このように国内外には多種多様な大規模な医療DBが存在し、
既に多くの研究者によって色々な調査報告がなされており、参考となる情報もたくさんあります。
解析報告例を示すのは省きますが。製薬企業においても医療DB研究の活用が既にスタートしており、
改正GPSPを背景として、製造販売後データベース調査枠内において
データソースは民間医療DBを用いてコホート研究を実施計画として進めている例があります。
その際には「当該事象の発生に関する情報が取得可能と想定されるデータベースの存在」を根拠としています。また、現在検討されているのが治験時の活用です。
被験薬群に対して対照薬群のデータも調査研究する必要がありますが、
多くの患者数を必要とし、承認までの期間が長くなることはコスト大につながります。
そこで、対照群を医療DBに置き換えることで少ない患者数に抑え、
開発期間の短縮、コストの削減から医療費抑制につなげようと考えられています。後は、リアルワールドデータ/エビデンス(RWD/RWE)というキーワードも覚えておくといいと思います。
一言でいえば臨床現場のデータを指し示すものであり、上記に説明した内容と同一です。海外ではリアルワールドデータ研究という名称で多くのデータベース研究報告がされています。
抗凝固薬を比べた出血に関する治験時と実臨床時のデータ検証などが有名です。製薬企業では戦略的に、医薬品の開発やプロモーション戦略のデータとして医療DBを活用し始めています。
また、例えばレセプトデータと健診データを組み合わたりなどで、疾患の実態把握・生活習慣病の発症や重症化の予防、更には保健指導などに役立てることが実際に検討され、プレ実験・検証はスタートされています。
糖尿病分野では、医療DBから合併症のリスクを算出し、患者指導に生かすことで治療効果の向上と費用軽減が実現できるとの報告もあります。こうした医療DBを対象として研究を進める際には
・どのような医療DBが解析目的に適っているのか、
・どのような研究デザイン・リサーチクエスチョンが適切であるのか 等を
テーマ毎に吟味する(アセスメントも進める等)必要があると思われます。まずは、本稿にて医療データベースの種類と内容(概要)を知っていただいたかと思います。
但し、本当の意味での”DBを知る”ということはその中身を詳しく理解し
研究に対する有効性だけでなく、限界も知っておくことかと思いますので、
項目名・記述内容・コーディングなど細かいところも情報として入手し、
今後医療DBを対象とした研究を進める際にはRawDATAを触って経験値を高めることも重要ではないでしょうか。
そうすることで、批判的吟味を研究デザイン設計時から実行できるのではないかと思いますし、
一次アウトプット後に、オプション解析の視点を加える発想にも繋がるかと思います。ゲノム解析等遺伝子データも医療DBに含まれますが本稿では割愛しました。
それらの活用も最先端技術として多くの報告がされており、臨床においても期待されています。
まさにAIの活躍フィールドかと思います。 -
お問合わせ
メルマガ登録