Ogishima Lab

Dept. of Informatics for Genomic Medicine, Tohoku University

View My GitHub Profile

Research Members Publications Activities Facilities JoinUs Contact

Research

当研究室では、ゲノム医療のための情報学の研究に取り組んでいます。個人ごとの遺伝要因を背景として、環境要因の影響を考慮して、疾患の発症と進行の機序を明らかにするため、ゲノム・オミックス情報、医療情報等のデータを統合し、大規模データ解析や機械学習等の情報学のアプローチでの解明に取り組んでいます。多因子疾患においては、併存症(comorbidity)も考慮した病態の遷移として疾患研究を行う必要があります。そこで、併存症などを考慮した内在的な分子病態の遷移による新たな疾患概念の確立を目指しています。

1. ゲノム医療研究の大規模データベース構築

ゲノム医療研究のため、ゲノム・オミックス情報、医療情報、健康情報を統合した大規模なデータベースの構築に取り組んでいます。

東北メディカル・メガバンク計画においては15万人の住民の大規模ゲノムコホート研究☞が進展しています。個人ごとの違いを考慮した個別化予防・医療に資する研究開発を推進するための基盤として、15万人の遺伝要因と環境要因、公的情報や医療機関の医療情報から得られる表現型の縦断的なデータを収載した統合データベースdbTMMを構築しています(Ogishima S, in prep)。医療情報については、東北大学病院と連携して、SS-MIX2標準化ストレージによる収集に取り組んでいます。

未来型医療創成センターにおいては、東北大学病院の患者の医療情報、ゲノム・オミックス情報を統合した統合臨床データベースの構築に取り組んでいます。

データベースを構築するにはデータの国際的な標準化が重要です。GA4GH (Global Alliance for Genomics & Health) は、ゲノム情報や医療情報の責任ある共有によりゲノム医療・医学の促進を目指す対話の場です。GA4GHには50カ国、500超の機関が加盟しており、当研究室もGA4GHと協力し、日本のゲノム医療の発展のため積極的に参加しています。AMEDのGA4GHのドライバープロジェクトGEM Japanの一環として、GEM Japan workshop 2019 Sendai、2020 Sendaiを開催しました。

2. 深層病型分類(deep phenotyping)

レセプトや電子カルテの医療情報を用いた、病型分類 (phenotyping) に取り組んでいます。これは、医師による診断そのものではなく、ゲノム医療研究のために、診断病名、検査値や処方薬等に加えて、ルールベースのアルゴリズムや機械学習により病型分類するものです。発症、来院、検査、診断、治療、予後の時系列のデータに基づいて、併存症(comorbidity)も考慮した病態遷移を捉えます。レセプトのデータを用いた糖尿病の病型分類(Nagaie S, in prep)、東北メディカル・メガバンク計画の三世代コホートのデータを用いた妊娠高血圧症候群の病型分類に取り組んでいます(Mizuno S., in prep)。

深層病型分類では、遺伝的背景、環境曝露の影響を考慮して、分子病態を反映した分子フェノタイプとしてのオミックス情報を統合解析し、新たな病型を同定します。これにより表現型のみならず、遺伝的背景や環境曝露を統合した、分子病態に基づくゲノム医学的な疾患概念を構成します。

深層病型分類を行うには用語の国際的な標準化が重要です。病名は国際疾病分類ICDを用い、症状はHuman Phenotype Ontology (HPO) を用いています。HPOはヒトの疾患における表現型の異常を記述する概念のオントロジーです。国際的な枠組みのなかで、ヒトの疾患における表現型の異常を記述する概念の共通のオントロジーを開発することは重要であり、国内外の共同研究者と共同でHPOの開発・利活用と日本へのローカライズに取り組んでいます(Köhler S, 2017)。

3. 機械学習による発症予測

深層病型分類した病型について、機械学習を用いた発症予測に取り組んでいます。コホートやリアルワールドの遺伝要因、環境要因、表現型の大規模データについて、欠損値補完、不均衡データ処理、HSIC LASSOなどによる変数選択を行い、ロジスティック回帰分類、ランダムフォレスト、サポートベクターマシン、深層ニューラルネットワーク(DNN)、決定木・勾配ブースティングなどによる機械学習モデルの構築を行っています。そして、構築された機械学習モデルの解釈に取り組んでいます。ゲノム医療においては、説明可能な機械学習モデルを構築することが重要で、構築された機械学習モデルの解釈により疾患発症・進行の機序の理解につなげることを目指しています。東北メディカル・メガバンク計画の三世代コホートのデータを用いた、妊娠高血圧症候群の機械学習による発症予測の研究に取り組んでいます(Mizuno S, in prep)。

4. 分子病態遷移のトラジェクトリー解析

疾患は細胞や組織、臓器の異常状態であり、慢性疾患ではこれらが準安定な異常状態の遷移により病態が進行していると考えられます。がんについて、細胞の異常状態を遺伝子発現情報により定量化し、がんの転移に関わる上皮間葉転換(EMT)についてこれを制御する遺伝子調節ネットワークを解明し、分子病態遷移のトラジェクトリーをランドスケープ上で解析しました(Tanaka H and Ogishima S, 2015)。これによりがんの転移に関わる上皮間葉転換について、遺伝子調節ネットワークの全体的な構造変化として、その本質的な特徴を解明しました。

disease trajectory