医療産業情報
新聞情報紙のご案内・ご購読 書籍のご案内・ご購入 セミナー/イベントのご案内 広告のご案内

東大ヒトゲノム解析C、スパコンSHIROKANEがゲノム医療リード②


人工知能とデータシェアが必然、説明・同意から投薬までに80時間、GPUでさらに高速化

2020/6/23

 医療と介護の総合展(大阪)医療IT EXPOの基調講演「がんの個別化ゲノム医療にAIとスーパーコンピュータが必要な訳」(講師・山口類氏)を紹介する第2回は、東京大学医科学研究所ヒトゲノム解析センター(宮野悟センター長)の数々の成果、人工知能の必然性、がんの臨床シークエンスの流れ、全ゲノムシークエンスで奏功を得た例などを取り上げた。

 2011年の骨髄異形成症候群の解明、15年の再生不良性貧血のクローン進化、ヒト白血病ウイルスとT細胞の戦場跡の全貌、16年の免疫系を回避するがん細胞のゲノム異常の解明、19年の慢性活動性EBウイルス感染症の原因解明、加齢に伴う正常組織の遺伝子異常とがん化のメカニズムの解明、潰瘍性大腸炎による上皮再構築メカニズムと発がんとの関係を解明など、今日までに、Nature Geneticsなど10本の学術誌に60本以上の成果が掲載された。

 講演は、人工知能の活用に進んだ。ゲノムの変異は、数百から数百万も見つかるがその解釈と翻訳がボトルネックとなっており、その解消に人工知能の活用とデータシェアリングを行った。

 NIH(アメリカ国立衛生研究所)PubMed(医学・生物系論文の要旨データベース)上には、2018年までに2800万件の論文が登録されており、2000万の論文を印刷するとその厚さは富士山の高さを超え4000mに達し、さらに、論文数は指数関数的に増えており、2050年には高度100km、大気圏外に達する。

 英国COSMICデータベースでは、141万2466サンプルから2951万9920のがんの変異情報が2万6829報の論文と人海戦術で紐づけされており、現場では、これをいちいち検索している現実がある。さらに、臨床試験の数も30万件を超えるほど膨大で、時々刻々と更新されている。がんの理解は人知を超えてしまっており、人工知能が必要となった。
 ここで必要とされる人工知能は、自然言語処理技術(英語を読んで理解する技術)、機械学習(コンピュータがデータから学習する技術)、推論技術(予測・理由付けする技術)で構成される。

スパコン「SHIROKANE」
スパコン「SHIROKANE」
 東京大学医科学研究所は、IBM Watson Genomic Analytics(Watson for Genomicsと呼び方を変更)を15年7月1日に研究利用目的に導入した。New York Genome Centerで訓練を受けてから導入されており、導入時の学習内容は、2000万件超のMedlineデータ(文献アブストラクト)、1500万件超の特許データ、OSMIC(Catalogue of Somatic Mutations in Cancer, UK)、ClinVar(Genomic Variationとhealthに関する情報NIH USA)、National Cancer Institute Pathways(NIH USA)ほか各種データベースを備えていた。

 東大医科学研究所のがんの臨床シークエンスの流れは、全ゲノムシークエンス、または、全エキソームシークエンス基本として、必要に応じて、RNAシークエンス、エピゲノム解析、Liquid Biopsy(血液などの体液サンプルを使って診断)、Single Cell Analysis(単一細胞解析)を行い、大量のデータをスパコンSHIROKANEを用いてMutation Analysis(突然変異解析)等のバイオインフォマティクス(生命情報科学)解析を実行する。そして得られた変異情報に対して人工知能(IBMのWatson)による解釈と翻訳を実施する。

 東大医科学研究所附属病院血液腫瘍内科の東條有伸教授が提供した事例をエピソード1~3として紹介した。

 ちなみに、血液腫瘍内科のある患者のサンプルでは、全変異が1477、うち有害でない変異(遺伝的個性、多様性)が1457、残る20がドライバー変異であった。同腫瘍内科の専門医の自験により論文の検索・解釈が進められ1~2週間を要し、薬剤標的変異を1つに絞り込んだ。これをWatsonでは、大量の論文データベースをトレースし、2分以下で実現している。

 エピソード1「全ゲノムシークエンスで患者も医師も安心」として、人間ドックで白血球、好酸球増多を指摘され、近医受診により急性骨髄性白血病(AML)が疑われたため、セカンドオピニオンを希望し、精査加療目的に同血液腫瘍内科に入院し、17年に骨髄検査を行い、FISH法でFIP1-PDGFRα融合遺伝子が見つかった。

 患者は「ゲノム異常はこれだけか? ほかに『悪たれ』はいないのか?」と不安を募らせるため、全ゲノムシークエンスで診るしかないとして、全ゲノムシークエンスをすると7488個の体細胞変異と108個の構造異常を検出した。それらの変異に対するWatsonの見立ては、FISH法で見つけていた融合遺伝子が、やはり「悪たれ」である可能性が高いというものであった。ちなみにWatson解析は10分であった。この融合遺伝子に対してはイマチニブなどの分子標的薬が有効と考えられ、奏功が得られている。山口氏は、「患者への説明と同意から患者への結果報告と投薬までに要した時間は3日と8時間であるが、GPUはさらに高速化が期待され、パイプラインに組み込む方法を準備中」と説明した。

 なお、ここ数年、国内の有力病院で受け付けているパネルシークエンスでは、おおむね数百個の遺伝子を対象としたゲノム解析のみにとどまっている。

(編集長 倉知良次)
(この稿続く)

サイト内検索