厚生労働省は、がんゲノム医療を推進しようと2018年2月、がんゲノム中核拠点病院として、北海道大学病院、東北大学病院、国立がん研究センター東病院、慶應義塾大学病院、国立がん研究センター中央病院、東京大学医学部附属病院、名古屋大学医学部附属病院、京都大学医学部附属病院、大阪大学医学部附属病院、岡山大学病院、九州大学病院の計11カ所を指定し、20年4月に静岡県立静岡がんセンターを追加した。
これら中核拠点病院のほか、遺伝子解析結果を検討する専門家の委員会を開催できるなどの基準を満たしたがんゲノム医療拠点病院が33カ所、さらに、中核拠点病院や拠点病院と協力して、がんゲノム医療の提供や患者の窓口となる161カ所のゲノム医療連携病院も指定している。
中核拠点病院、拠点病院、連携病院では、最適な治療法の選択肢の1つとして、また、標準治療(外科手術、放射線治療、化学療法)の対象外となったがん患者との治療法の発見を目指してゲノム医療に取り組んでいる。
2種類のパネル検査が保険適用
採取した病理は、中核拠点病院を介して国立がん研究センターのオンコパネルシステムないし、中外製薬が展開するファウンデーション・メディシン社(米国)のがんゲノムプロファイルでパネル検査を受けて、その解析結果から中核拠点病院の医師および連携病院の担当医師が治療法を探す。両パネル検査は19年6月に保険適用となり、さらに、東京大学附属病院および大阪大学附属病院でも、先端医療の枠組みで保険適用を目指した臨床での評価を進めている。
こうして普及し始めているパネルシークエンスは、おおむね数百個の遺伝子を対象としたゲノム解析のみにとどまっているが、並行して、各国では全ゲノムシークエンスに取り組んでいる。日本では、東京大学医科学研究所ヒトゲノム解析センター(宮野悟センター長)がスパコン「SHIROKANE」を駆使し、日本トップのがんゲノム研究の成果を生み出している。
2020年2月26日、医療と介護の総合展(大阪)の医療IT EXPO基調講演「がんの個別化ゲノム医療にAIとスーパーコンピュータが必要な訳」が行われた。当日は、センター長でがんゲノム研究の第一人者である宮野悟教授が急用で登壇できず、代わりに同センターの研究に参加し、現在は愛知県がんセンターのシステム解析学分野の分野長で、がんゲノム医療センターの副センター長である山口類氏が講演を行った。
全ヒトゲノムシークエンスは500ドルから100ドルへ
山口氏は、DNAを構成するA、T、C、Gの塩基配列の一部が変わっても、「ほとんどが『修理』されたり、警察(免疫細胞)に『逮捕』されるが、システムが異常になるとそれができなくなり、警察に捕まらなくなったり、細胞増殖にブレーキが効かなくなって」、がん化・がん細胞の増殖が起こると説明した。
このA、T、C、Gの文字で綴られるゲノム情報(ヒトの場合30億文字のDNA情報)をコンピューターで読めるように取り出すことを「シークエンス」、その装置を「シークエンサー」と呼ぶと説明し、「ヒトゲノムのシークエンスの費用は、今は500ドル。そして、100ドルの時代が到来しようとしている」と続けた。
元データである生のDNAサンプルを次世代シークエンサーにかけると、100文字ぐらいの文字列断片データ(シークエンスデータ)が大量にコンピューターに吐き出される。現状は1000文字に1文字くらいのエラーが入るため、シークエンスデータからゲノム上の変異を正確に検出するためのアルゴリズムの開発が必要であった。
それらのアルゴリズムを用いて、スパコンは、正常ゲノム9億ピース(900億文字/100文字)とがんゲノム12億ピース(1200億文字/100文字)の2箱のジグソーパズルを解き、がんのシステム異常の原因(親からもらったゲノム、がんのドライバー遺伝子、がんゲノム)を暴きだすことができる。
『SHIROKANE』が日本のがんゲノム研究を独走
こうした成果を生み出してきたのは、「ヒトゲノム解析センターのスパコン『SHIROKANE』であり、がん研究に必須のインフラとして、日本のトップがんゲノム研究はほぼすべてこのスパコンから出てきた」と説明する。
計算能力は、19年から1.5PFLOPS、THINノード:5GB/CORE、Fatノード:2TB/node、高速ストレージは30PB高速ディスクアレイを誇る。通常ストレージは100PB(IBM社製テープアーカイブ+1PBニアラインディスク)。
学術誌に60本以上の成果掲載
宮野悟氏(東京大学医科学研究所
ヒトゲノム解析センターの前で)
2011年の骨髄異形成症候群の解明、15年の再生不良性貧血のクローン進化、ヒト白血病ウイルスとT細胞の戦場跡の全貌、16年の免疫系を回避するがん細胞のゲノム異常の解明、19年の慢性活動性EBウイルス感染症の原因解明、加齢に伴う正常組織の遺伝子異常とがん化のメカニズムの解明、潰瘍性大腸炎による上皮再構築メカニズムと発がんとの関係を解明など、今日までにNature Geneticsの10本をはじめとして、学術誌に60本以上の成果が掲載された。また、宮野教授および小川誠司教授(京都大学)のグループの共同研究により、SHIROKANEとがんの変異を正確に暴き出すソフトウエアによるがんゲノミクスの成果の数々を挙げた。再生不良性貧血においては、変異を蓄積しながらクローンが進化していること、加齢に伴う正常組織の遺伝子異常とがん化のメカニズムを解明した。
膨大なデータにAIが必須
がんの情報は増え続け、さらに、臨床試験の数も30万件を超えるほど膨大で、時々刻々と更新されている。がんの理解は人知を超えてしまっており、人工知能が必要となった。
ここで必要とされる人工知能は、自然言語処理技術(英語を読んで理解する技術)、機械学習(コンピューターがデータから学習する技術)、推論技術(予測・理由付けする技術)で構成される。
東京大学医科学研究所は、IBM Watson Genomic Analytics(Watson for Genomicsと呼び方を変更)を15年7月1日に研究利用目的に導入した。New York Genome Centerで訓練を受けてから導入されており、導入時の学習内容は、2000万件超のMedlineデータ(文献アブストラクト)、1500万件超の特許データ、OSMIC(Catalogue of Somatic Mutations in Cancer, UK)、ClinVar(Genomic Variationとhealthに関する情報NIH USA)、National Cancer Institute Pathways(NIH USA)ほか各種データベースを備えていた。
東大医科学研究所のがんの臨床シークエンスの流れは、全ゲノムシークエンス、または、全エキソームシークエンスを基本として、必要に応じてRNAシークエンス、エピゲノム解析、Liquid Biopsy(血液などの体液サンプルを使って診断)、Single Cell Analysis(単一細胞解析)を行い、大量のデータをスパコンSHIROKANEを用いてMutation Analysis(突然変異解析)などのバイオインフォマティクス(生命情報科学)解析を実行する。そして得られた変異情報に対して人工知能(IBMのWatson)による解釈と翻訳を実施する。
ちなみに、血液腫瘍内科のある患者のサンプルでは、全変異が1477、うち有害でない変異(遺伝的個性、多様性)が1457、残る20がドライバー変異であった。同腫瘍内科の専門医の実験により論文の検索・解釈が進められ、1~2週間を要して薬剤標的変異を1つに絞り込んだ。これをWatsonでは、大量の論文データベースをトレースし、2分以下で実現している。
全ゲノムシークエンスの恩恵
全ゲノムシークエンスの恩恵の例を見ると、人間ドックで白血球、好酸球増多を指摘され、近医受診により急性骨髄性白血病(AML)が疑われたため、セカンドオピニオンを希望し、精査加療目的に同血液腫瘍内科に入院し、17年に骨髄検査を行い、FISH法でFIP1-PDGFRα融合遺伝子が見つかった。患者は、まだ不安を募らせるため、全ゲノムシークエンスをしたところ7488個の体細胞変異と108個の構造異常を検出した。それらの変異に対するWatsonの見立ては、FISH法で見つけていた融合遺伝子が、やはり「悪たれ」である可能性が高いというものであった。Watson解析は10分であった。
この融合遺伝子に対してはイマチニブなどの分子標的薬が有効と考えられ、奏功が得られている。山口氏は、患者への説明と同意から患者への結果報告と投薬までに要した時間は3日と8時間であるが、GPUはさらに高速化が期待され、パイプラインに組み込む方法を準備中、と説明した。
当初、急性骨髄性白血病再発の診断であった患者の全ゲノム解析を行った結果、慢性骨髄性白血病の可能性が強く示唆されたことや、Ph染色体陰性急性リンパ性白血病の患者から、全ゲノム解析によりPh染色体が検出されたことなど、ゲノム解析により診断や治療法が変わった事例も多いという。
さらに、急性リンパ性白血病と診断され、抗がん剤治療により寛解状態の男性に関して、治療前の試料の全エクソンシーケンス解析では微小残存病変があるとは確定できなかった。そこで、全ゲノムシークエンス解析をすると、12番染色体と17番染色体の構造異常によるTAF15-ZNF384融合遺伝子が見つかった。これまでに、TAF15-ZNF384融合遺伝子による白血病が報告されており、これを微小残存病変マーカーとして使えることが分かった。
そして、その全ゲノムシークエンスで見つかった微小残存病変マーカーを調べることで、抗がん剤治療による微小残存病変の消失が確認された。その結果、リスクの高い移植を回避することができた。TAF15-ZNF384融合遺伝子による白血病の既報告を調べると世界で19人目の患者であった。
AIが学習し成長
Watsonは、2016年の段階では、学習が不十分であるため、専門医が判断したドライバー変異を見逃すことも多かったが、18年の解析症例の抜粋(7症例)では、専門医とWatsonの判断したドライバー変異が一致するなど、大幅な成長がみられた。
ここで、山口氏は、AIを用いたシステムの薬事規制上の位置づけについて触れた。医療機器該当性、膨大なデータと学習機能の評価が課題であり、同じ変異情報ファイルを入力しても、1カ月後にはデータが増え、AIが学習しているため、提示される結果に変化がある。
こうしたなか、18年12月19日に厚生労働省医事課から届いた通知文によると、「AIを用いた診療・治療支援を行うプログラムを利用して診療を行う場合についても、診断、治療等を行う主体は医師であり、医師はその最終的な判断の責任を負うこととなる」が、この通知文により、医師が最終的な判断の責任を負うことで、AI導入が可能となり、京都大学附属病院においてもWatsonが使えることとなった。
「世界は全ゲノムシークエンスへ、日本も続け」
山口氏は最後に、2015年に遡っての知見(Canada British Columbiaのグループの2012~14年の研究)として、「末期のがん患者群に対し、全ゲノムシークエンスを行って解析した場合、78人中、55人において治療標的となる変異が見つかり、そのうちの23人が実際にそれに基づく治療を受けた、一方、同じ患者群に対してパネルを使った場合、81人中、結局治療につながるものは全くなかった」と紹介し、「全ゲノムシークエンス解析とパネル解析、あなたならどちらを選びますか?」と問いかけた。
山口氏は、英NHS(National Health Service)のゲノム医療の方向「がんだとわかったら全ゲノム解析を行い、診断・治療選択・予後予測」(2019年)を例に、「世界は全ゲノムシークエンスに進んでいっている。日本もそれに向かって進んでいってほしい」と希望を語り、講演を締めくくった。
電子デバイス産業新聞 大阪支局長 倉知良次