ザッカーバーグによる「病気のない世界」

DNA、タンパク質、そして脂質といった何十億もの生体分子がどのようにして集まり、一つの細胞として振る舞っているのかを、私たちは知らない。人間の体内でさまざまな種類の細胞がどのようにして相互に作用し合っているのかも分かっていない。細胞、組織、そして臓器について、どのようにして病気にかかるのか、健康でいるために何が必要なのか、私たちが理解していることは限られている。

これらの問題に対して「AI」を駆使することで答えが見つかるかもしれないという視点で、ザッカーバーグは行動を始めているようだ。

DeepMind Technologiesは、2010年にイギリスで企業され、2016年には「AlphaGoが人間のプロ囲碁棋士を初めて破った」ことで名を馳せ、Googleに買収された。同社の「アルファフォールド(AlphaFold)」が、既知のほぼすべてのタンパク質の構造を予測することに成功した。

ディープマインドは2021年、アルファフォールドのソースコードを公開し、ヒトのほぼすべてのタンパク質を含む100万種類のタンパク質の構造を「アルファフォールド・タンパク質構造データベース」で公開した。

CEOのデミス・ハサビスは「植物、バクテリア、動物、その他とても多くの生物の構造が含まれており、アルファフォールドが持続可能性、燃料、食糧不安、顧みられない病気(Neglected disease)といった重要な問題に影響を与える大きな機会を開く」と語っている。

タンパク質の構造予測は非常に時間がかかるため、利用可能な2億種類ものタンパク質の構造を備えたツールがあれば、研究者の時間を大幅に節約できるが、タンパク質の構造が、突然変異や自然の対立遺伝子の変異によって、どのように変化するかを解明するモデル化ツールが登場することで、さらに科学は高みに上がることができる。

ザッカーバーグは「アルファフォールド(AlphaFold)」が50年分のタンパク質のデータを使うことでタンパク質の構造を解き明かしたことを指摘している。さらにMetaは「ESM」というAIシステムによる「言語モデルを用いた原子レベルのタンパク質構造の進化スケールの予測」という論文をサイエンスに発表もしている。

大規模な言語モデルを使用して、一次配列から完全な原子レベルのタンパク質構造を直接推論することを実証します。高解像度の構造予測が桁違いに高速化され、メタゲノムタンパク質の大規模な構造特性評価が可能になります。高い信頼性で予測される 2 億 2,500 万を超えるメタゲノムタンパク質配列を含む 6 億 1,700 万を超えるメタゲノムタンパク質配列の構造を予測することにより、ESM メタゲノム アトラスを構築します。

とのこと。

ある研究チームは、嚢胞性線維症と関連している壊れた遺伝子が、これまで科学者が見たこともない種類の細胞によって発現しているのを見つけた。別の研究チームは、新型コロナウイルス(SARS-CoV-2)に対して非常に脆弱な呼吸器細胞を特定した。他の研究チームはデータを使用し、特定の細胞における病気の原因となる突然変異を修正できる可能性のある、遺伝子接合の新たな選択肢を見つけ出そうとしている。

商用のAIに比べると、Metaが提供するAIは小規模であるが、非営利の科学研究用としては大規模なものとなり、法外なコストに耐えられない学術チームにとっては有用な便宜となる。

優れた科学者やテクノロジストが共に、AIが生み出した機会を最大限活用するのであれば、大幅な前進を見せるだろうと考えている。まず、人体の細胞の秘密を解き明かすところから始めよう。そうすれば今度は、既知の多くの病気に終止符を打つための取り組みへと駒を進めることができる。

で、締めくくっている。

生成AIから細胞の秘密を探り、解明することで、タンパク質の異常な振る舞いを除去できるようになれば人類に対する大いなる貢献になる。

こうした発想と実現に、日本発での寄与がないことが悲しいだけでなく、こうした視点が欠落・欠如していることこそが、今の日本の衰退を招いている。