【一般の人向け】新型コロナウイルスを試験管内で人工進化させまくって変異株をたくさん作ったという論文を読んだので解説してみた話。

目次。

文字数が4万字以上あるので、ご注意ください。コロナ自粛でヒマな人におすすめ。

目次。
注意（必ず読んでください）。
はじめに。
読んだ論文。
導入。
- 新型コロナウイルスの感染メカニズム。
- 前提知識。
進化実験。
- 前提知識。
- 進化実験の詳細。
解析。
考察。
- 変異Q498Rの話。
- 変異によるRBDと抗体の結合効率の低下（ワクチンが効きにくくなる？）。
さいごに。

==========

ちょくちょく宣伝しているが、新型コロナウイルスの論文を使って、「研究者がどうやって未知のウイルスの正体を暴くのか？」について説明した文章を一般の人向けに書いたので興味のある方はどうぞ。
blog.sun-ek2.com

加えて、PCR検査の仕組みと、それに代わるかもしれないゲノム編集技術を応用した新しい検査方法に関する論文を一般向けに説明したので興味のある方はどうぞ。
blog.sun-ek2.com

==========

この文章を読んで、面白い！役に立った！...と思った分だけ、投げ銭していただけると嬉しいです。

ofuse.me

【宣伝】ギターも歌も下手だけど、弾き語りをやっているので、よければ聴いてください。

www.youtube.com

注意（必ず読んでください）。

正確には、新型コロナウイルスの「スパイクタンパク質」を試験管内で人工進化させたという論文。新型コロナ自体を人工進化させたわけではない。

（論文のタイトルには、「試験管内で」を意味するin vitroという言葉が使われているが、生物系の実験で試験管を使うのは稀。後で詳しく説明する）

スパイクタンパク質は、ウイルスを覆っている膜に生えているトゲトゲの部分。このトゲトゲを使って、新型コロナはヒトの細胞に感染する。

（「ウイルスの絵を描いてください」って言われると、大体の人は丸を書いて周りにトゲトゲをたくさん書くと思う。あのトゲトゲのことです）

ニュースで最近、耳にする「新型コロナの変異株」と言うのは、このトゲトゲの部分が進化して、感染力が強くなったウイルスのこと。

新型コロナは、トゲトゲのスパイクタンパク質を進化させて、感染力を増加させる。そのため、新型コロナの研究で一番注目されているのは、多分、このスパイクタンパク質。

ヒトの細胞に感染するために使われていて、新型コロナの感染力を大きく左右している「スパイクタンパク質」を試験管内で人工進化させようっていうのが今回の論文。

一応、確認しましたが、説明に間違いが含まれている可能性もあります。悪しからず。

はじめに。

ブログにディープラーニングを使った株式自動売買プログラム開発の過程を書いたり、量子〇〇って論文を紹介したりしているが、僕は生物系出身。実は、ディープラーニングとか量子〇〇は僕の専門ではない。学振は、「進化生物学」という生物系の領域で通っている。

blog.sun-ek2.com

僕は、試験管内で分子を人工進化させている。今から紹介する論文は、僕の専門分野のど真ん中。いつも専門外の分野の話しかブログでしないが、たまには僕の専門領域の話をするのも、いいのかなと思う。

ただ、この論文で使われている実験系を僕は取り扱ったことがなく、説明に間違いとかがある可能性があるので、そこはご了承ください。酵母への遺伝子導入なんて、学部3年の学生実験以降やったことがない。

一般の人向けに説明するので、できるだけ分かりやすく書こうと思っているが、「分子生物学」や「遺伝子工学」の知識がないと分かりづらいかもしれない。逆にそういった知識を持っていれば、今から説明する内容はすぐに頭に入ってくると思う。

分子生物学や遺伝子工学は、この論文だけではなく、ちまたで話題のiPS細胞、再生医療、バイオ医薬品などといった研究分野を理解する上で役に立つので、勉強すると少しお得。

また、これらの知識を身に着けておくと、新型コロナやワクチンに関するよく分からないデマ情報に惑わされることが少なくなると思うので、これは結構、お得かも。

おすすめの分子生物学の教科書はEssential細胞生物学。

Ｅｓｓｅｎｔｉａｌ細胞生物学原書第５版/南江堂/中村桂子（生命誌）

posted with カエレバ

分子生物学の教科書の中で一番、有名な教科書だと思う。多くの生物系、医学系の学生は学部1年くらいの時に、この教科書を使って分子生物学の勉強をする。そのため、この教科書を読めば、生物系・医学系の研究者、医者が持っている生物系の知識の下地と同じものを得られると思う。

ちなみにこの本は、かなり初歩的なことから書かれているので、前提知識がなくても、分子生物学に関するあらゆる分野を一通り知ることができる。

僕が学部生の頃は、第3版を使っていた。

ただ、この本はむちゃくちゃデカくて重い（800ページ以上ある）。そして、値段は8000円以上もする。そのため、僕らの間では、「Essential細胞生物学」のことを「ハッセンシャル」と言っていた。

本腰を入れて、真剣に分子生物学の勉強をしたいのであれば、Essential細胞生物学を買って勉強した方がいいような気がするが（その道のプロが通ってきた道なので）、そうでない人は、別の本を選んだ方がいいと思う。Essential細胞生物学は、800ページ以上あるし、8000円以上するし。

手軽に勉強したい人は、以下のような本を読むといいかもしれない（僕はこれらの本を読んだことがないので、品質は分からないです）。

基本がわかる分子生物学集中講義 /講談社/花岡文雄

posted with カエレバ

基礎から学ぶ遺伝子工学第２版/羊土社/田村隆明

posted with カエレバ

読んだ論文。

題目。

SARS-CoV-2 RBD in vitro evolution follows contagious mutation spread, yet generates an able infection inhibitor

www.biorxiv.org

僕がこの文章をダラダラと書いている間にこの論文が” SARS-CoV-2 variant prediction and antiviral drug design are enabled by RBD in vitro evolution”というタイトルでnature microbiologyに載っていた。

www.nature.com

nature microbiologyに載っているのを発見した時点で、文章は既にほとんど書き終わっていたので、この文章では、1つ目のbioRxivに載っている論文ベースで話をする。

SARS-CoV-2って言うのは、新型コロナウイルスのこと。僕は、今までCOVID-19がウイルスの名前だと思っていたが、COVID-19は新型コロナウイルス感染症のことを指すらしい。

RBDというのは、receptor-binding domainの略。日本語にすると受容体結合ドメイン（部位）といったところ。先ほど説明したスパイクタンパク質の一部分を差す名称。RBDは、ヒトの細胞膜にあるタンパク質（膜タンパク質）と相互作用する部分。RBDがこのタンパク質と相互作用すると、ヒト細胞への新型コロナの侵入が始まる。変異株は、スパイクタンパク質のRBDという部分を進化させて、ヒトのタンパク質とより強固に結合する力を手に入れて、感染を爆発させている。

in vitroっていうのは、「試験管内で」という意味。確かラテン語由来だったと思う。斜体にしている理由は、in vitroを斜体にしないといけないという謎の慣習が僕らの分野に存在するから。

（ただ今どき、生物系の研究で試験管はあまり使わない。普段は、試験管の代わりに「エッペンドルフチューブ」や「8連チューブ」といった小さい容器に、雨粒ぐらいの量の試薬を混ぜて実験を行う。雨粒ぐらいの液量でも十分に反応が起こる。試薬はものすごく高価なので、試験管といった大きな容器に試薬をたくさん注げば、すぐに研究費が底を尽きる。また、廃液も増えるので、わざわざ試験管を使うメリットは何もない）

なぜか僕らの分野は、ちょこちょこラテン語由来の言葉を使いたがる。in vitro（試験管内で）の他にin vivo（生体内で）、in silico（コンピュータ上で）、de novo（新たに）、in situ（本来の条件で）などなど。最後のin situは、論文で1、2回くらいしか見かけたことがないが、それ以外のラテン語の言葉は、ちょくちょく論文で見かけるし、僕らも普通の会話の中で使う。

著者。

Jiří Zahradník, Shir Marciano, Maya Shemesh, Eyal Zoler, Jeanne Chiaravalli, Björn Meyer, Yinon Rudich, Orly Dym, Nadav Elad, View ORCID ProfileGideon Schreiber

論文をまとめると…。

試験管内で新型コロナウイルスのスパイクタンパク質のRBD（新型コロナがヒトの細胞に感染するために一番大事な部分）を進化させることができた。さらに進化させていくと、世界で流行っている変異株のRBDよりもさらにヒトのタンパク質に結合しやすい（感染しやすい）RBDが得られた。

どういう利点があるの？

・自然界で起こっている新型コロナウイルスの進化を「試験管内人工進化」で模擬することができた。新型コロナウイルスの進化（変異株）を研究するときに役立つ実験モデルとなるだろう。

・実験モデルから、「より強力な変異株」が今後、自然界に出現する可能性があることが予言された。

→そういった変異株が今後、自然界に出現し、猛威を振るう前に色々と対策を立てることができる。

（ワクチンを開発するには、多くの時間がかかる。事前に「将来、こういった変異株が出現するかも」という情報があれば、実際にその変異株が出現する前に、ワクチン開発を始めることができる）

・進化させたRBDが新型コロナウイルス感染症（COVID-19）の治療薬になるかもしれない。

→進化させたRBDを患者に投与すると、優先的にそのRBDがヒトのタンパク質に結合する。そうなれば、新型コロナのRBDは、ヒトのタンパク質に結合できなくなる。進化させたRBDに邪魔をされて、新型コロナはヒトの細胞に感染できない。

導入。

論文の図・グラフをこのブログに転載すると、色々と良くないと思うので、図・グラフなしで説明します。図・グラフがないと理解するのが難しいと思うので、以下の論文の図・グラフを眺めながら、この文章を読んで頂けると幸いです。見るべき図・グラフは、その都度、記載しておきます。

www.biorxiv.org

新型コロナウイルスの感染メカニズム。

「内なる敵：SARS-CoV-2が人体のタンパク質を利用して細胞に感染する仕組み」という記事が詳しいので、是非ご覧ください。

www.cas.org

ただ、内容が少し難しいかもしれないので、かみ砕いて説明してみる。

先ほど書いた通り、新型コロナウイルスは、自身のスパイクタンパク質をヒトのタンパク質と相互作用させて、細胞内に侵入する。

新型コロナのスパイクタンパク質のターゲットにされてしまうのは、ACE2というヒトの細胞膜にあるタンパク質。細胞膜にあるタンパク質のことを膜タンパク質という。

ACE2の正式名称は、アンジオテンシン変換酵素2。酵素というのは、化学反応を触媒する（促進する）能力を持つたんぱく質のこと。もちろん、酵素じゃないタンパク質も存在している。多分、「コラーゲン」が一番、有名だと思う。コラーゲンは、体の構造を支える役割を担っているタンパク質で酵素には分類されない。

ACE2は、ペプチドホルモンの仲間であるAng IIをAng 1-7という別のペプチドホルモンへ変換する酵素。ACE2が作り出したAng 1-7は、血圧を下げて、血管を拡張させる。ただ、その詳細な仕組みについては分かっていないらしい（ACE2の詳しい説明は、こちらから）。

酵素と言うのは、先ほども書いた通り、化学反応を促進する（触媒する）タンパク質のこと。

ペプチドというのは、アミノ酸がいくつか数珠つなぎになった化合物のこと。ちなみにタンパク質は、アミノ酸がたくさん数珠つなぎになった化合物。いくつアミノ酸が数珠つなぎになっていれば、ペプチドがタンパク質と呼ばれるようになるかという基準は明確にはない。何となくアミノ酸がちょっとしかつながっていなければペプチドと呼ばれ、何となくアミノ酸がたくさんつながっていればタンパク質と呼ばれる。Ang 1-7は、アミノ酸が7つ数珠つなぎになっている。

ホルモンというのは、体の様々な細胞に情報を伝達する仕組みの1つ。

様々な細胞に情報を伝達する仕組みとしてぱっと思い浮かぶのは、神経回路だと思う。神経を通じて、脳が発する電気信号（情報）が様々な細胞に伝わる。その他にも、ある細胞が化学物質を放出し、血管を通じて、遠く離れた別の細胞に情報を伝達することがある。そのときに使われる化学物質のことをまとめてホルモンと言う。

話を戻すと、血圧を下げ、血管を拡張させるような命令（情報）を載せたAng 1-7というペプチドホルモンを作り出す「ACE2」というタンパク質が新型コロナの標的になっている。

新型コロナは、自身のスパイクタンパク質のRBD（受容体結合ドメイン）を使って、ヒトの細胞膜に存在している「ACE2」という膜タンパク質にくっつく。RBDとACE2がくっつくと、ヒトの細胞膜に存在しているTMPRSS2（II型膜貫通型セリンプロテアーゼ）という膜タンパク質が新型コロナのスパイクタンパク質を切断する。

プロテアーゼというのは、タンパク質を分解する酵素（タンパク質分解という化学反応を促進するタンパク質のこと）。酵素の名前は、アーゼ（~~ase）で終わる。タンパク質は英語でプロテイン（protein）。そこにアーゼ（ase）を付けると、プロテアーゼ（protease）。プロテアーゼも、タンパク質なので、アミノ酸が数珠つなぎになってできている。その数珠つなぎになっているアミノ酸の中に「セリン」というアミノ酸が複数個、含まれていて、それらセリンの内の1つが中心となって、タンパク質分解という化学反応を促進しているのがセリンプロテアーゼ。

ここからは、少し余談。アミラーゼという名前を聞いたことがある人は多いと思う。多分、中学校くらいの理科で出てくる。アミラーゼは唾液に含まれていて、デンプンを分解する酵素。デンプンは英語（ラテン語）でアミラム（amylum）（starch（スターチ）の方が英訳として一般的だが）。そこにアーゼ（ase）を付けると、アミラーゼ（amylase）。

aseをアーゼって読むのは、ドイツ語読みっていうのをどこかで聞いたことがある。英語読みは、エイズ。プロテアーゼはプロティエイズで、アミラーゼはアミレイズ。

RBDとACE2がくっつくと、TMPRSS2がスパイクタンパク質を切断すると先ほど書いたが、適当に切断を行うわけではない。TMPRSS2は、スパイクタンパク質の特定の場所を切断する（多分、スパイクタンパク質の中に切断しやすい場所があるのだと思う）。スパイクタンパク質が切断されると、疎水性が高い領域が露出する。疎水性が高い領域は、同じく疎水性が高い細胞膜の内部とくっつこうとするので（疎水効果）、切断されたスパイクタンパク質はズルズルとヒトの細胞膜の中に入っていく。そうしているうちにヒトの細胞膜とウイルスの膜がくっついてしまい、ウイルスの内容物（ゲノムRNAなど）がヒトの細胞の中に混入してしまう（ウイルスに感染する）。

疎水効果を簡単に実感できる身近な例は、ラーメンの汁。ラーメンを食べ終わった後の汁には、油の粒が浮かんでいる。しばらくラーメンの汁を眺めていると、徐々に油の粒がくっついて、粒が大きくなるのが分かると思う。他にも容器の中で二層に分かれているドレッシングを見たことがある人が多いと思う。ドレッシングをかける前に容器を振って、中身を混ぜても、しばらくすると、また油の部分が出現し、再び二層に分かれてしまう。油っぽいもの（疎水性が高い）が集まろうとするのが疎水効果。

ヒトをはじめ、生物の細胞膜は、リン脂質の膜が二重になってできている。その名の通り、リン脂質はリン酸と脂質がくっついた化合物である。リン酸は親水性で、脂質は疎水性（油っぽい）、そして細胞中は水分子だらけ。そのため、リン脂質は、できる限り細胞内の水分子に触れないようにリン酸部分を細胞内に向けて整列し、膜を作る。しかし、そのままだと、脂質部分が細胞外の水分子に触れてしまう。それを防ぐために、細胞を覆っているリン脂質の一重の膜の上にさらにリン脂質がやってきて、リン酸部分が細胞外の水分子に触れるように整列し、もう一重膜を作る。これによって、リン脂質の脂質部分が細胞内外の水分子に触れることがなくなる。こういう仕組みで、細胞はリン脂質の二重膜で覆われている。

TMPRSS2によって、新型コロナのスパイクタンパク質が切断されると、油っぽい部分（疎水性が高い部分）が露出する。切断されたままだと、スパイクタンパク質の油っぽい部分は、周りの水分子とガンガンに触れあっている。それを回避するためにスパイクタンパク質の油っぽい部分は、細胞膜の内部の油っぽい部分（リン脂質の脂質部分）と触れ合おうと、細胞膜の内部へずぶずぶと入っていく。

ラーメンの汁の中の油が互いに集まって油の粒が大きくなるように、ドレッシングの油が互いに集まって二層に分離するように、細胞膜の油っぽい部分とスパイクタンパク質の油っぽい部分も互いに集まる（スパイクタンパク質はその名の通り、タンパク質。タンパク質はアミノ酸が数珠つなぎになっている分子。アミノ酸の中には、油っぽいやつ（疎水性が高い）がいくつか存在する）。

新型コロナの膜の表面にあるスパイクタンパク質の油っぽい部分がヒトの細胞膜の中にずぶずぶと入り込んでいき、しばらくすると、新型コロナの膜とヒトの細胞膜が融合してしまう。

新型コロナの膜とヒトの細胞膜が融合すると、新型コロナのゲノムRNAがヒトの細胞内に侵入する。ヒトを含め、一般的に生物は自身の設計図をDNAという分子に記録しているが、新型コロナはRNAという分子に自身の設計図を記録している。ゲノムRNAというのは、ざっくりいうとウイルスの設計図を保存する役割を持っているRNAのこと。

ヒトの細胞内に侵入した新型コロナのゲノムRNAは、ヒトの細胞内でヒト用のタンパク質を合成しているリボソームという複数のrRNAと複数のタンパク質でできた巨大な複合体を勝手に使い、新型コロナ用のタンパク質を作りまくったり、勝手に作ったポリメラーゼを使って、自分自身の設計図であるゲノムRNAをコピーしまくったりする。そして、勝手に作られたゲノムRNAやタンパク質がヒトの細胞内で組み立てられ、大量の新型コロナが作られ、感染したヒトの細胞から出ていき、その後、別の細胞に感染する。

これが新型コロナウイルスの感染メカニズム。ちなみに新型コロナのmRNAワクチンというのは、新型コロナのスパイクタンパク質の設計図を保存しているRNAを体内に打ち込むというもの。mRNAワクチンが打ち込まれると、そのmRNAはヒトの細胞に侵入する。その後、mRNA上の情報をもとに、ヒトの細胞内のリボソームによって、新型コロナのスパイクタンパク質が大量に合成され、細胞外に排出される。もちろんスパイクタンパク質は、ヒトにとって異物なので、抗体がつくられ、このタンパク質は体から排除される。このときに活躍した抗体の作り方は、免疫細胞によって記憶されている。ワクチンを打ってしばらくした後に新型コロナに感染すると、この記憶から迅速に抗体が作られてウイルスを撃退する。ワクチンを打つと、免疫細胞が新型コロナと戦う準備を早く行えるので、被害がワクチンを打たないときと比べて、小さくなる。

今までは、TMPRSS2というヒトのタンパク質が介在した感染メカニズムの詳細を書いたが、TMPRSS2を使わないメカニズムもあるらしい。

それは、細胞の食作用を使った感染。僕たちが食べものを食べて、体内で消化するように、特定の細胞は体内の異物などを取り込んで、細胞内で消化する。取り込むといっても、そのまま取り込むと、細胞内で悪さをする可能性があるので、異物はリン脂質でできた二重膜の小さな袋に包まれて、取り込まれる。

スパイクタンパク質がヒトの細胞膜のACE2にくっつき、食作用によって、新型コロナが細胞内に取り込まれ、消化される。このとき、ペプチターゼ（タンパク質分解酵素）などで、新型コロナのタンパク質が分解される。この分解の段階で、スパイクタンパク質が切断され、疎水性が高い部分が露出してしまうと、先ほどと同じように新型コロナを隔離していたリン脂質でできた小さな袋の膜にスパイクタンパク質の疎水性が高い部分が融合し、袋の膜と新型コロナの膜が融合し、ゲノムRNAが細胞内へ侵入してしまう。

前提知識。

DNAと遺伝子の違い。

DNAや遺伝子の説明で、「遺伝子の本体はDNA」や「遺伝子はDNAに含まれている」などという文言をよく耳にする。

僕も中学校の理科の教科書にそういった文言が書かれてあって、すごく混乱した記憶がある。「遺伝子の本体はDNA、遺伝子がDNAに含まれているということは、DNAという分子の中に”遺伝子”という分子が入っているの？けれども、”遺伝子”っていう名前の分子って存在しなくない？じゃあ結局、遺伝子って何？」みたいな感じになっていた。

僕は、大学に入るまで、DNAと遺伝子の違いがよく分からず、ずっと混乱していた。

遺伝子というのは、分子とか物質の名前ではなく、DNA上にある特定の領域のこと。DNAは、A、T、G、Cで略される4種類の分子が数珠つなぎになっているひも状の分子。

例えば、遺伝子という言葉は、「10000個のA、T、G、CがつながったDNAの351番目のAから2643番目のGまでの範囲が遺伝子です」といった使い方をする。

もう一度言うが、遺伝子というのは、分子の名前でも物質の名前でもない。A、T、C、Gが延々と並んでいるDNA上のある地点からある地点までの範囲に遺伝子という名前がついているだけである。分かりにくいので、遺伝子のことは、「遺伝子」ではなく、「遺伝子領域」と言った方がいいと思う。

遺伝子領域のA、T、G、Cの配列は、タンパク質の設計図を保存している。逆に言うと、タンパク質の設計図を保存しているDNAの領域のことを遺伝子と言うことができる（タンパク質の設計図を保存していない遺伝子もあるが、ここでは省略）。

DNAのある領域を遺伝子というのならば、遺伝子と呼ばれない領域もあるのではないかと疑問を持つ人がいるかもしれない。もちろん、DNAには遺伝子領域ではない領域が存在する。そして実は、生命の設計図であるDNA上の遺伝子領域はかなり少ない。DNA上の半数以上を占める領域は、ゴミ領域で、生命の設計には何の役にも立たない。

（このゴミ領域をよく調べると、ゴミだと思っていたものが、実は宝だったりすることがある。詳しくは、ジャンクDNAという言葉を調べてみてください）

セントラルドグマと遺伝子発現。

「セントラルドグマ」という言葉は、新世紀エヴァンゲリオンというアニメでも出てくるらしい。僕は、新世紀エヴァンゲリオンをきちんと観たことがないので、アニメに出てくるセントラルドグマが何なのかは分からない。

（アニメ自体はちゃんと観ていないが、「ヤシマ作戦」のところだけはちゃんと観ました。屋島（ヤシマ）は地元なので）

この言葉は、アニメだけではなく、生物系の教科書や学術論文でも出てくる学術用語。生命の設計図を保持しているDNAの情報は、RNAという分子に写し取られ、そのRNAの情報を元にタンパク質が合成されるという一連の情報の流れのことをセントラルドグマという。

RNAに写し取られるDNAの領域のことを遺伝子と呼ぶ。これは先ほど言った通り。DNA上の遺伝子領域の情報（A、T、G、C）がRNA（mRNA）に写し取られて、RNA（mRNA）上の情報を元にして、リボソームというRNA（rRNA）とタンパク質の巨大な複合体がタンパク質を作る。

DNAの遺伝子領域の情報が読み取られて、タンパク質が実際に合成されることを「遺伝子が発現する」とも言う。mRNAが大量に合成され、そのmRNAの情報から大量のタンパク質が合成される様を「その遺伝子の発現量は高い」と言ったりする。

新型コロナウイルスは、自身の設計図をDNAではなくRNAに保存しているので、新型コロナの情報はDNA→RNA→タンパク質ではなく、RNA→タンパク質という具合に流れる。

ゲノムDNAとプラスミドDNA。

生命の設計図一式のことをゲノムと言う。ヒトの設計図は、23本のDNAに分割されて保存されている。その23本のDNAの情報をまとめてゲノムという。ヒトは、父親、母親からゲノムをもらうため、2組のゲノムを持っている。

生命の設計図一式、つまりゲノムを保存しているDNAのことをゲノムDNAという。ゲノムを保存していないDNAのことをプラスミドDNAという。

プラスミドDNAは、細菌や酵母の細胞内に存在している小さな環状のDNA。このDNAには、生物が生きていく上で必須ではない多種多様な遺伝情報が保存されている。例えば、薬剤耐性遺伝子なんかがプラスミドDNAに保存されている。

細菌などを厳しい環境下におくと、細菌同士がくっついて、このプラスミドDNAを他の仲間に共有する。例えば、薬剤耐性遺伝子が保存されているプラスミドDNAが細菌の間で共有されると、抗生物質が効かなくなったりする。

生命の設計図であるゲノムDNAは、親から受け継ぐ（遺伝子の垂直伝播）。それ以外の遺伝情報が保存されているプラスミドDNAは、仲間から受け継ぐ（遺伝子の水平伝搬）。

このプラスミドDNAは遺伝子工学でむちゃくちゃよく使うし、今回紹介している研究でもむちゃくちゃ使っている。そのことについては、後に詳しく説明する。

PCR。

PCRについては、このブログで何度か説明しているような気がするが、念のために、ここでも説明する。

最近、新型コロナの影響で「PCR検査」という言葉が流行っているが、PCRというのは新型コロナを検出することがメインの技術ではない。

PCRはDNAを増幅する技術。PCRはPolymerase Chain Reactionの略で、日本語にすると「ポリメラーゼ連鎖反応」。

先ほど説明した酵素の名前の付け方のルールを思い出してもらえれば、察しがつくと思うがポリメラーゼは酵素の名前。ポリマー（polymer）にアーゼ（ase）がくっついてpolymerase（ポリメラーゼ）。

ポリマーというのは、ある分子がたくさん数珠のようにくっついて、紐のようになった分子のことをいう。ポリエステル、ポリエチレン、ポリ塩化ビニルなんかもポリマー。

もちろん、タンパク質やDNAやRNAもポリマー。タンパク質はアミノ酸が繋がってできたポリマー。DNAはデオキシリボヌクレオチドが繋がってできたポリマー。RNAはリボヌクレオチドが繋がってできたポリマー。

PCRのポリメラーゼは、DNAというポリマーを合成する酵素。PCRは、DNAを合成するという反応を連鎖的に引き起こす技術のこと。DNAの合成が連鎖的に起これば、当然、DNAが増幅される。

ポリメラーゼは、DNAの情報を読み取って、その情報と相補になる情報を持つDNAを合成する。ポリメラーゼは、合成中のDNA断片の端っこにデオキシリボヌクレオチドを1つずつ繋げて、DNAをどんどんと伸ばしていく。この「合成中のDNA断片の端っこにデオキシリボヌクレオチドを繋げる（伸長させる）」というのが大きなポイントで、実はポリメラーゼはDNA合成をスタートさせることはできない。DNA合成が始まる前には、もちろん「合成中のDNA断片」は存在しない。ポリメラーゼは、DNA断片を伸長させる酵素であって、DNA断片がないところからDNAを合成することはできない。ポリメラーゼが伸長させるDNA断片は予め用意しておかなければならないのである。

ポリメラーゼがDNAを伸長させるために必要な最初の短いDNA断片（本当はRNA断片）は、プライマーゼという酵素によって用意される。プライマー（primer）にアーゼ（ase）がくっついてprimase（プライマーゼ）。プライマー（primer）は、「最初」といった意味を持つ英単語。ポリメラーゼのDNA合成の開始点となる短いDNA断片（本当はRNA断片）のこともプライマーという。

（厳密に言うと、プライマーゼは、DNA断片ではなく、RNA断片を用意する。生体内のプライマーはDNA断片ではなく、RNA断片。そして、ポリメラーゼはDNA断片ではなく、RNA断片にDNA鎖を伸長させていく。DNA鎖にRNAが混じっていると都合が悪いので、プライマー（RNA断片）部分は合成されたDNA鎖から取り除かれる。「長生き」に興味がある人は「テロメア」という言葉を聞いたことがあるかもしれない。詳しく説明しないが、テロメアがどんどん短くなるのは（短くなると細胞老化が起きる）、プライマーが短いRNA断片であることと深く関係している）

生体内のプライマーは、厳密にいうとRNA断片であるが、PCRに使うプライマーはDNA断片。PCRではプライマーゼがプライマーを用意するのではなく、予め設計したプライマーを外から加える。

DNAは、A、T、G、Cで略される分子が繋がってできており、AとT、GとCがそれぞれ水素結合という結合を作って、二重らせん構造をとっている。プライマーは自身の配列とDNA上にある自身の配列と相補な部分に貼りつく。例えば、プライマーの配列がATGCであれば、DNA上にあるTACGという部分に貼りつく（DNAの配列には方向があるので、TACGではなく、正しくはGCAT）。生体内では、プライマーゼがDNAの複製を開始すべきポイントに貼りつくプライマーを合成する。一方でPCRでは、実験者が好き勝手に設計したforwardとreverseという2種類のプライマーを外から加える。例えば、ある遺伝子Aを増幅させたいのであれば、その遺伝子Aの外側の領域に貼りつくようなプライマーを設計して、外から加える。そうすると、forwardとreverseのプライマーは、遺伝子Aを囲むようにDNAに貼りつく。

PCR検査は、新型コロナの遺伝子領域に貼りつくプライマーを使って、PCR（RT-qPCR）を行っている。新型コロナが体内に存在していれば、プライマーが新型コロナの遺伝子領域に貼りつき、そのDNA断片が増幅される。もし新型コロナが体内に存在していなければ、プライマーがDNAに貼りつかないので、DNA断片は増幅されない。DNA断片が増幅されているか否かは蛍光分子を使って調べる。DNA断片が増えていれば、DNA断片がつくる二重らせんに蛍光分子が挟まる。光を当てると、蛍光分子はエネルギーを受け取るが、すぐに熱として排出してしまう（分子振動が起こる）。けれども、二重らせんに挟まった蛍光分子は振動ができないので、受け取ったエネルギーを光として外に放出する。つまり、PCRで新型コロナ由来のDNA断片が増えていれば、サンプルから蛍光が放出される。

PCR検査におけるPCRは、シグナルを増幅する役目を担っている。アンプのような存在。様々な不純物が大量に含まれている患者から採取した唾液をそのまま使って、新型コロナがいるのかいないのかを判断するのは難しい。そのため、新型コロナ由来のDNA断片（シグナル）だけを増幅しようというのがPCRをする理由。

ただ、本来のPCRは、自分が欲しいDNA断片を増幅させる技術。

遺伝子導入。

先ほど説明したプラスミドDNAは、主に細菌や酵母への遺伝子導入などに使われている。

以下の話は、この研究でよく行われている実験。

遺伝子工学に使われてるプラスミドDNA（ベクター）は、ざっくりいうとMCS(multiple cloning site)とスクリーニング用の遺伝子領域でできている。MCSは制限酵素サイトが密集している領域である。制限酵素とはDNA上にある特定の配列を切断する酵素のこと。制限酵素には、種類がたくさんあって、それぞれ切断する配列が異なる。例えば、EcoRⅠという制限酵素は、…GAATTC…というDNA配列を…GとAATTC…に切断する。

スクリーニング用の遺伝子で代表的なのは、アンピシリン耐性遺伝子だと思う。残念ながら、微生物への遺伝子導入の効率は100%ではないので、遺伝子導入（プラスミドDNAの導入）を行った微生物集団の中には、プラスミドDNAを持っていないものも混じっている。そういった個体を排除するのがスクリーニング。プラスミドDNAは、導入したい目的の遺伝子とスクリーニング用の遺伝子（例えば、アンピシリン耐性遺伝子）が載っている。遺伝子導入した微生物をアンピシリンという抗生物質が入った培地で培養すると、プラスミドDNAがきちんと導入されたものだけが生き残り、上手く遺伝子導入できなかった個体はアンピシリンによって死滅してしまう。

まずは制限酵素を使って環状のプラスミドDNA（ベクター）を切断する。使う制限酵素は、目的の遺伝子を誤って切断しないものであれば、何でもいい。次にベクターに挿入する遺伝子が載ったDNA断片（インサート）を用意する。ここで登場するのがPCR。PCRでは、遺伝子領域を挟み込むようにDNAに貼りつく、forwardとreverseという2種類のプライマーを設計するといったが、ここでこれらのプライマーに細工をする。プライマーの端っこがベクターの端っこのDNA配列と相補になるようにプライマーを設計するのである。例えば、ベクターの端っこがAAAだとしたら、プライマーの端っこがTTTになるようにする。普通のPCRプライマーの配列がGCATGCだとすると、クローニング用のPCRプライマーの配列は、TTTGCATGCとなる。

その後、切断されたプラスミドDNA（ベクター）と目的の遺伝子が載ったDNA断片（インサート）を混ぜると、互いに端っこが相補なので、端っこ同士が水素結合によって、つながる。この状態で、リガーゼ（ligate + ase）という切れてしまったDNA断片を繋ぐ酵素によって、ベクターとインサートの端っこ同士がつながり、目的の遺伝子が載った環状のプラスミドDNAができる。このプラスミドDNAを微生物に導入するのが遺伝子導入。

上の説明では、リガーゼによって、プラスミドDNAを合成するといったが、別の方法もある。酵母の場合、切断されたベクターとインサートをそのまま導入すると、酵母の細胞内にあるDNA修復機構によって、それらが勝手に繋がり、環状のプラスミドDNAができる（Gap-Repair Cloning）。今回、紹介する論文では、Gap-Repair Cloningを使っている。

目的の遺伝子が載ったDNAを微生物に導入する方法は、色々とあるが、この論文では「エレクトロポレーション法」というものを使っている。微生物とDNAを混ぜた溶液に一瞬だけ高電場をかけると、細胞の膜に穴が開いて、DNAがそこから入る。エレクトロポレーション法は、ものすごく一般的な遺伝子導入法。僕はいつも別の方法で遺伝子導入をするので、エレポはやったことがないが、周りでやっている人はたくさんいる。

エレポをした後は、先ほど説明したスクリーニングを行う。例えば、目的遺伝子の他に薬剤耐性遺伝子を持つプラスミドDNAを導入したのであれば、その薬剤が入っている培地で遺伝子導入した微生物を培養すれば、プラスミドDNAがきちんと導入されたものだけが生き残る。

これが遺伝子を生物に導入する1つの方法。

この論文では、新型コロナのスパイクタンパク質のRBD（ヒトのタンパク質と結合する部分）の遺伝子を酵母に導入している。

酵母ディスプレイ。

酵母ディスプレイは、酵母の細胞膜の表面に目的のタンパク質を発現させる技術。この技術も、この論文でよく使われる。酵母ディスプレイをする理由については、後で説明する。

この論文で発現させるタンパク質は、もちろん、新型コロナのスパイクタンパク質のRBD（ヒトのタンパク質と結合する部分）。これによって、酵母の表面がスパイクタンパク質のRBDで覆われる。

これから以下の論文のFigure 3を使って、酵母ディスプレイについて説明する。

www.biorxiv.org

上の論文のFigure 3のa)が一般的な酵母ディスプレイの概要。

Cellという文字の上側にある二重線は細胞膜を表している。その上にAga1pと書かれた楕円があり、その上にAga2pと書かれた楕円があり、二つの楕円は2本の黒線でつながっている。そこから黒線が伸びていて、Libraryと書かれた点線で書かれた丸がある。Libraryからは、また黒線が伸びていて、その上には、Y字の構造体が2つ描かれており、2つ目のY字の端っこには、緑色のトゲトゲがくっついている。

Aga1pとAga2pは、2つ合わせて、a-アグルチニンと呼ばれるタンパク質。Aga1pとAga2pは、それぞれ合成された後、ジスルフィド結合と呼ばれる結合によって、結合し、1つのタンパク質になる。a-アグルチニンは、元々、酵母が持っているタンパク質。酵母の細胞内で合成された後に細胞膜上に輸送される。

「a-アグルチニンの端っこに目的のタンパク質を融合させておけば、a-アグルチニンと一緒に目的のタンパク質も酵母の細胞膜表面に固定されるのでは？」といった考えの下、開発されたのが酵母ディスプレイ。Figure 3のa)のLibraryと書かれてある部分に目的のタンパク質を融合させる。今回の研究で融合させるのは、新型コロナのスパイクタンパク質のRBD。

タンパク質は、DNAの情報を元にして作られる。DNA上のAga2pの遺伝子配列の下流に新型コロナのスパイクタンパク質のRBDの遺伝子配列をくっつければ、簡単にAga2pとスパイクタンパク質のRBDが融合したタンパク質を作ることができる。

遺伝子配列のくっつけ方も先ほど説明した通り。まず、Aga2pとスパイクタンパク質のRBDの遺伝子配列（DNA）をPCRで増やす。その際にAga2pのreverseプライマーとRBDのforwardプライマーの端っこが相補的な配列になるようにしておく。その後、PCRで増やしたAga2pとRBDの遺伝子配列断片を混ぜて、そこにリガーゼを加えれば、Aga2pとRBDの遺伝子配列断片がくっつく。そして、その断片と直鎖状のプラスミドDNAを混ぜて、再びリガーゼを加えれば、融合タンパク質の遺伝情報が保存されたプラスミドDNAを得ることができる（この論文ではGap-Repair Cloningを使っている）。そのプラスミドDNAをエレクトロポレーションで酵母に加えると、融合タンパク質の遺伝子が無事に導入される。その遺伝子から、Aga2pと新型コロナのスパイクタンパク質のRBDが融合したタンパク質が合成され、別のところで合成されたAga1pと結合し、酵母の細胞膜上へと輸送され、無事にスパイクタンパク質のRBDが膜上に固定される。

（本当は、Aga2pの終止コドンを削ったり、融合させた2つのタンパク質の機能をきちんと維持できるような適切なlinkerを2つの遺伝子間に設けないといけなかったりする）

まだ説明していなかったFigure 3のa)のY字の構造体は、「抗体」を表している。抗体というのは、特定のタンパク質（アミノ酸の鎖）に貼りつくことができるタンパク質のことをいう。酵母ディスプレイに使われるのは、Libraryから伸びている黒線（アミノ酸の鎖）に貼りつくことができる一次抗体と、一次抗体に貼りつく二次抗体。二次抗体の尻尾には、蛍光タンパク質（緑色のトゲトゲ）がくっついている。酵母全体から発せられる蛍光の強さによって、どのくらい酵母の細胞膜上にAga2pと目的タンパク質の融合体が存在（発現）しているか知ることができる。

というのが一般的な酵母ディスプレイだが、今回の研究では、この方法を改良したものを用いている。それがFigure 3のb)に描かれている方法。a)は、抗体に蛍光タンパク質を融合させていたが、b)は、蛍光タンパク質が直接、Aga2pに融合している。融合のさせ方は、目的タンパク質―Aga2p―蛍光タンパク質、蛍光タンパク質―Aga2p―目的タンパク質の2通りある。実際の実験では、両方試してみて、目的タンパク質の機能がより阻害されない融合のさせ方を採用するのだと思う。どちらの融合のさせ方がいいかというのは、目的のタンパク質による。

*本当は、目的タンパク質、Aga2p、蛍光タンパク質以外にも色々とくっついている。タンパク質を細胞膜上に運ぶ分泌シグナルペプチド（AppS4）とか、小胞体のシグナルペプチド（HDEL）とか、リンカーペプチドとか。Figure 3のe)を見ると、詳しいタンパク質の融合のさせ方がわかる。しかし、今回の論文を理解する上で、ここまで詳しい話は必要ないのでここでは説明しない。ちなみにMCSはプラスミドDNAのところで説明した通り、Multiple Cloning Siteの略。ここを制限酵素で切って、目的のタンパク質の遺伝子配列を挿入する。Reporterというのは、蛍光タンパク質のこと。

新型コロナのスパイクタンパク質のRBD、Aga2p、蛍光タンパク質が融合したタンパク質が酵母の細胞膜表面に存在（発現）していることを覚えておけば十分。

進化実験。

前提知識。

進化とは。

進化とは、「突然変異」と「自然選択」によって、生物集団の性質が変化していくこと。

進化に必要なものは、「突然変異」と「自然選択」。生物は子どもを作る。この段階で突然変異が入り、親と少し性質が異なった子どもが生まれる場合がある。もし、突然変異が起きた個体が生存に有利な性質を獲得したのであれば、その個体は生き残る可能性が高く、同じ突然変異を持った子どもがたくさん生まれる。そして、その突然変異は、生物集団全体に広まり、集団全体の性質が変化する（集団が進化する）。もし、突然変異した個体が生存に不利な性質を獲得したのであれば、その個体が生き残る可能性は低く、その突然変異は生物集団から排除されてしまう。突然変異した個体が生き残れるかどうかを決めるのは、その個体を取り巻く環境。身の回りの環境がその突然変異を残すか、残さないか、選択している。

例えば、突然変異が起きて、暑さに強くなった個体が誕生すれば、赤道直下では、その個体は、他の個体よりも元気に活動し、子孫を多く残す可能性が高くなる。その子孫も暑さに強いので、親同様にたくさん子孫を残す可能性が高い。そして、しばらくすると暑さに強いという性質を与える突然変異を持った個体が大多数になる（その生物種が進化する）。

一方で、もしその突然変異が北極圏に住む生物に発生したのであれば、逆にそれが生存に不利になって、子孫を残す確率が低くなる。そのため、最終的に生存に不利な暑さに強いという性質を与える突然変異を持った個体は集団から排除される。

同じ「暑さに強いという性質を与える突然変異」であっても、その生物が赤道直下に住んでいるか、北極圏に住んでいるかによって、生存に有利・不利が変わってくる。

まさに、その生物を取り巻く自然環境が「暑さに強いという性質を与える突然変異」を残すか、排除するか選択している。

進化実験では、「発生した突然変異を集団中に残すか・排除するか」を自然環境ではなく、実験者が選択する。

この論文では、新型コロナのスパイクタンパク質のRBDの遺伝子に人為的に変異を加え、ヒトのACE2というタンパク質により強固にくっつくRBDを選択するという実験を繰り返して、RBDを進化させている。

変異―Error-prone PCR。

新型コロナのスパイクタンパク質のRBDの遺伝子への突然変異の導入は、Error-prone PCRというものを使って行われる。その名の通り、Error-prone PCRはPCRの一種。

PCRに使われるポリメラーゼは、DNAの情報を読み取って、それと相補になるようなDNAを新たに合成する酵素。この酵素は、DNAの情報を極めて正確に読み取り、滅多にミスすることなく、新たなDNAを合成する。また、この酵素には校正機能も備わっているので、合成途中でミスを犯しても、そのミスを修正することができる。

このポリメラーゼをそのまま使って、RBDの遺伝子への突然変異の導入しようと思っても、かなり効率が悪い。このポリメラーゼは、極めて正確にDNAをコピーするので、突然変異は、滅多に入らない。このままだと、進化実験に何年もの月日を費やすことになる。

ポリメラーゼが正確すぎるという問題を解決するのが、Error-prone PCR。PCRの反応液にマンガンイオンを加えると、ポリメラーゼは、DNA複製エラーを頻発するようになる。これによって、変異率を高め、より多くの、より多種多様な変異DNAが得られる。

今回紹介する研究では、Error-prone PCRによって、多種多様なRBDの変異体を作成している。多種多様なRBDの変異体を作り、その遺伝子を酵母に導入している。

選択―FACS（fluorescence-activated cell sorting）。

多種多様なRBDの変異体ができただけではRBDの進化は起こらない。進化には「選択」が必要。自然界では選択は「自然」によって行われるが、進化実験では選択は「実験者」によって行われる。

今回紹介する研究では、ヒトのACE2というタンパク質にくっつく力が強いRBDを選択する。つまり、新型コロナウイルスの感染力を高めるRBDを選択する。

まずは、ACE2とスクシンイミジルエステル基が付いた蛍光分子を混ぜる（ヒトのACE2は、新型コロナのスパイクタンパク質のターゲットになっているタンパク質。新型コロナは、ACE2に貼りついて感染を開始する）。そうするとACE2の第一級アミン（窒素の周りに水素が2つ、炭素が1つくっついた部分）とスクシンイミジルエステル基がくっついて、ACE2と蛍光分子が融合した分子ができる。

遺伝子を導入した酵母をしばらく培養すると、酵母ディスプレイにより、酵母の細胞膜表面が新型コロナのスパイクタンパク質のRBDだらけになる。そこにACE2と蛍光分子が融合したものを混ぜると、酵母の細胞膜表面のRBDにACE2がくっつく。

先ほど書いた通り、Error-prone PCRによって多種多様なRBDの変異体が作られる。もし、酵母に導入されたRBDの変異体がACE2によりくっつきやすい性質を獲得しているのであれば、ACE2がたくさん酵母の細胞膜表面に集まるので、ACE2に融合している蛍光分子によって、膜表面が明るく光る。もし、酵母に導入されたRBDの変異体がACE2にくっつきにくい性質を獲得しているのであれば、逆に酵母の細胞膜表面はそんなに光らない。

これによって、「酵母の細胞膜表面がどれだけ明るく光っているか」で「新型コロナのスパイクタンパク質のRBDの変異体がACE2へどれだけくっつきやすいか」を知ることができる。

これらピカピカと光っている酵母の中で、より明るく光っている酵母を取ってくるために使うのがFACSという機械。fluorescence-activated cell sortingの略で、その名の通り、細胞から出ている蛍光をもとに細胞を分別する機械。

大阪大学にいたときに所属していた研究室に何台もFACSがあった。一台、ウン千万くらいするらしい。研究室に配属される前に、そんな話を聞いたことがあった。今いる研究室にもFACSがあるが、僕は今まで、一度もFACSに触れたことがない。もちろん、僕の周りにFACSを使っている人はたくさんいる。ありとあらゆる幅広いエラーが出まくるので、FACSを使いこなすのは至難の技のような気がする。僕は使ったことがないが、FACSのエラーと戦っている人はちょくちょく見たことがある。

そんなFACSを使って、より明るく光っている酵母を取ってくるということは、よりACE2にくっつくRBDの変異体を取ってくるということと同じことになる。

この酵母からプラスミドDNAを取ってきて、Error-prone PCRで変異を加え、新たな変異体を作り、再びFACSを使って選択し、、、を繰り返すことによって、むちゃくちゃACE2にくっつくRBDが得られる。

繰り返しになるが、世界で猛威を振るっている新型コロナの変異株は、スパイクタンパク質のRBDに変異が入っていることが原因で感染力が増していると考えられている。その自然界で起こっている新型コロナの進化を試験管内で人工的に引き起こしたというのが今回の論文。

遺伝子型と表現型の紐づけー酵母ディスプレイ。

進化に必要な突然変異は、DNA（情報・遺伝子型）上に生じる。一方で、進化に必要な選択は、タンパク質（機能・表現型）に対してはたらく。

進化に必要な「変異」と「選択」はそれぞれ別の分子に対して作用するので、どうにかしてDNA（遺伝子型）とタンパク質（表現型）を紐づけしないといけない。

進化実験は、

多種多様な変異が入ったDNAをたくさん合成する。

→そのDNAの遺伝情報から多種多様な変異が入ったタンパク質をたくさん合成する。

→よりよいタンパク質を選択する。

→そのタンパク質の遺伝情報が保存されているDNAを取ってくる。

→そのDNAにさらに多種多様な変異が入ったDNAをたくさん合成する。

→…

の繰り返し。

DNA（遺伝子型）とタンパク質（表現型）が紐づけされていないと、性能の高いタンパク質は得られたけれど、このタンパク質の設計図が保存されているDNAがどれか分からなくなってしまう。

タンパク質のアミノ酸配列を読んで、その元となったDNA配列を推定して、その変異が入ったDNAを合成して、進化実験を続けるといった手法もできないことはないが、時間的にもお金的にも、おすすめできない。

今回、紹介している研究では、酵母ディスプレイによって、DNA（遺伝子型）とタンパク質（表現型）を紐づけしている。酵母の細胞内にプラスミドDNA（遺伝子型）が入っていて、酵母の細胞膜上にプラスミドDNAの遺伝情報から合成された新型コロナウイルスのスパイクタンパク質のRBDが固定されている。これにより、よりヒトのACE2に結合するRBDを取ってくれば、酵母の細胞膜を壊して、その設計図が保存されているプラスミドDNAをすぐさま抽出することができる。

進化実験の詳細。

論文のFig 1を見ながら、読んでください。FigはFigureの略で、日本語で「図」を意味します。

www.biorxiv.org

発現量（合成量）の高いRBD変異体を取ってくる。

Fig. 1ではStabilization （安定）となっているが、見ているのは発現量。

まずは、酵母の細胞膜表面にたくさん発現する（合成される）RBDの変異体を取ってくる。酵母ディスプレイのところで説明した通り、RBDはAga2pを介して、蛍光タンパク質に繋がれている。そのため、RBDが細胞膜表面にどれくらい発現されたか調べたいのであれば、FACSで蛍光の強度を測定し、よく光っている酵母を取ってくればよい。1~5個くらい変異が入るError-prone PCRでRBDの変異体を作り、それを酵母ディスプレイ+FACSで選択する作業を2回行う。

Error-prone PCRでの変異の入り具合は、マンガンイオンの濃度を調節すれば、変えられる。

ACE2とよくくっつくRBD変異体を取ってくる。

Fig. 1の中段にあたる部分。

細胞膜表面にRBDを発現した酵母にACE2を撒くと、最初はたくさんRBDとACE2がくっつくが時間が経つにつれて、くっつく速度がどんどんと落ちていく。Fig. 1の中段、下段に描かれているグラフは、時間とRBDにくっついたACE2の量の関係を表している。このグラフを見ると、時間が経つにつれてグラフの傾きがどんどん小さくなっていることが分かる（グラフの傾き（微分）＝速度なので、傾きが小さくなっているということは、RBDとACE2がくっつく速度が遅くなっているということ）。

（RBDはものすごくたくさん存在しているとする）RBDとACE2がくっつく速度が遅くなるのは、RBDとACE2がくっついた複合体ができればできるほど、くっついていたRBDとACE2が離れ離れになる可能性が増えるから。そうなると見かけの速度はどんどんと遅くなってしまう。

RBDとACE2は、共有結合という強固な結合ではなく、電気的な引力による弱い力によって、くっついている（ファンデルワールス力とか）。そのため、ある一定の割合で、くっついているRBDとACE2が離れる可能性がある。

RBDと一人ぼっちのACE2がくっつく可能性を90%とすると、RBDだらけの酵母の細胞膜表面にACE2を10個撒くと、10個×0.9 (90%) = 9個のACE2がRBDにくっつくと期待される。逆にRBDにくっついているACE2が離れ離れになる可能性を10%とすると、RBDにくっついている10個のACE2のうち、10個×0.1 (10%) = 1個のACE2がRBDと離れ離れになる。

RBDだらけの酵母の細胞膜表面にACE2を100個撒くと、最初はどんどんとRBDとACE2がくっつくが、時間が経つにつれて、くっついたRBDとACE2が離れ離れになる頻度も増えて、最終的には、RBDとACE2がひっつく頻度と離れ離れになる頻度が釣り合う。

式にすると、

$[RBDとACE2がひっつく頻度]＝[RBDとACE2が離れ離れになる頻度]$

$[一人ぼっちのACE2]×0.9 (90\%)＝[ひっついているACE2]×0.1 (10\%)$

$[ひっついているACE2]$ をxとおくと、 $[一人ぼっちのACE2]+[ひっついているACE2]=100$ なので、

$[一人ぼっちのACE2]=100-x$

となる。

先ほどの式に加えると、

$(100-x)×0.9=x×0.1$

$90-0.9x=0.1x$

$x=90$

つまり、「ACE2とRBDがひっつく可能性」が90%で「ACE2とRBDが離れ離れになる可能性」が10%だった場合、RBDだらけの酵母の細胞膜表面にACE2を100個撒くと90個のACE2がRBDとくっついている状態で、10個のACE2が一人ぼっちの状態で、”落ち着いている”ということが分かる。

この落ち着いている状態のことを「平衡状態」という。英語では、Equilibrium。Equilibriumという言葉をFig. 1の中で見つけることができると思う。

この段階では、RBDを進化させて、「ACE2とRBDがひっつく可能性」を上げて「ACE2とRBDが離れ離れになる可能性」を下げようとしている。

例えば、進化によって「ACE2とRBDがひっつく可能性」が90%から95%になって、「ACE2とRBDが離れ離れになる可能性」が10%から5%になったとすると、

$(100-x)×0.95=x×0.05$

$95-0.95x=0.05x$

$x=95$

RBDとくっつくACE2の数は、100個中90個から100個中95個へと上がる。

（＊分かりやすさ優先のため、少し不正確な説明をしています。詳しく知りたい人は反応速度論の本を読んでください）

RBDのACE2への結合能が上昇するということは、新型コロナの感染力が増加することを意味している。

この段階では、RBD全体ではなく、RBDの一部であるRBM (receptor-binding motif、受容体結合モチーフ)にerror-prone PCRで人為的に変異を加え、多種多様なRBDの変異体を作っている。多分、ACE2との結合に最も必要な部分だけに絞って、変異を加えることによって、効率よく目的のRBD変異体を得ようとしているのだと思う。

RBMの部分のみerror-prone PCRで増幅すると、多種多様なRBMの変異体ができる。RBM（受容体結合モチーフ）だけだと、進化実験に使えないので、これをRBD（受容体結合ドメイン）にする必要がある。これは、単にRBMのDNA配列以外のRBD配列がくっついた直鎖状のプラスミドDNA（ベクター）を作り、RBMの遺伝子配列とプラスミドDNAをエレポ（エレクトロポレーション）で酵母の中に加えれば解決する話である。

「発現量（合成量）の高いRBDの変異体を取ってくる。」で選択してきたRBDの遺伝子配列が挿入された環状のプラスミドDNAとRBMの境目の領域に貼りつく2種類のプライマー（forward、reverse）を使ってPCRすれば、RBM以外のRBDの配列がくっついた直鎖状のプラスミドDNA（ベクター）を作ることができる。

そうして作られたRBM以外のRBDの配列がくっついた直鎖状のプラスミドDNA（ベクター）とRBM変異体の遺伝子配列（インサート）をエレポで酵母に導入すると、酵母の細胞の中でベクターとインサートが繋がって環状のプラスミドDNAができる。そのプラスミドDNAからRBD変異体が翻訳され、細胞膜表面に発現する。

「選択―FACS（fluorescence-activated cell sorting）。」で詳しく書いた通り、ACE2には蛍光分子がついているので、酵母の細胞膜表面に発現しているRBDにどれだけACE2がくっついているかは、蛍光値を測ればわかる。

この段階では、一人ぼっちのACE2がRBDにくっつく頻度とくっついているACE2とRBDが離れる頻度が釣り合って、見かけ上、RBDにくっついているACE2の数が変わらない落ち着いている状態（平衡状態）で蛍光を測定している。

平衡状態の時にACE2とよくくっつくRBD変異体を取りたいので、酵母にACE2を振りかけてから、平衡状態に達するまでしばらく待つ。振りかけるACE2の濃度にも依るが、1時間から12時間ほど待っているらしい。

無事に平衡状態に達したら、FACSで明るく光っている酵母を選択する。そして、選択された酵母の細胞膜を壊すと、中から目的のRBD変異体の遺伝子配列を持ったプラスミドDNAを取ってくることができる。

この過程を3セット繰り返す（B3、B4、B5、各セット変異導入→選択を3回繰り返す）。1セット目（B3）の1回目は、1000 pMのACE2溶液をRBDが細胞膜表面に発現している酵母に加え、よく光っている上位3%の酵母をFACSで取ってくる。

pMというのは「モル濃度」の単位。pMは「ピコモーラー」と読む。

p（ピコ）は $10^9$ 分の1、つまり10億分の1を表す「接頭語」なので、モル濃度以外の単位にも出てくる。例えば、1 pm（ピコメートル）は、1 m（メートル）の10億分の1の長さを表す単位。「単位の接頭語」と言われると馴染みがないと思うが、m、kといった接頭語は小学生の頃からみんな使っていると思う。mm（ミリメーター）、km（キロメーター）やmg（ミリグラム）、kg（キログラム）とか。m、kは、 $10^3$ 分の1（1000分の1）、 $10^3$ 倍（1000倍）を表している。

「モル濃度」に特有なのは、pMのMの部分。1 M（モーラー）は、1 L（リットル）の水に1 mol（モル）の物質が溶けているときのモル濃度を表している。mol（モル）は物質量の単位。文系の人から「モルが分からんくなったけん理系を挫折した」って話を時々、聞くので、物質量、モルに対して、難しいという幻想を抱いている人がそれなりにいらっしゃる気がする。しかし、物質量はそんなに難しい話ではない。「6× $10^{23}$ 個の分子や原子が集まったものを単に1 mol（モル）と呼ぼう」と言っているだけ。

先ほどの「1000 pMのACE2をRBDが細胞膜表面に発現している酵母に加え、」の「1000 pMのACE2」という部分は、水1Lの中に $1000×6×10^{23}×10^{-9}=6×10^{17}$ 個のACE2が溶けているということを表す。水100 mLならACE2は $6×10^{16}$ 個、水50 mLならACE2は $3×10^{16}$ 個。

これで、モル濃度について分かったと思う。モーラーという単位は、主に生物系や化学系の研究でよく使われる。

僕が普段の研究で一番使う単位は、モル濃度。

モル濃度の説明が終わったので、話を論文に戻す。

1セット目（B3）の1回目は、1000 pMのACE2溶液をRBDが細胞膜表面に発現している酵母に加え、よく光っている上位3%の酵母をFACSで取ってくる。2回目は、800 pMのACE2溶液を使い、3回目は、600 pMのACE2溶液を使う。2回目、3回目は、よく光っている上位0.1%-1%の酵母をFACSで取ってくる。

2セット目（B4）の1回目は、600 pMのACE2溶液を加えた後に上位3%の酵母を取ってきて、2回目は、400 pMのACE2溶液を加えた後に上位0.1%-1%の酵母を取ってきて、3回目は、400 pMのACE2溶液を加えた後に上位0.1%-1%の酵母を取ってくる。

3セット目（B5）の1回目は、200 pMのACE2溶液を加えた後に上位3%の酵母を取ってきて、2回目は、50 pMのACE2溶液を加えた後に上位0.1%-1%の酵母を取ってきて、3回目は、30 pMのACE2溶液を加えた後に上位0.1%-1%の酵母を取ってくる。

こういう具合にACE2の濃度をどんどんと下げていって、よくACE2とくっつくRBD変異体を取ってくる。

B3: 1000 pM → 800 pM → 600 pM

B4: 600 pM → 400 pM → 200 pM

B5: 200 pM → 50 pM → 30 pM

選択される酵母: 上位3% → 上位0.1%-1% → 上位0.1%-1%

ACE2の濃度は段階的に下げていく。徐々に徐々に環境を厳しくしていくと、最終的にむちゃくちゃ厳しい環境でも適応できる変異体を得ることができる。

（ものすごい薄いACE2濃度でも酵母が光る。つまり、ものすごくACE2の濃度が薄くても最後まで残ったRBD変異体はACE2とくっつくことができる）

ACE2と速くくっつくRBD変異体を取ってくる。

Fig. 1の下段にあたる部分。

「ACE2とよくくっつくRBD変異体を取ってくる。」で取ってきたRBD変異体をerror-prone PCRでさらに変異を加えながら増幅させる。前までは、RBD（受容体結合ドメイン）の一部であるRBMだけに変異を加えていたが、ここではRBD全体をerror-prone PCRで増やすので、変異はRBD全体に入る。

前回は、RBDが細胞表面に発現した酵母にACE2溶液を加え、平衡状態になるまで待ってから、FACSで選択を行った。つまり、一人ぼっちのACE2がRBDにくっつく頻度とくっついているACE2とRBDが離れる頻度が釣り合って、見かけ上、RBDにくっついているACE2の数が変わらない落ち着いている状態になるまで、ずっと待ってから、FACSで選択を行った。

今回は、ACE2と速くくっつくRBD変異体を取ってきたいので、平衡状態に達する前にFACSを使って、選択を行う。

（ここら辺の説明はあまり自信がないが）おそらく30 pMのACE2溶液をRBDが細胞表面に発現している酵母に加え、8時間後にFACSで選択を行っている。その後、再びACE2溶液を加え、今度は1時間半後にFACSで選択を行っている。多分、蛍光強度が上位0.1%-1%の酵母を選択しているのだと思う。

これで進化実験は終わり。進化実験によって、より速く・強力にACE2にくっつくスパイクタンパク質のRBDが得られた。

解析。

前提知識。

タンパク質上のアミノ酸変異の表し方―N501Y、E484Kとは？

「N501Yの変異、E484Kの変異が入った変異株が蔓延しています」といったニュースを聞いたことがあるかもしれない。ここでは、このN501Y、E484Kがどういう意味か説明する。

この論文にも、「大文字アルファベット+数字+大文字アルファベット」が大量に出てくる。

先ほども説明した通り、タンパク質とは、アミノ酸が数珠のようにつながったひも状の分子。「アミノ基」（-NH2）と「カルボキシル基」（-COOH）を持つ分子は「アミノ酸」と呼ばれ、種類は無限にあるが、生体内では主に20種類のアミノ酸が使われている。

20種類のアミノ酸には、それぞれ「大文字アルファベット」の略称がある。アスパラギンはN、チロシンはY、グルタミン酸はE、リシンはK、、、などなど。詳しく知りたい人は以下のサイトを参照のこと。

www.nacalai.co.jp

そう、N501Y、E484KのN、Y、E、Kはアミノ酸を表している。そして、501、484はタンパク質を構成しているアミノ酸の通し番号。

N501Y、E484Kというのは、初期の新型コロナウイルスが持っていたスパイクタンパク質の501番目のアスパラギン（N）と484番目のグルタミン酸（E）が変異によって、チロシン（Y）、リシン（K）に変わってしまったということを表している。

「大文字アルファベット+数字+大文字アルファベット」というのは、「変異前のアミノ酸+アミノ酸の位置+変異後のアミノ酸」。

もちろん、変異自体は新型コロナのゲノムRNAに入る。タンパク質の設計図に変異が入るので、翻訳された（合成された）スパイクタンパク質にも変異が入る。

新型コロナウイルスの変異株とは？

最近だと、「デルタ株が猛威を振るっている」というニュースをよく聞く。デルタ株というのは、かつて「インド株」と呼ばれていた変異株。

他にもアルファ株、ベータ株、ガンマ株といった変異株も存在する。それらはかつて、「イギリス株」、「南アフリカ株」、「ブラジル株」と呼ばれていた。

今までは、その変異株が出現した国の名前を取って、○○株と言っていたが、WHOが国名ではなくギリシャ文字で呼ぶという方針を発表したので、以後、変異株を国名で呼ぶことはなくなった。

この論文は、WHOがそういった指針を発表する前に書かれたものなので、変異株の名前が国名になっている。

詳しい変異株の変異については以下のwebサイトを参照のこと。Wikipediaであるが、一応、ちゃんと引用文献が明記されているので（Ref.って書かれてあるところ）、多分、正確な情報だと思う。

ja.wikipedia.org

最近だと、ラムダ株というやつもやばいらしいですね。

解離定数―ACE2とスパイクタンパク質のRBDのくっつきやすさ。

この研究の目的は、ACE2とよくくっつくスパイクタンパク質のRBDを進化実験によって取ってくるというものであった。

「タンパク質同士のくっつきやすさ」を議論したいのだから「くっつきやすさ」の指標が必要。「進化させたRBDはACE2とくっつきやすくなったような気がします」なんて言おうものなら、論文は通らない。「くっつきやすさ」は、数値を使って表さなければならない。数値を使って、どの程度、進化させたRBDがACE2とくっつきやすくなったか示さなければならない。

そして、その指標は、実験によって「測定」できなければいけない。

タンパク質に限らず、ある分子とある分子のくっつきやすさを表す指標として「解離定数」というものがよく使われている。解離定数という名前の通り、くっつきやすさというよりも「離れやすさ」に着目した指標。解離定数が小さいほど、2つの分子は離れにくい。逆に言うと、2つの分子はくっつきやすい。

新型コロナのスパイクタンパク質のRBDとACE2がくっついたり、離れたりするところを式に表すと、次にようになる。

$\displaystyle RBD・ACE2複合体⇔ RBD + ACE2$

解離定数を $K_{d}$ と表し、分子Aのモル濃度を[A]と表すと、

$\displaystyle K_{d} =\frac{\qquad[RBD][ACE2]\qquad}{\quad[RBD・ACE2複合体]\qquad}$

ただし、[RBD]、[ACE2]、[RBD・ACE2複合体]は平衡状態に達した時の濃度。RBDとACE2がくっつく速度と離れる速度が釣り合って、RBD、ACE2、RBD・ACE2複合体の濃度がずっと変わらない時に解離定数を測定する（そうじゃないと、時間によって解離定数の値が変わってしまう）。

今回の場合、解離定数の単位は、pMとなる。

タンパク質の構造解析―クライオ電子顕微鏡。

この論文では、クライオ電子顕微鏡を使って、進化実験によって進化した新型コロナのスパイクタンパク質のRBDの構造解析を行っている。

2017年のノーベル化学賞は、クライオ電子顕微鏡の開発に寄与した研究者たちに贈られた。ノーベル賞の対象になるほど、クライオ電子顕微鏡は重要な技術。

2014年、僕が学部1回生だったとき、「クライオ電子顕微鏡について調べてこい」っていうレポート課題が出た。懐かしい。。。

クライオは英語で「cryo」。低温っていう意味がある。つまり、cryoelectron microscopyを直訳すると、「低温電子顕微鏡」なのだが、みんな「クライオ電子顕微鏡」って言っている。

その名の通り、クライオ電子顕微鏡は、試料を極低温状態で観察できる電子顕微鏡。電子顕微鏡は、光ではなく電子を使うことによって、より小さな試料を観察することができる顕微鏡。

顕微鏡の分解能、つまり「どれだけモノを細かく見ることができるのか」というのは、使ってる光の波長によって上限が決まっている。使っている波の波長が短ければ短いほど、分解能が高い（光は波。波長は波一つ分の長さ）。詳しくは、レイリーの分解能の式を参照のこと。

（僕は、光物理学 (共立物理学講座 (11))という本でレイリーの分解能の式などを勉強した。学部4回生の頃にもぐった物理系の講義では、この本が教科書として使われていた。講義をされている教授（多分、50代後半？）も学生の頃にこの本を使って勉強していたらしい。この本は、ロングセラー）

posted with カエレバ

分解能というのは、使っている波の波長によって決まってしまう。目に見えるような光（可視光線）の波長は、原子のサイズに比べて、かなり大きい。より波長の小さい紫外線・X線・ガンマ線などを使うと、エネルギーが高すぎて、観察対象が壊れてしまう。

「ならば、光よりも波長が短い波を使おう！」ということで選ばれた波が電子。電子は、原子核の周りをぐるぐると回っている粒というイメージを持っている人が多いと思う。しかし、電子は粒としての性質に加え、波としての性質も持っている。電子の波長は、「アインシュタイン‐ド＝ブロイの関係式」を使って求めることができる。

詳しく知りたい人は、量子力学の本を読んでください。量子力学の勉強の仕方は、『「量子コンピュータで世界中の暗号が破られる？」ショアのアルゴリズムをゆるふわな感じで説明してみた話。』という文章の下の方に書いてあるのでよければどうぞ。

blog.sun-ek2.com

とにかく電子は目に見えるような光に比べて、圧倒的に波長が短い。そのため、電子を使って顕微鏡を作った方が高い分解能が得られる。こうして、誕生したのが電子顕微鏡。

しかし、電子は光よりも顕微鏡内にある空気によって、散乱されてしまう。発射した電子の大半は、空気中の窒素分子や酸素分子に衝突して、進路が歪められてしまい、ちゃんと試料に届く電子は、ごくわずか。

それを回避するために電子顕微鏡の中は真空でないといけない。中に窒素分子や酸素分子がなければ、電子は進路を歪められることなく、目的物に到着することができる。

しかし、顕微鏡内を真空にすることによって、水分子を含む状態で試料を観察できないという新たな問題が生じる。生物は、ほとんどが水で出来ている。そんな生物試料を真空になっている顕微鏡の中に入れると、水が蒸発してしまい、試料が干からびてしまう。生物のほとんどが水で出来ていることから分かる通り、生体内のタンパク質の形などは水分子の影響を強く受けている。そのため、水が蒸発してしまうと、見たいものと全く違う形になってしまう。

今回の論文では、進化によって新型コロナのスパイクタンパク質のRBDがどのような仕組みでヒトのACE2にくっつきやすくなったのか、またRBDがどのような仕組みで医療用の抗体にくっつきにくくなったのか、といったことを知ろうとしている。普通の電子顕微鏡にRBD、ACE2、医療用の抗体などをそのまま入れると、水分が蒸発してしまい、形がぐちゃぐちゃになってしまい、もはや何を見ているのか分からなくなる。

そんな状況を打開するのが、クライオ電子顕微鏡。生物試料を顕微鏡内に入れる前に急速冷凍して、撮影時も凍った状態を保つことができる電子顕微鏡である。

生物試料を凍らすことによって、水分を保持することができ、より生きていたときに近い状態でタンパク質なんかを観察することができる。また使われている電子は、エネルギーが高く、試料を壊してしまう欠点があったが、凍らせることによって、その被害はある程度、抑えられる。

詳しくは以下のwebサイトで。

http://www.astf-kha.jp/synchrotron/publication/files/2020lecture_08.pdf

他にもタンパク質の構造解析を行う技術として、X線結晶構造解析や核磁気共鳴（NMR）などがある。僕が修士1年までいた大阪大学はX線結晶構造解析の研究が強い、、、と何人かの先生が言っていた。授業でも何回か取り扱ったし、学生実験でもやったが、詳しいこと（逆格子うんぬんとか）は忘れてしまった。核磁気共鳴は、病院でよく見かけるMRIという装置と同じような原理。こちらも授業で取り扱ったが、深い原理については忘れてしまった。

今までタンパク質の構造解析には、X線結晶構造解析がよく用いられてきたが、最近は、クライオ電子顕微鏡が猛烈に追い上げている。あと5年くらいで、クライオ電子顕微鏡がもっともよく使われるようになるのでは。

新型コロナのスパイクタンパク質のRBD変異解析。

論文のFig 1、Table 1を見ながら、読んでください。Table 1のRBD residueの行に書いてある数字は、何番目のアミノ酸に変異が入っているのかを示している。大文字のアルファベットはアミノ酸の一文字表記。RBD wild-typeっていうのが、変異する前の新型コロナのRBDのアミノ酸を表している。太文字は、50%以上固定された変異。薄い赤色で塗られているのは、実際に自然界でも見られている変異。

Fig 1は、先ほどの進化実験の概要で、Table 1は、進化実験でRBD上に固定されたアミノ酸変異を表している。「ある変異が固定された」というのは、FACSで選択したRBD遺伝子の配列を解析すると、ある程度の頻度で、その変異が見られたという意味である（ある程度がどの程度かというのは論文によってマチマチ）。

進化実験では、まず発現量が多いRBD変異体を選択していた。Table 1のLibrary S2は、固定された変異を表している。Libraryはカタカナで表すとライブラリー。ライブラリーは、日本語で図書館という意味であるが、僕らの分野ではDNAの集まりのことをライブラリーと言っている。FACSで酵母を選択し、選択した酵母を壊して、細胞内から抽出したプラスミドDNAのことをDNAライブラリーという。

Library S2で固定された変異はI358F。新型コロナウイルスのスパイクタンパク質の358番目のイソロイシン（I）というアミノ酸がフェニルアラニン（F）に変化したということを表している。この変異が入ると、酵母の細胞膜表面の蛍光の明るさが2倍になった。ここから、I358Fという変異が入ったことによって、RBD（＋Aga2p―蛍光タンパク質）がよりたくさん安定的に酵母の細胞膜上へ発現するようになったということが分かる。

次は、Fig 1の中段にあたる部分。Library B3ではE484K、N501Yが70%以上の割合で固定されている。つまり、B3で選択されたプラスミドDNAの寄せ集め（DNAライブラリー）からランダムにプラスミドDNAを選ぶと、70%以上の確率でE484K、N501Yの変異が入っているということだ。また、S477Nという変異も固定されてた。E484K、N501Yは、アルファ株（イギリス株）、ベータ株（南アフリカ株）、ガンマ株（南アフリカ株）にも入っている変異。S477Nもコロナに感染した患者から取ってきたウイルスに見られる変異らしい。

試験管内進化でも、自然界で発生している新型コロナの変異株と同様の変異が出現する（E484K、N501Y、S477N）。

→試験管内進化によって、将来どのような変異株が出現するか予測し、事前に対策（予めワクチンを作っておくとか）することができるのでは？

Library B4も同様。Library B5は、E484K、Q498R、N501Yという3つの変異が100%の割合で固定されていた。

Library B6では、さらにS477Nが100%の割合で固定されていた。また、他にも色々な変異（V445K、I468T、T470M）が蓄積していた。Library B6は、ACE2と直接結合する部分ではなく、その周辺部に変異が蓄積する傾向があり、これはコンピュータを用いた先行研究の結果と一致しているらしい。

新型コロナのスパイクタンパク質のRBD変異体の生化学解析。

Table 2を見ながら、読んでください。

列名のClone（クローン）っていうのは「単離されたRBD変異体」という意味。Libraryの列にその変異体がどの段階で発生したかを表している。Mutationsは、RBDが持っている変異を表している。

Tmは変性中点温度を表している。タンパク質はアミノ酸がつながったひも。普段はそのひもが折り畳まれて、それぞれのタンパク質に特有の立体構造をとっている。この特有の立体構造がタンパク質が機能するためにとても大切。タンパク質の溶液を徐々に熱すると、タンパク質の立体構造が壊れてしまう（変性する）。そして、どのくらいの温度で変性するのかは、それぞれのタンパク質によって異なる。水の中に溶けているタンパク質の半数の構造が壊れるときの温度を「変性中点温度」という。この変性中点温度が高ければ高いほど、そのタンパク質は熱に強い。

→進化実験が進むにつれて（B3→B4→B5）、RBDは熱に強くなっている。

Yeast display KD, appっていうのは、酵母ディスプレイの結果から算出した解離定数。算出方法は後で説明する。Octet RED KDっていうのは、Octet RED96 systemという装置で測定した解離定数。これも後で説明する。解離定数は算出方法によって異なるがどちらも進化実験が進むにつれて（B3→B4→B5→B6）、値は小さくなっている。解離定数が小さくなっているということは、進化するに従って、RBDとACE2が離れにくくなっているということである。

$k_{on}$ は、RBDとACE2がくっつく反応速度定数を表している。この反応速度定数が大きくなればなるほど、RBDとACE2がくっつく速度が速くなる。表を見てみると、B5まで反応速度定数はそこまで大きく増加していないことが分かる。一方で、解離定数はどんどんと下がっているので、これよりB5までは、RBDとACE2が離れる速度が遅くなるという進化が起こっていたということが分かる。一方でB6では、反応速度定数が上がっているので、RBDとACE2がくっつく速度が上がるという進化が起こっていたということが分かる。

ちなみにRBD-71は、deep mutational scanningという手法で予測されているRBDにとって有益な変異をRBD-62に導入して構築したもの。deep mutational scanning についていは後で説明する。ACE2との結合能は下がってしまったが、熱安定性が向上している。

deep mutational scanningと解離定数の推定。

（ちょっと話が難しいが、これを理解していなくても、特に影響はないので、飛ばしてもらってもいいです）

論文のFig 2を見ながら、読んでください。

Fig2のAは、GISAIDというデータベース上にある新型コロナウイルスの変異データ（横軸）と以下の論文に掲載されているdeep mutational scanningから推定した解離定数（縦軸）のデータを用いたグラフ。

www.sciencedirect.com

GISAIDというデータベースは、鳥インフルエンザウイルスのゲノムデータを世界で共有するために2008年に作られたものらしい。ゲノムというのは、ウイルスの設計図一式のこと。Fig2のAの横軸は、GISAIDに保存されている多種多様な新型コロナ変異株のゲノム配列の内、何個の配列に特定の変異が入っているかを表している。例えば、グラフを見ると保存されている新型コロナ変異株のゲノム配列の内、1000配列にY453Fという変異が存在しているということが読み取れる。

縦軸は、deep mutational scanningから推定した解離定数。今から解離定数の推定の仕方を説明する。

先ほど紹介した論文のFigure S1のAを見ながら読んでください。この論文でも同様にRBDとACE2の結合能を酵母ディスプレイとFACSを使って調べている。この論文では、今紹介している論文とは異なり、変異を加えたRBDの遺伝子配列の末端に短いDNAを付け加えている。この短いDNAの配列はそれぞれの変異体によって異なる。このようなものをDNAバーコーディングという。まずは、合成したRBD変異体遺伝子＋DNAバーコードの配列を酵母に導入する前に第三世代のDNAシーケンサーを使ってDNA配列を解析する。DNAシーケンサーとは、DNA配列を読む装置のことである。DNAシーケンサーは、第一世代から第四世代まで実用化されており、第五世代（最終形態と言われている）は、まだ研究段階である。使われている技術の違いによって世代が分けられている。

DNA配列を読むことによって、それぞれの変異体の遺伝子配列に対して、どのようなDNA配列がバーコードとして使われているか対応表を作ることができる。

次にFigure 2のBを見ながら読んでください。合成したRBD変異体遺伝子＋DNAバーコードの配列を読んだ後、RBD遺伝子配列＋DNAバーコードを酵母に導入し、RBDを酵母の細胞膜上に発現させる。その後、これら酵母たちの蛍光強度を測定する。その結果は、Figure 2のBの一番上にある青色のグラフの0に対応する。このグラフの横軸は蛍光強度で、縦軸は頻度。本来は、全ての細胞の蛍光強度は0になるはずであるが、酵母を構成している分子が微妙に蛍光を発するとか、測定誤差があるとかいった理由で、図のような分布が得られる。その後、この分布の面積を求め、その95%が含まれるように縦線を引き、その領域をbin 1とする。今度は、蛍光標識付きACE2を $10^{-6.5}$ M加え、蛍光を測定する。その結果は、Figure 2のBの一番上にある青色のグラフの $10^{-6.5}$ に対応する。その後、0の時と同様にこの分布の面積を求め、その95%が含まれるように縦線を引き、その領域をbin 4とする。最後にbin 1とbin 4の領域を作るために引いた2本の直線の真ん中に線を引き、左側をbin 2、右側をbin 3とする（ただし横軸は対数）。

bin 1、2、3、4の領域が決まったら、蛍光標識付きACE2の濃度を振って、それぞれの細胞の蛍光強度を測定し、その強度に従って、bin 1、2、3、4という具合に4つのグループに分け、それぞれの酵母を壊し、中からプラスミドDNAを取り出し、DNAバーコード部分の配列を第二世代のDNAシーケンサーを使って読む。以前、合成したRBD変異体遺伝子＋DNAバーコードの配列を読んでいたので、バーコード部分を読むだけで、そのバーコードにくっついているRBD変異体遺伝子配列を知ることができる。

こうして、あるRBD変異体遺伝子を持っている酵母がbin 1に何個、bin 2に何個、bin 3に何個、bin 4に何個、振り分けられたか分かる。binの数はもちろん多ければ多いほどいいが、例えばbinを1から8まで作ると、実験量が倍になる。そのため、この論文では実験量がそこまで多くならないように蛍光強度の強さを4つのグループに分けている。

その後、それぞれのRBD変異体遺伝子の加重平均bin（加重平均蛍光強度）を求める。例えば、あるRBD変異体遺伝子を持っている酵母がbin 1に2個、bin 2に3個、bin 3に5個、bin 4に8個あったとする。そうすると、binの加重平均は、

$(1×2+2×3+3×5+4×8)/(2+3+5+8)=3.05$

となる。これをACE2の濃度を変えて、それぞれのRBD変異体遺伝子に対して行う。そうすると、Figure S2のDのようなグラフを描くことができる。ここから解離定数を求めることができる。

細かく説明しようかどうか迷ったが、解離定数の出し方を説明しておく。分からなければ飛ばしてください。飛ばしても、今後の内容が分からなくなることはないです。

RBDとACE2が結合する反応速度定数を $k_{on}$ 、解離する反応速度定数を $k_{off}$ とすると、

$\frac{d[RBD・ACE2複合体] \quad}{dt}=k_{on}[RBD][ACE2]-k_{off}[RBD・ACE2複合体]$

また、ACE2とRBD・ACE2複合体の合計量は変わらないので、

$[ACE2] + [RBD・ACE2複合体] = C (一定)$

この式を先ほどの式に代入すると、

$\frac{d[RBD・ACE2複合体] \quad}{dt}=k_{on}(C-[RBD・ACE2複合体])[ACE2]-k_{off}[RBD・ACE2複合体]$

平衡状態に達すると、 $\frac{d[RBD・ACE2複合体] \quad}{dt}=0$ となる。

$k_{on}(C-[RBD・ACE2複合体])[ACE2]-k_{off}[RBD・ACE2複合体]=0$

また、 $K_{D,app} = \frac{k_{off}}{k_{on}}$ なので、

$(C-[RBD・ACE2複合体])[ACE2]-K_{D,app}[RBD・ACE2複合体]=0$

$([ACE2]+K_{D,app})[RBD・ACE2複合体]=C[ACE2]$

$[RBD・ACE2複合体]=\frac{C[ACE2]}{([ACE2]+K_{D, app})}$

RBD・ACE2複合体のACE2には蛍光分子が付いている。蛍光強度 $\overline{bin_{[ACE2]}}$ とRBD・ACE2複合体の濃度に線形関係があると考えられるので、

$\overline{bin_{[ACE2]}}=α[RBD・ACE2複合体]+b$

この式に先ほどの式を代入すると、

$\overline{bin_{[ACE2]}}=\frac{αC[ACE2]}{([ACE2]+K_{D, app})}+b$

$αC$ を $a$ に置き換えると、

$\overline{bin_{[ACE2]}}=\frac{a×[ACE2]}{([ACE2]+K_{D, app})}+b$

となり、無事に論文に出ていた式を求めることができた。

各ACE2濃度のbinの加重平均は、この式に従う。式の $a,b,K_{D, app}$ は、最小自乗法を使って決められているのだと思う。「解離定数の出し方の説明」を読み飛ばしていない人（理系の人）であれば、ほぼ全員、「最小自乗法」のことは詳しく知っていると思うので説明は省く。

こうして、RBDの多種多様な変異体のそれぞれの解離定数を推定することができる。昔は、ジデオキシ法（サンガー法）という方法でDNA配列を読んでいたが、10年～20年前くらいから次世代シーケンサーという新たなDNA配列解読法を用いた機械が研究現場で広く使われるようになっていった。次世代シーケンサーは、ジデオキシ法（サンガー法）に比べて圧倒的に多くのDNA配列を読むことができる。このような大量のデータを出力する次世代シーケンサーのおかげで、多種多様なタンパク質の変異体の性質をdeep mutational scanningによって網羅的に解析できるようになった。

ここで、本題の論文に戻る。

長々と説明してきたが、GISAIDというデータベースとdeep mutational scanningのデータによって、元々の論文のFig2のAが描かれている。縦軸は、変異が入る前のRBDの解離定数の対数をとったものから変異が入った後のRBDの解離定数の対数を引いたものだと思う。□で表されている点は、ほとんど見られない変異で、赤色の点は、集団中でよく見られている変異。黒色の点は、まあまあの頻度で見られる変異。青色の点は、deep mutational scanningではなく、きちんと1つ1つ、ACE2濃度を振って、その時の蛍光濃度を測って算出した値を表している。Deep mutational scanningは大量の変異体の解離定数を一括して求めることができる利点があるが、先ほど説明した通り、それぞれのbinに入っている変異体の数で加重平均を取って蛍光値を近似的に求めているので、精度は良くない。そのため、赤色と青色の値が異なっている。Deep mutational scanningのそれぞれのデータ点の精度は良くないが、大量の変異体の解離定数を求めることができるので、データ全体がどのような特徴を持っているか知るのには便利。今回の場合は、GISAIDというデータベース上で多く見られている変異ほど、解離定数の対数の差分が大きくなる（つまり解離定数がより小さくなる=よりACE2と離れにくくなる）という特徴を捉えていた。

Fig2のBは、Fig2のAの青色の点を求める時に使った生データ。Fig2のCは、Fig2のAから477番目、484番目、501番目の変異だけを取り出して表示したグラフ。主張したいことは、Fig2のAと変わらないと思う。Fig2のDは、進化実験のそれぞれのサイクルで一番ACE2と良く結合するRBDを調べたデータ。比較のためにN501Yという変異が入ったRBDも調べている。進化実験が進むにつれて、解離定数が小さくなっていることが分かる。

Fig2のE、Fは、Octet RED96 SystemでRBDの解離定数を求める実験で得られた生データ。Eが変異が入る前のRBDで、Fが進化実験で最終的に得られたRBD。

進化前・進化後のRBDとACE2の複合体の構造解析。

Fig3を見ながら読んでください。ここでは先ほど説明したクライオ電子顕微鏡を使って、RBD-WT（進化前）、RBD-62（進化後）とACE2の複合体の構造解析を行っている。

タンパク質の構造を表現する方法は色々とある。リボンモデル（リボンダイアグラム）、骨格モデル、空間充填モデル、針金モデル、球棒モデルなど。

本来のタンパク質の構造を正確に表しているのは、空間充填モデルだと思う。Fig 3のE、Fがそれに相当する。しかし、これだとタンパク質の詳細な構造や内部がよく分からない。そのため、タンパク質の構造を表現する方法として、リボンモデル（リボンダイアグラム）が多分、一番よく使われている。Fig 3のAがそれに相当する。タンパク質には、αヘリックスとβシートと呼ばれる代表的なモチーフ（部分的な構造）があり、リボンモデルは、その2つのモチーフを強調して表現している。Fig 3のAのピンク色で表現されているのがRBDで、よく見ると矢印が複数、描かれている。この矢印がβシートを表している。一方で、緑色で表現されているのがACE2で、グルグル巻きになっている筒が複数、描かれている。このグルグル巻きの筒がαヘリックスを表している。もちろん、本物のタンパク質に矢印のような構造はないし、αヘリックスの構造もリボンモデルは本物のタンパク質を忠実に再現したものではない。本物のタンパク質と形は違うが、タンパク質内部でどのような部分構造をとっているか一目でわかる。

Fig 3のBは、Aの赤い四角で囲っている部分の拡大図。AもBも、タンパク質の構造をリボンモデルで表現しているが、進化実験により導入されたRBD（受容体結合ドメイン）のRBM（受容体結合モチーフ）上にあるS477N、Q498R、N501Yの変異と、それに結合しているタンパク質の一部だけは空間充填モデルで表現されている。緑色で表されているタンパク質はACE2。ピンク色で表現されているのが、進化実験によって得られたRBD-62。少し見にくいが、ピンク色の線に少し重なっている白色の線は、変異が入る前のRBD（RBD-WT）の構造を表している。白色の線とピンク色の線は、少しずれている。つまり、進化実験によって変異がいくつか導入されたことによって、RBDの構造が少し変化したということが分かる。

ただ、Fig 3のA、Bだけだと、全体の構造は分かるが、変異が導入されたことによってRBDとACE2の結合にどのような影響が出たのか、よく分からない。そのため、Fig 3のC、DでRBDとACE2の結合部分の構造をもっと詳しく見ている。

Fig 3のCでは針金モデル、Fig3のDでは球棒モデルを使ってタンパク質の構造を表現している。構造の表現方法は「何を知りたいか」によって柔軟に変えていく。正確な構造を描きたければ、空間充填モデル、タンパク質の部分的な構造を俯瞰して眺めたいのであれば、リボンモデル、細部の構造を知りたければ、針金モデルや球棒モデルを使えばいいと思う。Fig 3のC、Dで赤色、青色、黄色で表されているのは、それぞれ酸素原子、窒素原子、硫黄原子だと思う。もちろんタンパク質の中に酸素、窒素、硫黄原子はたくさん含まれているが、そのほとんどは赤、青、黄色で色分けされていない。Fig 3のC、Dでは、RBDとACE2の結合に関わる重要な酸素、窒素、硫黄原子だけ色を変えて強調している。

Fig 3のCを見ると、スパイクタンパク質の477番目のセリン（S）がアスパラギン（N）に変わったことによって、ACE2の19番目のセリン（S）と結合できるようになっている。この結合は、恐らく水素結合。また、E484KとS477Nの変異によって、RBDの構造が少し変わり、スパイクタンパク質の486番目のフェニルアラニン（F）がACE2の82番目のメチオニン（M）と結合できるようになっている。この結合は、S-π相互作用によるもの。S-π相互作用については、ちゃんと説明できる自信がないので割愛。この後に説明するπ-π相互作用と同じ仕組みだとは思うが…どうなんだろうか。。。

Fig3のDを見ると、スパイクタンパク質の501番目のアスパラギン（N）がチロシン（Y）に変わったことによって、ACE2の41番目のチロシン（Y）と結合できるようになっている。この結合は、π-π相互作用によるもの。チロシンというアミノ酸は、芳香環という炭素が6つくっついてできた六角形の環を持っている。この環の上側と下側にはマイナスの電気を持った電子の雲が存在している。この電子をπ電子という。電子の雲というのは、あくまでもたとえ話で、実際は、量子力学の法則に従って、電子は芳香環の周りに、ある確率で存在している。電子の雲というよりも、芳香環は電子の存在確率の雲で覆われている。電子は、ある時には環の真ん中の方に存在し、ある時には環の端っこの方に存在したりするので、瞬間瞬間で、分子全体でマイナスの電気を帯びている場所が変わる。2つの芳香環が並行で並んでいる場合、仮に1つ目の芳香環の真ん中に電子が存在する場合、2つ目の芳香環の電子は、その電子と反発して、環の端っこの方に存在する可能性が高くなる。1つ目の芳香環は、環の中心はマイナスの電気を帯びていて、環の端っこはプラスの電気を帯びている。2つ目の芳香環は、環の端っこはプラスの電気を帯びていて、環の端っこはマイナスの電気を帯びている。そのため、2つの芳香環は互いに引き合う。これがπ-π相互作用。別に電子が環の中心に来る必要はない。例えば、1つ目の芳香環の電子が環の左半分にくれば、2つ目の芳香環の電子は環の右半分にやってくるので、お互いプラスの電気とマイナスの電気を帯びた部分ができ、環は互いに引き合う。

S-π相互作用もπ-π相互作用と同じで、硫黄原子の孤立電子対が接近することによって、芳香環のπ電子がそれを避けるように分布し、その結果、そこが正に帯電し、クーロン力で結合ができるんだろうと思う。

さらにFig3のDを見ると、スパイクタンパク質の498番目のグルタミン（Q）がアルギニン（R）に変わったことによって、ACE2の42番目のグルタミン（Q）と結合できるようになっている。この結合は、水素結合によるもの。また、498番目のアルギニン（R）はACE2の36番目のアスパラギン酸（D）と塩橋によって結合している（本文中には38番目と書いてある。どちらが正しいかは不明）。アルギニン（Fig 3のDのQ498Rと書かれてある部分）の青丸は窒素原子を表している。省略されているが窒素原子には水素原子が結合している。窒素原子は、孤立電子対というものを持っており、この電子対にプラスの電気を持っている水素イオンが結合する（配位結合）。そのため、アルギニンの端っこの方はプラスの電気を帯びている。一方で、アスパラギン酸（Fig 3のDのD36と書かれてある部分）の赤丸は酸素原子を表している。酸素原子は、分子の中の電子を吸引する性質があるので、アスパラギン酸の端っこの方はマイナスの電気を帯びている。そのため、プラスの電気を帯びたアルギニンの端っこの方とマイナスの電気を帯びたアスパラギン酸の端っこの方が引き合う。これが塩橋。

Fig 3のEは、ACE2の構造を表している。黒い線で囲まれたところにRBDが結合する。図の赤色の部分は、電子が足りていない場所で、青色の部分が電子がたくさんある部分。電子はマイナスの電気を帯びているので、電子が足りていない赤色の場所は、プラスの電気を帯びている。逆に電子がたくさんある青色の場所はマイナスの電気を帯びている。Fig 3のEの図は、全体的に赤色で塗られている。つまり、ACE2の表面は、全体的にプラスの電気を帯びている。

Fig 3のFは、RBD-WT（進化前）、RBD-62（進化後）の構造を表している。進化によって、青色の部分が増えているということが分かる。つまり、進化したRBDの表面は全体的にマイナスの電気を帯びている。ACE2の表面はプラスの電気を帯びているので、進化によってマイナスの電気を表面に帯びているRBDがよりプラスの電気を表面に帯びているACE2に引き寄せられやすくなった。

進化前・進化後のRBDが結合することによって、ACE2のはたらきは阻害されるのか？

最初の方でも説明した通り、「新型コロナウイルス感染症（COVID-19）の治療薬を作りたい！」っていうのが、この研究の目的の1つ。

進化させたRBDを感染症の患者に投与すると、ヒトの細胞のACE2にいち早く結合するので、新型コロナのスパイクタンパク質のRBDがACE2に結合するのを邪魔することができる。進化させたRBDに邪魔された新型コロナは、これ以上、ヒトの細胞に感染することができないので、増殖することができず、そうこうしているうちに体内の免疫によって退治されてしまう。

進化させたRBDは、新型コロナとヒトの細胞との結合を邪魔することによって、感染症を治療する。しかし、この進化させたRBDを治療薬に使うためには、このRBDが「ACE2のはたらきを邪魔しないこと」を確認しなくてはならない。

ACE2は、最初の方で説明した通り、血圧を調整するはたらきを持つ酵素（タンパク質）。進化したRBDを投与すると、ACE2と結合して、新型コロナの更なる感染を抑えることができたけど、ついでにRBDがACE2のはたらきも邪魔するので、血圧のコントロールができなくなりました、、、というのは、良くない。

RBDがACE2のはたらきを邪魔するのかどうかを調べた実験の結果がFig 4のAに載っている。

使っている試薬は、SensoLyte® 390 ACE2 Activity Assay Kit。ACE2の仕事は、Ang IIというペプチドホルモン（アミノ酸の鎖）の一部を切断して、Ang 1-7という別のペプチドホルモンへ変換すること。この「ペプチドホルモンを切断するはたらき」がRBDを加えた後でも維持されているか調べている。

試薬に入っているペプチドの両端には、蛍光分子とクエンチャーと呼ばれる分子が繋がれている。本来なら蛍光分子に光を当てると、その分子から蛍光が出てくる。しかし、クエンチャーと呼ばれる分子が近くにいると、蛍光分子は、外から当てられた光のエネルギーを蛍光で放出することを止め、クエンチャーにエネルギーを移動させる。このことを蛍光共鳴エネルギー移動（FRET）という。そのため、ペプチドの両端に蛍光分子とクエンチャーが繋がれている状態で光を当てても蛍光は見えない。しかし、ペプチドがちぎれて、蛍光分子とクエンチャーが離れ離れになると、蛍光を見ることができる。これを応用することで、RBDとくっついた状態のACE2がどれだけペプチドを切断しているのか、蛍光量を使って、調べることができる。蛍光が強ければ強いほど、RBDがACE2の仕事を邪魔していないことが分かる。

Fig 3のAの上段のIn vitroというのは、「試験管内で」という意味。ACE2とRBDとACE2 Activity Assay Kitを試験管内で混ぜて測定している。もちろん、先ほど説明した通り、試験管は使っていないと思う。実際に使っているのは、8連チューブだと思う。

グラフの縦軸は蛍光強度で横軸は時間。反応を始めて、蛍光強度がどのように変化していったのか、グラフで示している。Positive、Negativeっていうのは、実験のコントロール。コントロールとは実験が上手くいっているかどうか確認するためのもの。Positiveは、ACE2とACE2 Activity Assay Kitを混ぜたもの。試薬がちゃんと機能していて、試薬の調製が間違っていなければ、ペプチドが切断され、蛍光分子とクエンチャーが離れ離れになるので光る。Negativeは、ACE2とACE2 activity Assay kitとACE2の阻害剤を加えたもの。きちんとACE2の機能が阻害されていれば、ペプチドが切断されず、蛍光分子とクエンチャーが一緒にいるので光らない。Positiveがきちんと光り、Negativeが光らないことによって、ACE2のはたらきが阻害されていなければ、蛍光を発し、阻害されていれば、蛍光が見えないという実験設定が上手くいっているということになる。

両方とも黒線で表されているので分かりにくいが、時間とともに蛍光強度が上がっているのが、Positiveで、横軸と傍で這いずり回っている黒線がNegative。きちんと、実験が上手くいっているということを表している。

ピンクの線と赤の線はどちらも進化前のRBDとACE2とACE2 Activity Assay Kitを混ぜて反応させて得られたデータをグラフに表したもの。水色の二本の線は、進化後のRBD（RBD-62）とACE2とACE2 Activity Assay Kitを混ぜて反応させて得られたデータをグラフに表したもの。多分、論文に記述がなかったような気がするが、実験は再現性を見るために、それぞれ2回ずつ行っているのだろう。

ここで注目すべきは、それぞれの線の傾き。これら傾きは、蛍光強度を時間で割ったもので、ACE2のペプチド切断速度に相当する。Fig 3のAの上段のグラフを見てみると、Positiveと進化前のRBDと進化後（RBD-62）の傾きは、どれも同じくらいであることが分かる。つまり、ACE2溶液に進化前のRBD、進化後のRBD（RBD-62）を入れたとしても、ACE2のはたらきは阻害されない。

Fig 3のAの下段は、株化されたヒト細胞の細胞膜上に発現されたACE2の機能がRBDによって阻害されるかどうか調べた結果を表している。ちなみに細胞を生体から取り出して、シャーレとかで育てられるようにすることを「細胞を株化する」という。基本的に生体から取り出した細胞はすぐに死んでしまうので、株化は難しい。生体内には、皮膚をつくる細胞、心臓をつくる細胞、脳をつくる細胞などといった色々な種類の細胞が存在しているが、それぞれの細胞は存在する場所が決まっていて、別の場所に間違って移動してしまった場合、死んでしまうようにプログラムされている。そのため、細胞を外に取り出して、生きている状態を維持するのは難しい。ちなみに、そのプログラムが壊れてしまって、生体内の色々な場所で生きられるようになったのが、がん細胞。

Fig 3のAの下段のHEQ PCのHEQが何の略かはよく分からなかった。PCは、Positive controlの略だと思う。明記はされていないが、生物系の論文のグラフ中に書いてあるPCは、Positive Controlの略であることが多い。HEQ PCは、Aの上段のPositveと同じく、細胞膜上にACE2を発現させた細胞とACE2 Activity Assay Kitを混ぜて反応させて得られたデータを表していると思う。一方でHEQ + inhibitorは細胞膜上にACE2を発現させた細胞とACE2 Activity Assay KitにACE2阻害剤を混ぜて反応させて得られたデータを表していると思う。Aの上段のNegativeに対応している。WT RBDっていうのは進化前のRBDで、RBD-62は進化後のRBD。WTっていうのはWild Type（野生型）の略。

In vitroの結果と同様にRBDをACE2が細胞表面に発現している細胞に振りかけても、ACE2の機能は阻害されていないということが分かる（HEQ PCとWT RBD、RBD-62の傾きが同じ）。

（Fig 3のAの下段にはHEK293T cellsと書かれてあるが、その下の説明ではHeLa cellsを使ったと書かれてある。多分、どちらかが間違えているのだと思う。Materials and methodsのACE2 activity assayを見ると、HeLa細胞は確かにこの実験に使われている。そして、HeLa細胞やHEK293T細胞以外の細胞も使われていることが分かる。この結果が細胞特異的ではなく、一般的にどの細胞でも成り立つということを示したかったのだろう。色々な細胞で調べてみて、その代表としてHEK293T cellsのデータを載せたのだと思う。HeLa細胞は、株化されたヒトのがん細胞。HeLa細胞は、世界で一番有名で、一番多く実験に使われている株化細胞）

進化したRBDは、新型コロナウイルスの感染を阻害することができるのか？

これについて調べた実験の結果がFig 4のBとC。

まずは、Fig 4のBから。実験に使っているのは、新型コロナウイルス…ではなく、新型コロナウイルスのスパイクタンパク質を身にまとっているレンチウイルス。

新型コロナウイルスを実験に使わなかったのは、おそらく、毒性の高いウイルスを扱う設備がなかったからだと思う。

遺伝子組み換え生物や危険な細菌・ウイルスが実験室の外に漏れ出ることがないように、こういった生物やウイルスを使う実験は、きちんと条件を満たしている実験室じゃないとできない。条件は4段階あり、条件が緩い方からP1、P2、P3、P4となっている。

（P1~P4は古い呼び方らしい。新しい呼び方は、BSL1~BLS4。けれども、僕の周りではP1~P4という呼び方が使われている。ちなみにPはPhysical containment（物理的封じ込め）の頭文字。BSLは、Bio Safety Levelの頭文字）

ja.wikipedia.org

新型コロナを使った実験を行うためには、P3レベルの実験室を使わないといけない。僕が元々いた大阪大学の部局でP3レベルの実験室を持っているのは微生物病研究所だけだったと思う。東京大学は、Wikipedia情報によると、東京大学医科学研究所がP3レベルの実験室を持っているらしい。

P3レベルの実験室は、どこにでもあるようなものではないので、新型コロナウイルスを使った研究ができる場所は限られている。ちなみにP4レベルの実験室は、日本の場合、国立感染症研究所、長崎大学感染症共同研究拠点にしかないらしい。P4レベルで扱えるのは、エボラ出血熱を引き起こすエボラウイルスとか。

一方で、レンチウイルスは、P2レベルの実験室で使うことができる。P2レベルの実験室は、割とどこにでもあって、僕が前いた研究室にもあった。そのため、Fig 4のBの実験では、新型コロナウイルスのスパイクタンパク質を身にまとっているレンチウイルスを使っている。

新型コロナウイルスのスパイクタンパク質を身にまとっているレンチウイルスは、pCMV ΔR8.2、pGIPZ-GFP、pCMV3 SΔC19という3つのプラスミドDNAをHek293T細胞に導入して、作成している。1つ目のプラスミドは、ヒト免疫不全ウイルス（HIV）の遺伝子を4つ載せているプラスミドDNA。今回、使っているレンチウイルスは、HIV由来。2つ目のプラスミドは、GFPと書いてあるので、蛍光タンパク質の遺伝子を載せたプラスミドだと思う。最後は、新型コロナウイルスのスパイクタンパク質の遺伝子を載せたプラスミドだと思う。この3つのプラスミドを使うことによって、新型コロナウイルスのスパイクタンパク質を身にまとっているレンチウイルスを作成することができる。

作成した新型コロナのスパイクタンパク質を持ったレンチウイルスを使って、進化後のRBDが新型コロナの感染を阻害する効果があるかどうか調べる。ACE2が膜表面に発現しているHek293T細胞に進化後のRBD溶液を加える。比較のために進化後とは別に進化前のRBDを使った実験も行っている。進化前、進化後のRBDを加えた後、新型コロナのスパイクタンパク質を持ったレンチウイルスをACE2が膜表面に発現しているHek293T細胞に加え、48時間放置。このレンチウイルスを作成する際に蛍光タンパク質の遺伝子を載せたプラスミドも使っていたので、細胞が感染したか否かは、Hek293T細胞の蛍光をFACSで測れば分かる。

その結果がFig 4のB。横軸は、加えたRBD溶液の濃度で、縦軸は感染した細胞の割合。黒線が進化後のRBDで、赤線が進化前のRBD。EC50っていうのは、感染した細胞の割合が50%だったときのRBD濃度。進化前のRBDのEC50は88 nMだったのに対し、進化後のRBDのEC50は、5.1 nMと10分の1以下になっている。つまり、進化後のRBDを使うとより少ない濃度で、新型コロナの感染を防ぐことができる。

（縦軸は割合だと思うのだが、なぜ1を超える点があるのだろうか、、、）

Fig 4のCは本物の新型コロナウイルスを使った実験の結果。多分、Fig 4のBの実験で良い結果が得られたので、P3レベルの実験室を使って、本物の新型コロナを使うことにしたのだと思う。実験自体は、フランスの研究機関が代行で行ったらしい。

これも、先ほどの実験と大まかな流れは同じ。今度は、VeroE6細胞というものを使っている。なぜ、前回はHek293T細胞を使って、今回はVeroE6細胞を使っているのかは不明。

…フランスの研究機関が実験を代行したけんかな？

とにかく、ACE2が発現しているVeroE6細胞にRBD溶液を加え、2時間放置した後に、新型コロナウイルスを加えて、1時間放置し、その後、VeroE6細胞だけをRBDが含まれている培地に撒いて、48時間培養している。その後、PromegaのCellTiter Glo kitを使って、生存している細胞を調べている。

その結果がFig 4のC。横軸は、加えたRBD溶液の濃度で、縦軸は直訳するとウイルス阻害率になるが、多分、これは生存率のことを表しているのではないかと思う。黒線が進化後のRBDで、赤線が進化前のRBD。CもBの結果同様に、進化後のRBDの方が少ない濃度で、新型コロナウイルスの感染を予防することができている（進化後のEC50は進化前の10分の1以下になっている）。また、進化前のRBDだと濃度を100 nM以上にしても細胞の生存率は75%くらいから上昇しないが、進化後のRBDは、10 nMくらいの濃度で新型コロナウイルスによる細胞の死をほぼ100%防いでいる。

考察。

考察には色々なことが書かれてあるが、既出の話の繰り返しの部分があったりするので、ここでは新出の話だけを取り上げたいと思う。

...この論文の「考察」は、あんま考察っぽくないので、結果と考察のセクションは別々にせず、まとめておいた方が個人的にはいいと思う。

変異Q498Rの話。

Q498Rという変異は進化実験の後半の方で固定されたもの。Q498Rは、いつもN501Yの変異と一緒に入っている。けれども実は、Deep mutational scanningによると、Q498R自体はRBDの安定性やACE2との結合性によくない影響を与える。しかし、N501Yの変異があると、Q498Rの変異はRBDの性能を大幅に上げる。

N501Yという変異は、アルファ株、ベータ株、ガンマ株なんかが持っている変異。ラムダ株は、意外にもこの変異を持っていない。Q498Rは、まだ自然界には存在していない変異。

この進化実験から、もしN501Yの変異が世界中に広まれば、いずれN501YとQ498Rの両方の変異を持ったより感染力の高い変異株が出現すると予測することができる。

変異によるRBDと抗体の結合効率の低下（ワクチンが効きにくくなる？）。

最後にRBD上の変異によって、抗体―RBDの結合にどのような影響があるか調べていた。使ったのは、92種類の抗体。これらの抗体とRBDの複合体の構造を（おそらく）クライオ電子顕微鏡で見ている。その結果、92種類のうち、56個の抗体と進化後のRBDの相互作用が低下していて、9個の抗体は大幅に進化後のRBDとの結合能が低下していた。

詳しい構造は、Fig S12に載っている。代表して4種類の抗体と進化前、進化後のRBDの複合体の構造が描かれている。白色で描かれているのが進化前のRBD、ピンク色で描かれているのが進化後のRBD、緑色で描かれているのが抗体。そして、図をよく見ると、オレンジ色の点線が描かれている。これは、分子間の相互作用を表している（Bは分子内だと思う）。Fig S12のA、C、Dを見ると、進化前のRBDは抗体と相互作用しているが、変異が入った進化後のRBDだと、その相互作用がなくなっていることが分かる。Bは進化前も進化後も相互作用がなさそう。

抗体の進化後のRBDとの結合能が下がった主な原因は、E484KとQ498Rの変異。E484Kの変異を持った新型コロナウイルスの変異株は、既に存在している。一方で、Q498Rの変異を持った変異株はまだ自然界に出現していない。Q498Rは、先ほども出てきた新型コロナウイルスの感染力を上げてしまう変異。感染力増強のみならず、抗体の結合能も落としてしまう恐ろしい変異。

新型コロナウイルスのワクチンは、前の方で説明した通り、スパイクタンパク質の遺伝子を持ったmRNAが含まれている。そのmRNAがヒトの細胞に侵入し、ヒトのタンパク質合成システムを使って、スパイクタンパク質が体内で作られる。そして、もちろんスパイクタンパク質はヒトにとって異物なので抗体が産出され、体内から排除される。ここで問題なのが、このmRNAに載っているのは、進化前のスパイクタンパク質の遺伝子であるということ。そのため、変異によって、Fig S12のようにスパイクタンパク質の形が少し変われば、ワクチン接種で獲得した抗体（を産出する細胞）がスパイクタンパク質を捕まえることができなくなる可能性がある。これがニュースなんかで見聞きする「変異株にはワクチンが効かないかもしれない」という話の詳しい説明。

（Fig S12に4種類の抗体が載っているが、本当の意味での抗体はDだけだと思う。抗体というのは、重鎖と軽鎖というもので成り立っているのだが、他の3つは重鎖だけのタンパク質。NanobodyとSybodyの違いはよく分からない。”synthetic nanobodies called sybodies”っていう文言を見つけたが、nanobodyもsyntheticなものがあると思うのだが…。ただ、4種類ともRBDと結合するという機能は同じ）