遺伝子コード:タンパク質翻訳のユニバーサルテンプレート

全ての生物は分子生物学における共通の基本原理に基づいています。DNAはmRNAに転写されてからタンパク質に翻訳されます。Dr. Francis Crickは、遺伝子にコードの存在を発見し、遺伝子の翻訳はいくつかの特異な仕組みに従っており、mRNAの情報を解読する媒体が存在するとの仮説を立てました。

Crickは、この仕組みとして、1つのアミノ酸が連続する塩基3個を1組とするトリプレットによりコードされているに違いないと考えました。さらに、特定のアミノ酸に対しては、複数のトリプレットがコードし得る縮重という概念も提唱しました。1

タンパク質への翻訳とコドン使用頻度

実際、クリックの考えは正しいものでした。現在tRNAとして知られている媒体は、トリプレットのアンチコドンを介してmRNAシークエンスを翻訳します。しかし、tRNAアンチコドンによるセンスコドンの識別は曖昧です。最低31種類のtRNAアンチコドンによりmRNAから確認される61種類のセンスコドンに対応します。しかし、31種類のアンチコドンが61種類のセンスコドンとどのように対応しているのでしょうか?

tRNAアンチコドンによるセンスコドン認識における明らかな交錯については、tRNA特有のRNA残基であるイノシンによってある程度の説明がつきます。イノシンは、U、C、Aを認識し、さらに、ゆらぎ位置と呼ばれているコドンの第3塩基を強力に認識します。このイノシンの特性により遺伝子コードの縮重が促進され、31種類のアンチコドンによる61種類のセンスコドン認識を可能にするコドンバイアスが生じるのです。

非表現突然変異(サイレントミューテーション)

コドンのゆらぎ位置での突然変異は、同じアンチコドンを有するtRNAにより天然コドンとして認識されます。これらの変異は非表現突然変異(サイレントミューテーション)と呼ばれており、タンパク質のアミノ酸シークエンスは変化せず保存されます。この突然変異は、保因個体の健康状態への影響が全く認められないことから、進化論的観点からは中立突然変異と考えられています。

非表現突然変異により、アミノ酸が別のアミノ酸に置換されることはありませんが、タンパク質の産生レベルには影響を及ぼします。さらに、タンパク質の翻訳後修飾、立体配座、安定性、および機能に変化を生じさせる可能性もあります。このため、合成生物学における異種タンパク質の産生では、DNAコンストラクトのデザインが重要になります。コドン最適化にCodon Optimization Toolを使用することで、機能性を維持した可溶性タンパク質の産生に適した非表現突然変異を導入することができます。

コドンバイアス

タンパク質発現においては、特定のコドンが他のコドンより効率的に翻訳されるコドンバイアスが生じており、前項で説明した非表現突然変異が実際には中立でない可能性があります。さらに、非表現突然変異に対して使用可能なtRNAアンチコドンの数が限られているため、リボゾーム内での反応処理が遅くなり、タンパク質産生量が低下するケースも存在します。多くの生物では、特定の非表現突然変異コドンの使用頻度にバイアスがかかっていることが分かっており、天然コドンの使用頻度とのバランスが翻訳の最適化に影響すると考えられています。

コドン使用頻度はどのように判定されるのですか?

コドン使用頻度は、一般的にコドン適応指標(Codon Adaptation Index: CAI)により判定されます。この指標は、ある生物種における(コドンバイアスに起因する)高発現遺伝子のコドン使用頻度を調べ、対象とする生物種で優先的に使用される複数のコドン使用頻度との比較において評価するために用いられます。2

コドン最適化ツール

今日では、様々な生物種におけるコドン使用頻度(およびコドンバイアス)の測定に有用な、コドン最適化ツールというプログラムがあります。例えば CodonWは、公開されているソフトウェアプログラムで、CAIを最初に提唱した研究室メンバーの一人、John Pedenが書いたものです。CodonWは、コドン使用頻度を測定するための多変量解析を簡素化したものです。

健常者および疾患患者の各細胞検体におけるコドン使用頻度

近年、同一個体の正常細胞と癌細胞ではコドン使用頻度やコドンバイアスに違いがあることが分かり、大きな関心を呼んでいます。この所見は、tRNAの発現が異なる転写プログラムの制御下にあることを示唆しています。現時点では、tRNAの異なる発現レベルが癌や他の疾患の発生に寄与しているのか明らかになっていませんが、研究者は、異常なtRNAプールが癌遺伝子の増強や腫瘍抑制遺伝子の抑制に関与している可能性があると推測しています。3

タンパク質強制発現におけるコドン使用頻度と合成生物学

タンパク質発現における問題

研究者にとって、生物種横断的(例:E.coli細胞でヒトタンパク質発現)なタンパク質発現が望まれる状況は少なくありません。遺伝子コードが存在することで、オープンリーディングフレーム(ORF)がどの生物種でも同じように解読されると考えている人もいるかもしれませんが、これはある程度しか正しいことではありません。トランスジェニックmRNAのレアコドンにより、リボソームの活性低下や枯渇を生じる可能性があり、結果的に異種タンパク質の発現レベルが低下します。

この問題に対し、タンパク質発現や合成生物学研究では、導入遺伝子のコドンを宿主生物種で優先的に使用されているコドンに変異させる方法(コドンバイアスの低減)がとられてきました。しかし、この方法は、アミノ酸の枯渇やtRNAプールの平衡状態の崩れというリスクが上昇する可能性があります。さらに、手作業で2生物種間でのコドンを最適化しタンパク質発現を調製することは容易ではなく、対象生物が3種や4種ではほとんど不可能な作業です。

現在では異種タンパク質発現の最適化において、ヌクレオチド総量、局所的mRNAフォールディング、コドンバイアス、Codon ramp、さらにコドン相関など、多くの因子を考慮した戦略が用いられています。

タンパク質発現を最適化する解決策

コドン最適化に使用できるアルゴリズムは複数存在しますが、殆どはコドン使用頻度表だけに焦点が当てられたものです。コドン最適化を行う場合は、他の方法も検討してみる価値があります。

良いプラットフォームを使用してコドン変換を行えば、天然由来の天然シークエンスでもリコンビナントシークエンスの場合でも、使用する発現系で可能な最大限の産生レベルが得られます。タンパク質の転写や翻訳の最適化に使用するアルゴリズムは、コドン適応性、mRNA構造、様々なシスエレメントなど、一連の重要要素が考慮されたものが望まれます。弊社のOptimumGeneはこれらの基準を満たしているアルゴリズムを使用しており、ほぼ全ての発現系を用いてこれまでに50,000超の遺伝子について最適化を行ってきました。

タンパク質発現の前提条件は、セントラルドグマの3ステップすべてが問題なく実行されることであり、これにより転写、mRNA安定化、翻訳がコドンプールと調和して効率的に処理されます。各段階における効率を最大化するには、多くの要素について検討することが必要とされるのです。

転写効率のパラメータ

翻訳効率の検討

コドン使用頻度はタンパク質発現に影響する1つの重要な要素ですが、細菌や古細菌ではShine Dalgano(SD)シークエンスも重要な役割を担っています。このシークエンスは翻訳の開始と効率いずれにも重要で、SD相同配列を有するmRNAは165S rRNAに結合する本来のSDシークエンスと競合するため、タンパク質の翻訳を阻害します。5弊社のアルゴリズムでは、SD相同配列を回避するようにmRNAシークエンスを最適化しています。

mRNA 5’末端の自由エネルギーも、タンパク質発現に対してその量に応じた影響を及ぼします。このことは、E.coliにおける154種類のGFP変異体発現により見事に証明されています。これらの変異体ではmRNA 5’末端に生じたヘアピン構造により、コドン最適化によるコンストラクトと比較してGFP発現が1/250に低減されました。このタンパク質発現の減少量から、mRNA 5’末端の持続的自由エネルギーの半分以上はタンパク質発現に関与しており、他のパラメータ測定値の10倍を超えています。4コドンを最適化することでmRNA 5’末端にヘアピン安定構造が形成される可能性を減らし、最適なmRNA産生とタンパク質への翻訳が促進されます。

AU-rich element(ARE)はmRNA 3’側の非翻訳領域において確認されたもので、mRNA分子の安定性に影響を及ぼします。これらのエレメントは、mRNAの分解を促進するタンパク質やマイクロRNA(miRNA)との結合部位であり、タンパク質の発現を低下させます。ポリA未成熟やリボソーム内結合サイトにおいても同様で、mRNAにおける異常なプロセスにより翻訳が阻害され、タンパク発現が低下します。

タンパク質折りたたみの検討

タンパク質折りたたみの適正化は、新たに合成されたタンパク質が適正な2次構造や3次構造を形成するために重要です。上記で挙げたタンパク質の転写や翻訳に加えて、コドンコンテクストおよびコドンとアンチコドンとの相互作用を最適化することも、タンパク質の正確かつ確実なリフォールディングには重要です。

タンパク質発現の将来

将来的には、様々な宿主細胞におけるタンパク質の標的発現を効率化するための、指向性cDNA翻訳の開発が期待されています。同じ生物の細胞でも増殖細胞と非増殖細胞でコドン使用頻度のパターンが異なっている事実からも、これを実現することは可能であると考えられます。3さらに、癌細胞と正常細胞でコドン使用頻度が明確に違うことは、新規の治療ターゲットとして重要であり、とりわけ合成生物学分野での応用が考えられます。例えば、癌細胞におけるコドン使用頻度を調整することで、導入するcDNAに組込まれた癌抑制遺伝子や細胞死誘導遺伝子の発現を特異的に増強させることができると考えられます。

コドン最適化技術の進展は、リコンビナントタンパク質産生、合成生物学、遺伝子療法およびワクチン開発など、テーラーメードの治療デザインを大幅に改善する可能性を秘めている事に疑いの余地はありません。しかし、抗薬物抗体の発生に対する懸念が提唱されているように、これらの分野におけるコドン最適化の実施にあたっては、コドン最適化の効果についてより深く理解する必要があります。抗薬物抗体など有害事象の発生は、薬効を阻害するだけでなく免疫反応を誘発する可能性があると、コドン最適化により産生されたタンパク質の医療における安全性を疑問視する指摘も存在します。これらの問題を軽減することができれば、個別化医療の新たな時代にこれまで以上に近づくことが出来ると考えられます。

タンパク質発現と治療薬がもたらす将来像について、より関心がある方はこちらcritical reviewをご覧下さい。

References

見積依頼