
世界トップレベルの研究者を育てる

ゲノム解読の革命的高速化により、「ゲノム情報ビッグバン」時代を迎えた生命情報科学の世界では、現在、世界規模で激烈な競争が繰り広げられています。ゲノム情報を読み解くことで、病気の治療や食糧、エネルギー問題など21世紀の地球的課題を解決する斬新で、夢のようなアプローチが期待されるからです。東京大学のグローバルCOE「ゲノム情報ビッグバンから読み解く生命圏」の教育研究拠点では、学内の情報・生命関連の研究科や国内外の研究所と連携し、ゲノム情報ビッグバン時代に、世界に伍して研究にチャレンジするトップレベルの研究者を育成しています。
ゲノム(1)を構成するDNA(2)の「情報」としての根幹は、塩基対の配列であり、それこそが遺伝情報だといえます。ヒトゲノムは約30億の塩基対からなり、その解読が始まったのは1986年で、完了したのは2003年のことでした。
ヒトゲノムの全解析には17年を要しましたが、解析の技術はその間長足の進歩を遂げ、02年から09年の7年間で、塩基読解速度が1000倍となる革命的な高速化を果たしました。この状況を「ゲノム情報ビッグバン」と呼んでいます。
生物個体の多様性を生む
塩基配列
生物の個体の多様性は、ゲノムの個体差から生まれます。ヒトを例にすると、家族性癌など遺伝の要素の強いさまざまな病気や、薬の効果の個人差、お酒の上戸・下戸(アルコール分解能力の個人差)、集中力の個人差などが挙げられます。
こうした個体差は、遺伝子の塩基配列のうち、一つの塩基が別の塩基に置換されていたり、一部の塩基配列が欠落したり、挿入されていたりといったことや、遺伝子(ゲノム中のコード)のコピー数の違い、短い塩基配列の重複数の違いといったことから生まれると考えられています。
最初に解析されたのは、不特定多数から無作為抽出された匿名の人物のサンプルでしたが、現在、アメリカを中心とする各国の研究機関が共同で「1000人ゲノムプロジェクト」を進行中です。匿名ながら、身体の形質や体質、特質などが分かる1000人のゲノムを解析することで、塩基配列と個体の多様性の関係について、さまざまなことが解明されると期待されています。
食糧問題やエネルギー問題を
解決する、斬新なアプローチ
ヒトゲノムに限らず、さまざまな生物のゲノムを解析することにより、エネルギー問題や食糧問題など21世紀の人類が直面する課題への斬新な解決策も期待できます。
トウモロコシやサトウキビからエタノールを作るバイオ燃料は、次世代エネルギーとして期待される反面、原料のトウモロコシの高騰を招くなどの問題を孕んでいます。植物から燃料を醸造するには、酵母や菌類を介在させますが、エネルギー変換を行う酵素遺伝子をさまざまな生物のゲノムの中に探すことで、廃材やサボテンなど穀物ではない植物から、効率よく燃料を醸造する技術が生み出される可能性があります。
また、冷害や乾燥、害虫などに強い作物のゲノムを解読して、悪環境に強い個体の塩基配列の特徴を検出し、品種改良を行うことで、寒冷地や乾燥地帯など、これまで作物が育ちにくかった地域を、農地とすることができるかもしれません。
バイオインフォマティクス
超高速ゲノム解析
超並列計算
ゲノム解読を基盤とする研究には、超高速ゲノム解読装置を駆使する技術に加え、ゲノム解読によって得られた膨大な情報を超並列計算によって処理する巨大コンピューターのオペレーション能力や、それらの情報を解析し、遺伝子や遺伝子の指令によって作られるタンパク質の働きを解明するバイオインフォマティクス(3)に関する知見が不可欠です。
「ゲノム情報ビッグバンから読み解く生命圏」の教育研究拠点では、研究とともに、それらに精通した世界トップレベルの若手研究者を育成する教育に力を注いでいます。
グラフに示した通り、一日に解読できる塩基数は、1995年に10万でしたが、2001年には100万を超え、05年に2000万、07年に2億、09年には20億と、高速化を果たしました。コンピューターの性能も1年半で約2倍の速度で向上してきましたが、8か月で2倍のペースのゲノム解読の高速化には追いついていません。そのため、今後も多数のコンピューターが必要です。
拠点リーダーの森下真一教授は、この状況を「石炭から原子エネルギーへの転換のようなもの」と表現しています。同じ発電でも火力と原子力では技術も方法も次元が異なるように、ゲノム解読やコンピューターのオペレーションにも、一昔前とは全く次元の異なる技術や方法が要求されているのです。
20人の大学院生を
世界の研究者と共同研究を行える
国際的ハブ研究者に育てる
こうした状況に対応するため、東京大学ではバイオインフォマティクスの教育研究体制を強化してきました。2001年から学部教育プログラムに着手。03年には大学院新領域創成科学研究科に情報生命科学専攻を新設し、07年には理学部にも生物情報科学科を設置しました。この間、拠点の前身というべき21世紀COEプログラム「言語から読み解くゲノムと生命システム」(4) でも人材育成に取り組みました。
学部ではゲノム解析、コンピュータープログラミングなどの基礎教育を行い、大学院では実際のデータ処理を中心とした研究入門から始め、実験、データ分析、研究計画の立案など、自立した第一線の研究者への飛躍を促す教育を実施します。その教育カリキュラムを提供し、指導することが、拠点の大きな役割です。
若手研究者の自立を促すため、北京ゲノム研究所(中国)、情報・システム研究機構、産業技術総合研究所など、国内外の研究所と提携し、共同研究やワークショップなどのプログラムも積極的に実施します。
森下教授は語ります。「21COEでは、『ネイチャー』や『サイエンス』などに論文が掲載され、国際的に評価を受けた若手研究者が5人生まれました。センスのいい若手研究者を、超一流の研究機関との共同研究に参加させることで、将来、大化けしてくれることを期待しています。20人の大学院生を、世界各国の研究者と共同研究ができる『国際的研究ハブ』となりうる人材に育てることが、拠点の教育目標です」
ゲノム解読の革命的高速化。健康、食糧、エネルギー問題
解決への斬新なアプローチ。国内外の研究所と連携した人材育成。

(2)DNA(デオキシリボ核酸) 生物の遺伝情報を担う高分子生体物質。デオキシリボース(五炭糖)とリン酸、塩基から構成され、塩基にはアデニン(A)、グアニン(G)、シトシン(C)、チミン(T)の四種類ある。DNAは五単糖と1つの塩基がリン酸により結合した鎖状の高分子が、AとT、GとCの水素結合(塩基対)により2本結びついた二重の螺旋構造をしており、このATGCの四塩基が織りなす塩基対の配列が、遺伝情報である。
(3)バイオインフォマティクス 生命科学と情報科学、情報工学を融合させ、情報処理の観点から生命科学の問題をとらえようとする学問分野。遺伝子解析情報をもとに並列コンピューターで遺伝子の機能予測実験を行ったり、データベース化された実験結果をもとに遺伝子間の相互作用を予測したりするなど、主に遺伝子に関する情報をコンピューターによって分析する。「生命情報学」「生物情報学」などと略される。
(4)「言語から読み解くゲノムと生命システム」 ゲノムに書き込まれた情報や、生命システムのネットワークに内在する「言語」的構造を解明しようとする革新的研究を実施。ゲノムが規定する遺伝子発現や分子間相互作用の情報と、膨大な論文に蓄積されている生命機能についての記述を、コンピューター上で対応させ、両者に成り立つ関係を解明する計算機言語の開発にも取り組んだ。
