メタゲノムとは,ある生物の遺伝子全体を意味する「ゲノム(genome)」に,さらに「超越」を意味するメタ(meta-)を融合した造語であり,微生物群集のゲノムを培養に依存することなく網羅的に解析することをメタゲノム解析と呼ぶ.この解析技術の特徴は,試料中の微生物のDNAを混合物として抽出し,このDNA集合体の塩基配列を解読することである.試料中に含まれる微生物(培養法の不明なものを含む)の種類やその存在比率を推定することを目的として実施される.また,これまで知見のない新たな酵素遺伝子の候補を見出すことが可能である. 塩基配列を自動的に解読するDNAシークエンサーの開発から20年以上を経て,解読能力が大幅に向上した次世代高速シークエンサーが開発され,ゲノム解析は新たな局面を迎えた.その超高速解読能力を利用し,膨大な遺伝子配列情報が蓄積されつつある.メタゲノム解析は,現在,次世代シークエンサーを利用して行われている. 2000年,E. DeLongを中心とする研究グループが,試料中に存在する数十キロ塩基対の長鎖DNAをバクテリア人工染色体ベクターに連結し,これを網羅的に配列解析することで海水中の菌叢解析を実施した1).彼らの研究が実質的なメタゲノム解析の端緒であった.次いで,2004年,J. Venterらはサルガッソ海の海洋細菌群集のメタゲノム解析を行い,合計で1兆塩基対の非重複塩基配列を取得し,それらの解析結果から,少なくとも1800種の細菌種の存在と,148種の未知細菌種の存在を推定した.また,12億種類の未知遺伝子を同定し,Science誌に発表した2).彼らの研究成果から,彼らのようなアプローチが環境中の微生物群集の解析や,新規有用遺伝子の発見につながることが広く認識されるようになった.その後,上述した次世代高速シークエンサーの開発に伴い,239件(平成22年8月現在)のメタゲノムデータが蓄積されている.現在までに公開されたメタゲノムデータは,Genomes Online Database (http : //www.genomesonline.org/cgi-bin/GOLD/bin/gold.cgi)で公表されている.主として海水,ヒト腸内,土壌,淡水,温泉環境中の微生物群集が解析されている. このメタゲノム解析は,次世代シークエンサーと共にバイオインフォマティクスの進展が必須であった.バイオインフォマティクスとは,生物学に関わる情報解析学の総称である.通常のゲノム解析は,1種類の生物の網羅的遺伝子解析であり,得られる遺伝子情報は全てその生物に由来した情報である.一方,メタゲノム解析では,複数の生物種の混合した配列情報が得られる.また,存在比の低い種の情報が得られにくい等,試料に含まれる全ての生物種のDNA情報が取得できるとは言えない.そこで,これまでのゲノム解析と異なる概念が必要となる.ゲノム解析の流れとしては,断片化した個々のDNAの配列からなる生データ取得,これらの中から末端配列が共通している配列同士を順次連結していくアセンブリー,その配列の中から遺伝子をコードする領域を見つけ出す遺伝子予測となる.メタゲノム解析では,遺伝子予測をアセンブリーの前に行う場合と後に行う場合があり,研究目的により使い分けられている.また,メタゲノム解析に特化した遺伝子予測プログラムが開発されている.また,予測した遺伝子が由来する生物種を推定する手法も総説で解説される等,一般化されてきている.注意すべきは,次世代シークエンサーもメーカーと機種によりその塩基配列解読原理が異なり,解読鎖長や精度等が異なるため,目的に応じた機種を選択する必要がある. メタゲノム解析のデータは,次世代シークエンサーの機能改良に伴い,今後急速に増加すると期待される.今後の応用分野としては,エネルギー分野や環境浄化で力を発揮する新規遺伝子資源の開拓3),栄養学・医学分野からのヒトの腸内細菌叢解明4),難培養微生物を含む環境微生物群集の生態解明等であり,基礎研究成果としてメタゲノム解析に関する学術論文数が多数蓄積している.メタゲノムデータの蓄積と,バイオインフォマティクスの発展,他分野との研究連携によるメタゲノム解析技術の発展が,人類の健康や環境,エネルギー問題等,我々社会の課題解決につながることが期待される.