[ オピニオン ]
(2017/3/6 05:00)
インターネットをはじめとする情報社会の到来で、デジタルデータの量が爆発的に増える「情報爆発」と呼ばれる現象が起きています。例えば、過去2年の間に作り出されたデータの総量はそれ以前のデータの合計を上回るとも言われるほど、情報量が急激に増えています。そこで鍵となるのが、ハードディスクのようなストレージシステムなのですが、指数関数的に増えるデータの生成スピードに対応すべく、高密度・大容量のストレージが求められるようになっています。
実はこうした観点から注目されているのが、われわれ人間を含め、生体の設計データである遺伝情報を記憶しているDNA。3日には、デジタルデータをDNA分子に高密度に記録し、かつDNAを読み取ってデータを復元する場合のエラー率も最小限に抑えられる手法を開発したと、米国のコロンビア大学とニューヨークゲノムセンターの研究チームが米サイエンス誌に論文を発表しました。
彼らが開発した「DNAファウンテン(液体の貯蔵容器)」と名付けたアルゴリズムを使えば、わずか1グラムのDNA分子に215ペタバイト(ペタは千兆)ものデータを書き込むことができると言います。感覚的にはちょっとわかりづらいですが、一部屋ほどの量のDNAがあれば、理論上は人類がこれまで記録し続けてきた情報を全てそこに書き込めることができるとのこと。実用化されれば、確かにインパクトは大きいでしょう。
では、なぜハードディスクやフラッシュメモリーのような電子的な手法ではなく、DNAなのか。まずDNAは極めてコンパクトで記録密度が高いこと、そして耐久性が高く長持ちすることが挙げられます。後者については、低温かつ乾燥した条件であれば、情報を数十万年間保存できることが実証済み。スペインの洞窟で発見された43万年前の人類の祖先の骨から採取されたDNAから、その人物の目の色までわかっています。さらに大量のDNAを一度に読み取ることができ、スケールアップしやすい、という利点もあります。
ただ、DNAストレージ自体の技術はまだ新しく、初めて研究成果が報告されたのは2012年のこと。ノーベル賞候補とされる米ハーバード大学のジョージ・チャーチ教授らによる試みで、5万2000語からなる本の情報を、DNAを構成するA(アデニン)、G(グアニン)、C(シトシン)、T(チミン)という4つの塩基に割り当て、数千本のDNA鎖にコード化。その後、シーケンサーでDNAの塩基配列を読み取って、データの復号化に成功しています。そのほか、マイクロソフトの研究部門なども実用化研究を進めているようです。
とはいえ、12年の発表当時の記憶容量はDNA1グラム当たり1.28ペタバイト相当で、今回のコロンビア大チームの成果は、その200倍近い記録密度を可能にしています。
そもそも、DNAを構成する1個の塩基に割り当てられる情報量は2ビットではなく、まれな転写エラーを考慮した上での生物学的な冗長性を保つため1.8ビットが上限とみられています。そこで、今回はアルゴリズムの改良により、従来より60%多い1塩基当たり1.6ビットを割り当てることに成功。さらに、DNAファウンテンでは、0、1という二進法で表現された元データを複数の小さなパッケージにランダムに分散して、多数のDNA鎖の塩基に符号化できる上、個々の塩基が損傷を受けても復号した時の読み取りエラーが最小になるよう、アルゴリズムが工夫されているとのことです。
実際、研究チームでは、2メガバイトちょっとの1個の圧縮ファイルの情報をDNAに書き込み、エラー率ゼロの復号を達成しています。このファイルには、コンピューターのOS、フランスのリュミエール兄弟が1895年に製作した短編ドキュメンタリーフィルム『ラ・シオタ駅への列車の到着』、コンピューターウイルス、情報理論の父と言われるクロード・シャノンが1948年に発表した情報の数学的理論についての論文ーといった合計6種類の二進法データが含まれ、それらを200塩基の長さをした7万2000本のDNA鎖に割り振ったデジタルリストを作成。サンフランシスコのスタートアップであるツイスト・バイオサイエンスにリストのテキストデータを渡し、実際のDNA分子として合成してもらいました。
さらに、シーケンサーを使ってこれらDNAの塩基配列を読み取り、アルゴリズムで遺伝コードを二進法に戻し、元のファイルを復元しています。DNAを増幅するPCR法(ポリメラーゼ連鎖反応)を使えば、事実上、無制限にファイルのコピーも可能になるそうです。
一方で、実用化までの道のりはまだ遠そうです。大きな壁として立ちはだかっているのがコストの問題。今回、2メガバイトのデータを読み書きするのに、DNAの合成費用が7000ドル、シーケンサーでの読み取り費用が2000ドルかかったという。これも技術の進展に期待する部分が大きく、例えばDNAの読み取りコストは、2001年の段階で人間一人当たり10億ドルしていたのが、現在では1000ドル程度にまで劇的に下がってきています。さらに、DNAの場合は、ハードディスクなどに比べて読み書きのスピードが遅いということもあり、磁気テープやDVDの代替として長期保管用のアーカイブ記録に向いているようです。
ともあれ、生物の進化の記録を連綿と受け継いできたDNAという器を、電子データの記憶媒体として活用する大胆なアイデアは、それ自体、コンピューター社会、あるいは文明の発展を下支えする大きな技術の進化と言えるでしょう。(デジタル編集部長・藤元正)
(2017/3/6 05:00)