Hadoopが秘める可能性:オンプレミスでもクラウドでも使えるプラットフォームの魅力

鵜澤幹夫
2009-11-05 22:18:01
  • このエントリーをはてなブックマークに追加

 ニューヨークで10月2日、「Hadoop World:NYC 2009」が開催された。

 Hadoopとは、GoogleのMapReduceとGoogle File System(GFS)のオープンソース実装。YahooやAmazonなど各種のサービスプロバイダーで利用されており、ペタバイト世界に対応するためのプラットフォームだ。

検索以外での利用に大きな可能性を秘めるHadoop

 検索エンジンのためのフレームワークがこれほどまでに注目される理由は、その守備範囲の広がりに大きな可能性が見出されているからだ。

 たとえば、ウェブから集めてきたデータを、検索とは別の方向性で分析することが可能。また、各種ログデータの解析、遺伝子工学におけるゲノム研究といった分野にも適用できる。つまり、ウェブ以外をソースとしたデータの解析に応用することも可能なのだ。

 これまで、こうした分野にはリレーショナルデータベース(RDB)が利用されてきた。たとえば、クラウドコンピューティングの分野では、SQL Azureのシングルデータベースを10ギガバイトを上限とするような制約が生じる。

 しかし、MapReduceフレームワークでは、Googleが20ペタバイト、Yahooが4ペタバイトを日々分析しているという。

 Hadoop World 2009は、こうしたリニアなスケールを持つHadoopのコントリビューターとユーザーが一堂に会し、そのテクノロジーと利用形態を発表する場として位置づけられている。

オンプレミスでもクラウドでも活用できるHadoop

  • 新着記事
  • 特集
  • ブログ