Apache HBase とは

HBase は Hadoop データベースです。ビッグデータに対してランダムなリアルタイムの読み書きアクセスを行う必要がある場合に使ってください。HBase の目標は、どこにでもあるごく普通のハードウェアのクラスタ上で、数十億行 x 数百万列規模の超巨大テーブルを格納できるようにすることです。

HBase は、Chang 他による Google の論文『Bigtable: A Distributed Storage System for Structured Data』をモデルとして作成されたオープンソースで分散型かつバージョン管理された列指向ストアです。BigTable が、Google Files System (GFS) の提供する分散データストレージを活用するするのとまったく同様に、HBase は Hadoop を土台として BigTable に類似したさまざまな機能を提供します。HBase には次のような特徴があります。
  • cascading、hive、および pig のソースモジュールとシンクモジュールなど、Hadoop MapReduce ジョブを HBase テーブルで扱うための便利な基本クラスを用意
  • サーバーサイドの scan フィルタと get フィルタを介したクエリ述語のプッシュダウン
  • リアルタイムクエリの最適化
  • XML、Protobuf、およびバイナリエンコーディングのオプションをサポートした Thrift ゲートウェイと RESTful Web サービス
  • 拡張性に富んだ jruby ベース (JIRB) のシェル
  • Hadoop メトリクスサブシステムを介したファイルまたは Ganglia へのメトリクスのエクスポート、および JMX を介したメトリクスのエクスポートのサポート

最新情報

2011/03/21: サンフランシスコの StumbleUpon 本社にて HBase 0.92 のハッカーソン (Hackathon) を開催

2011/02/22: サンフランシスコの StumbleUpon 本社にて HUG12: HBase User Group を開催

2010/12/13: HBase Hackathon: Coprocessor Edition

2010/11/19: HBase 一色の Hadoop HUG in London を開催。

2010/11/15-19: Devoxx で HBase のトレーニングおよび HBase に関する多数のプレゼンテーション。

2010/10/12: Hadoop World 2010 において HBase のコアコントリビュータとユーザーによるプレゼンテーション。

2010/10/11: HUG-NYC: HBase User Group NYC Edition (Hadoop World 前夜)。

これより以前の情報