Apache HBase ブック

改訂履歴
改訂 0.91.0-SNAPSHOT  
Adding first cuts at Configuration, Getting Started, Data Model
改訂 0.89.20100924 2010 年 10 月 5 日stack
Initial layout

概要

これは Apache HBase の公式ブックです。Apache HBase は、Apache HadoopApache ZooKeeper を土台として構築された分散型でバージョン管理された列指向のデータベースです。


目次

序文
1. スタートガイド
1.1. はじめに
1.2. クイックスタートガイド
1.2.1. 最新の安定版リリースのダウンロードと展開
1.2.2. HBase の起動
1.2.3. Shell による操作
1.2.4. HBase の停止
1.2.5. 次は
1.3. 通常のスタートガイド
1.3.1. 必要なもの
1.3.2. HBase の実行モード: スタンドアロンモードと分散モード
1.3.3. 設定例
2. アップグレード
2.1. HBase 0.20.x または 0.89.x から HBase 0.90.x へのアップグレード
3. 設定
3.1. hbase-site.xmlhbase-default.xml
3.1.1. HBase のデフォルト設定
3.2. hbase-env.sh
3.3. log4j.properties
3.4. 重要な設定
3.4.1. 必要な設定
3.4.2. 推奨設定
3.5. HBase クラスタに接続するクライアントおよびクライアントの依存関係
3.5.1. Java クライアントの設定
4. HBase Shell
4.1. スクリプトの実行
4.2. Shell の使い方
4.2.1. irbrc
4.2.2. LOG の日付からタイムスタンプへの変換
4.2.3. デバッグ
5. HBase のビルド
5.1. Apache の Maven リポジトリへの HBase リリースの追加
6. HBase と MapReduce
6.1. デフォルトの HBase MapReduce スプリッタ
6.2. HBase Input MapReduce の例
6.3. 1 つの MapReduce ジョブでのほかの複数の HBase テーブルへのアクセス
7. HBase とスキーマ設計
7.1. スキーマの作成
7.2. 列ファミリの数について
7.3. 単調増加する行キー/時系列データ
7.4. 行と列のサイズを最小限に抑える
7.5. テーブルの作成: リージョンの事前作成
8. メトリクス
8.1. メトリクスのセットアップ
8.2. リージョンサーバーのメトリクス
8.2.1. hbase.regionserver.blockCacheCount
8.2.2. hbase.regionserver.blockCacheFree
8.2.3. hbase.regionserver.blockCacheHitRatio
8.2.4. hbase.regionserver.blockCacheSize
8.2.5. hbase.regionserver.fsReadLatency_avg_time
8.2.6. hbase.regionserver.fsReadLatency_num_ops
8.2.7. hbase.regionserver.fsSyncLatency_avg_time
8.2.8. hbase.regionserver.fsSyncLatency_num_ops
8.2.9. hbase.regionserver.fsWriteLatency_avg_time
8.2.10. hbase.regionserver.fsWriteLatency_num_ops
8.2.11. hbase.regionserver.memstoreSizeMB
8.2.12. hbase.regionserver.regions
8.2.13. hbase.regionserver.requests
8.2.14. hbase.regionserver.storeFileIndexSizeMB
8.2.15. hbase.regionserver.stores
9. クラスタレプリケーション
10. データモデル
10.1. テーブル
10.2. 行
10.3. 列ファミリ
10.4. セル
10.5. バージョン
10.5.1. バージョンと HBase での各種操作
10.5.2. 現時点での制限事項
11. アーキテクチャ
11.1. デーモン
11.1.1. Master
11.1.2. リージョンサーバー
11.2. リージョン
11.2.1. リージョンのサイズ
11.2.2. リージョンの分割
11.2.3. リージョンのロードバランサ
11.2.4. Store
12. 先行書き込みログ (WAL)
12.1. HBase の WAL の目的
12.2. WAL の分割
12.2.1. hbase.hlog.split.skip.errors
12.2.2. クラッシュしたリージョンサーバーの WAL を分割する際、EOFExceptions はどのように扱われるか
13. パフォーマンスチューニング
13.1. Java
13.1.1. ガベージコレクタと HBase
13.2. 設定
13.2.1. リージョンの数
13.2.2. コンパクションの管理
13.2.3. 圧縮
13.3. 列ファミリの数
13.4. データの集中
13.5. バッチロード
13.6. HBase クライアント
13.6.1. AutoFlush
13.6.2. Scan のキャッシュ
13.6.3. ResultScanner のクローズ
13.6.4. ブロックキャッシュ
14. ブルームフィルタ
14.1. 設定
14.1.1. HColumnDescriptor のオプション
14.1.2. io.hfile.bloom.enabled グローバル kill スイッチ
14.1.3. io.hfile.bloom.error.rate
14.1.4. io.hfile.bloom.max.fold
14.2. ブルームフィルタの StoreFile でのフットプリント
14.2.1. StoreFileFileInfo データ構造内の BloomFilter
14.2.2. StoreFile メタデータ内の BloomFilter エントリ
A. ツール
A.1. HBase hbck
A.2. HFile ツール
A.3. WAL ツール
A.3.1. HLog ツール
A.4. 圧縮ツール
B. HBase での圧縮
B.1. CompressionTest ツール
B.2. hbase.regionserver.codecs
B.3. LZO
B.4. GZIP
C. FAQ
D. YCSB: The Yahoo! Cloud Serving Benchmark と HBase
索引