Hive へようこそ!
Hive は、Hadoop を土台として構築されたデータウェアハウス・インフラストラクチャで、Hadoop ファイルに格納された大規模なデータセット・データを対象に、簡単な操作によるデータ・サマライゼーション、アドホックなクエリー操作、および分析を可能にする各種ツールを提供します。Hive は Hadoop ファイルに格納されたデータに構造を持たせる仕組みを用意しています。また、SQL をベースにした Hive QL というシンプルなクエリー言語も提供しており、SQL に慣れたユーザーは Hive QL を使ってデータに対する問い合わせを行うことができます。従来からの map/reduce プログラマも、Hive QL を使うことで、独自に作成したマッパおよびリデューサを組み込むことができ、Hive QL のビルトイン機能だけでは実現できないような高度な分析を行うことができます。



