Apache > Hadoop > Pig
 

Pig について

Pig とは

Pig は、大規模なデータセットを分析するためのプラットフォームです。Pig の言語である Pig Latin はシンプルなクエリー代数で、データセットのマージやフィルタリング、レコードやレコード群への関数の適用といったデータの変換を記述することができます。ユーザーは具体的な処理目的に合わせて独自の関数を作成できます。

Pig Latin のクエリーは、クラスタ上で分散方式で実行されます。現在の実装では、Pig Latin プログラムは Map-Reduce ジョブにコンパイルされ、これらのジョブが Hadoop クラスタを用いて実行されます。

Pig の詳細については、Pig wiki を参照してください。