Apache Hadoop へようこそ!
Hadoop とは
Apache Hadoop プロジェクトでは、信頼性の高いスケーラブルな分散コンピューティングのためのオープンソースソフトウェアを開発しています。Hadoop には以下のサブプロジェクトがあります。
- Hadoop Common: Hadoop のほかのサブプロジェクトをサポートする共通のユーティリティです。
- Avro: 各種スクリプト言語に動的に組み込み可能なデータ直列化システムです。
- Chukwa: 大規模分散システムを管理するためのデータ収集システムです。
- HBase: 巨大テーブル用の構造化データストレージをサポートするスケーラブルな分散データベースです。
- HDFS: アプリケーションデータに対して高いスループットでのアクセスを可能にする分散ファイルシステムです。
- Hive: データ・サマライゼーションやアドホックなクエリー操作を可能にするデータウェアハウス・インフラストラクチャです。
- MapReduce: 膨大なデータセットを計算クラスタ上で分散処理するためのソフトウェアフレームワークです。
- Pig: 並列計算のための高水準データフロー言語および実行フレームワークです。
- ZooKeeper: 分散アプリケーションのためのパフォーマンスの高いコーディネーションサービスです。
Hadoop を使っているアプリケーション/企業
さまざまな企業や組織が、研究や実用目的で Hadoop を使っています。Hadoop のユーザーはぜひ wiki の Hadoop を使っているアプリケーション/企業のページに登録してください。
最新情報
2009/07 - Hadoop の新しいサブプロジェクト
Hadoop はさらに大きく成長しています。
- Hadoop Core の名前が Hadoop Common に変わりました。
- MapReduce と Hadoop Distributed File System (HDFS) が互いに独立したサブプロジェクトになりました。
- Avro と Chukwa が新しく Hadoop サブプロジェクトに加わりました。
これらのサブプロジェクトの簡単な説明については、上のサマリーを参照してください。詳細な情報については、各サブプロジェクト固有のサイトにアクセスしてください。
2009/03 - ApacheCon EU
参加できなかった場合は ApacheCon Europe 2009 をご覧ください。
2008/11 - ApacheCon US
参加できなかった場合は ApacheCon US 2008 をご覧ください。
2008/07 - Hadoop が Terabyte Sort Benchmark で優勝
「Hadoop Wins Terabyte Sort Benchmark (Hadoop が Terabyte Sort Benchmark で優勝)」。Yahoo の Hadoop クラスタの 1 つが、1 テラバイトのデータを 209 秒でソートし、毎年開催される汎用 (Daytona) terabyte sort benchmark の前回の記録である 297 秒を更新しました。Java とオープンソースプログラムが優勝したのは今回が初めてです。



