Apache Cassandra へようこそ

Apache Cassandra プロジェクトでは、Dynamo の完全分散システムデザインと Bigtable のカラムファミリに基づいたデータモデルをあわせ持つ、スケーラビリティの高い第2世代分散データベースを開発しています。

Cassandra は Facebook によって 2008 年にオープンソース化され、現在は Apache コミッタさまざまな企業に所属する多くのコントリビュータによって開発されています。

Cassandra 分散データベース (日本語訳原文)
jericevansプレゼンテーションをもっと見る。

ダウンロード

概要

  • 実績

    Cassandra は、Digg をはじめ、Facebook, Twitter, Reddit, Rackspace, Cloudkick, Cisco, SimpleGeo, Ooyala, OpenX など、大規模でアクティブなデータセットを持つ多くの企業で実際に使われています。最も大規模な実働クラスタでは、150 台以上のマシンに 100 TB を超えるデータが格納されています。

  • 高い耐障害性

    障害に備えて、データは複数のノードに自動的にレプリケートされます。複数のデータセンターにまたがるレプリケーションもサポートされています。故障したノードは、ダウンタイムなしにリプレースできます。

  • 非集中的

    クラスタ内のすべてのノードは対等です。ネットワークボトルネックはありません。SPOF (単一障害点) もありません。

  • ユーザーに主導権

    更新ごとに同期レプリケーションまたは非同期レプリケーションを選択できます。可用性の高い非同期処理は、ヒントハンドオフリードリペアをはじめとする機能によって最適化されています。

  • リッチなデータモデル

    単純なkey-valueストアにとどまることなく、多くのアプリケーションで効率的に利用できます。

  • エラスティック

    読み取りと書き込みのどちらについても、マシンを追加することでスループットがリニアに向上します。このとき、ダウンタイムが生じたり、アプリケーションの処理が中断されたりすることはありません。

  • 持続性

    Cassandra が適しているのは、たとえデータセンター全体がダウンした場合でも、データの損失を許容できないようなアプリケーションです。

  • 企業がサポートを提供

    Cassandra のサポートに関する契約およびサービスについては、サードパーティによるサポートを参照してください。

もっと詳しく知る

メーリングリスト

チャット

Cassandra の開発者とコミュニティメンバーの多くは、irc.freenode.net 上の #cassandra チャンネルをよく利用しています。

まだ IRC を使ったことがなく、クライアントを持っていない場合には、Web ベースのクライアントを使用できます。