Apache Cassandra プロジェクトでは、Dynamo の完全分散システムデザインと Bigtable のカラムファミリに基づいたデータモデルをあわせ持つ、スケーラビリティの高い第2世代分散データベースを開発しています。
Cassandra は Facebook によって 2008 年にオープンソース化され、現在は Apache コミッタとさまざまな企業に所属する多くのコントリビュータによって開発されています。
Cassandra は、Digg をはじめ、Facebook, Twitter, Reddit, Rackspace, Cloudkick, Cisco, SimpleGeo, Ooyala, OpenX など、大規模でアクティブなデータセットを持つ多くの企業で実際に使われています。最も大規模な実働クラスタでは、150 台以上のマシンに 100 TB を超えるデータが格納されています。
障害に備えて、データは複数のノードに自動的にレプリケートされます。複数のデータセンターにまたがるレプリケーションもサポートされています。故障したノードは、ダウンタイムなしにリプレースできます。
読み取りと書き込みのどちらについても、マシンを追加することでスループットがリニアに向上します。このとき、ダウンタイムが生じたり、アプリケーションの処理が中断されたりすることはありません。
Cassandra が適しているのは、たとえデータセンター全体がダウンした場合でも、データの損失を許容できないようなアプリケーションです。
Cassandra のサポートに関する契約およびサービスについては、サードパーティによるサポートを参照してください。
Cassandra の開発者とコミュニティメンバーの多くは、irc.freenode.net 上の #cassandra チャンネルをよく利用しています。
まだ IRC を使ったことがなく、クライアントを持っていない場合には、Web ベースのクライアントを使用できます。