読者です 読者をやめる 読者になる 読者になる

ローカルでcassandra

勉強 仕事 nosql

最近、cassandraについて調べている。
http://cassandra.apache.org/
facebookが開発し、twittermysqlから乗り換えようとしているNoSQL(=not only SQL)のシステム。
個人的に一番特徴的だなと思うのは、マスタという概念が存在しないこと。
ほんとにノード足すだけで、クラスターが増えていくんだな。


とりあえず、疑似分散的にwindows + 仮想ubuntu上で動かすというところまでは、
けっこうさっくりといった。

  • windowsマシン上に仮想環境作成。(virtual box + ubuntu)

http://www.ubuntulinux.jp/products/JA-Localized/virtualbox
ブリッジ接続にする。
guest additionsというのも入れる。

ダウンロードして、解凍して、置くだけ。
自分は下の本を参考にしましたが、ググれば問題ないと思います。
外部のクライアントプログラムからアクセスするには、
conf/storage-conf.xmlのThriftのIPを"0.0.0.0"にしておく。

  • windows上でも動かす。

同じく解凍して置くだけ。
http://d.hatena.ne.jp/natsumesouxx/20100402/1270212456
seedのところに、仮想環境側のOSのIPを指定して起動すると、
お互いが認識しあって、勝手に2台構成になります。
(先に起動しているほうは、後から追加されるノードを知らなくてもいいので、
サービス停止をすることなく、スケールアウトできる!!)
ReplicationFactorの設定数を2にしておくと、ミラーリングみたいになります。



↓ちなみに自分はlinuxでの動かし方はこの本の通りやりました。
深い本ではありませんが、hadoopやらcassandraといったやや敷居の高い
システムをとりあえず動かしてみるというところを図解で丁寧に紹介するという、
ありそうで無かった本で意外に重宝しました。

みてわかるクラウドマガジンvol.1 (日経BPパソコンベストムック)

みてわかるクラウドマガジンvol.1 (日経BPパソコンベストムック)


クライアントの書き方等はまた次回。


しかし、情報が散らばっていて、しかも英語だらけで、ここから先に進めるのはなかなか大変だ。
アルゴリズムのイメージが分かっていないので、各種設定がどういう意味か見えづらく、
大きなクラスターで動かすイメージというのも中々分かりづらい。
facebook発のオライリー本を期待!!!!