350 likes | 486 Vues
A Brain-Friendly Guide. Head First. Social. BigData. Facebook Twitter Social Graph Social Bookmark. User Logging. Access Log POS GPS. Machine Learning Recommendation Enterprise Search. Cloud. Google Apps Amazon EC2 Open Cloud. Don’na “Hang=Dan” Dar with Pandaneco Rojinkai.
E N D
A Brain-Friendly Guide Head First Social BigData Facebook Twitter Social Graph Social Bookmark User Logging Access Log POS GPS Machine Learning Recommendation Enterprise Search Cloud Google Apps Amazon EC2 Open Cloud Don’na “Hang=Dan” Dar with PandanecoRojinkai ORE’ILLY
こんにちは ビッグデータ! ここに、これまではSQLで 扱って来たデータがあるじゃろ? ( ^ω^) ⊃ 普通のデータ ⊂
こんにちは ビッグデータ! これをNoSQLに入れ直して… ( ^ω^) ≡⊃⊂≡
こんにちは ビッグデータ! 出来上がりじゃ♪ ( ^ω^) ⊃ビッグデータ⊂
そもそもの話 Big Data って?
http://www.bigdatalandscape.com/ データ分析フレームワーク 大規模データ 保持・加工・処理
Big Dataの Data Base 分散ストレージ 扱う全データ量が大きい 分散処理系 一度に扱うデータ量が大きい サーバ一台に収まらないデータを扱う
RDBMS の高性能化限界 Cost スケールアップは 高価/ 頭打ち Spec
無限のスケールアウト性能 Cost 台数に比例した 性能が得られる Spec
簡単につかえて 無限にスケールアウトする 分散処理系 兼 分散ファイルシステム
Hadoop やってます 競争 の時代
はたと気がつく バッチ処理はできるけど クエリとかの応答性能は 出せないんだよね…… なんと RDBMSが おきあがり なかまに なりたそうに こちらをみている!
はい いいえ No!SQL
まだRDBMS代替を主張しないといけない時代 RDBMS では できないことを やってるぞ!
http://www.bigdatalandscape.com/ ところで Big Data Landscape をよく見てみよう
http://www.bigdatalandscape.com/ ファッ!???
基幹システムを張れると主張しないといけない時代基幹システムを張れると主張しないといけない時代 トランザクションとか ビジネス要件とか言われると 辛いんだよね… … さいど RDBMSが おきあがり なかまに なりたそうに こちらをみている!
DATABASE RDBMS SQL NoSQL
RDBMS NoSQL and more…
まとめ みんなGoogleが大好きなので、GoogleのパチもんのHadoopも 最高にCoooool!!!!でした RDBMSはしばしばデータ基盤として用いられていたので、 うまくHadoopで置き換えれば数十倍の処理性能が出ました。 例えば大量に、全件を、まとめて処理するバッチ それはそうでしょう。 それはRDBMSでやるべきものではなかったのですから。 RDBMSの数十倍! が初期のウリだったので、RDBMSは 意地でも使うわけにはいかなくなりました。 そこで現れたのが NoSQLです。 今ではそうでもなくなりました。RDBMSとの融和の時代です。
勧誘の時間 そもそもの疑問 なぜ RDBMS では実現できないのか データベースに求められる機能とは何なのか そもそもどうやってデータベースを 実現してきたのか
勧誘の時間 データベースをきちんと知らないと 答えられない疑問
勧誘の時間 データベースをきちんと知らないと 答えられない疑問 じゃあ いつ学ぶのか
勧誘の時間 もう一度 データベース(Not only SQL) を学ぼう!
方針 • 7つのデータベース 7つの世界 から • いくつかのソフトウェアを実際に触る • 環境はとりあえず太田が用意する • 足りなくなったら検討 • その後は個々気に入ったソフトウェアを集中的に • 目標:データベース製品の特徴を理解し、 • 用途に合わせて選んで採用できる
初期スケジュール • 7つのDB 7つの世界 • リレーショナル代数について(東) • PostgreSQL(小林) • HBase(太田) • Neo4j (東) • 7つのDB 7つの世界 • Riak(太田) • MongoDB() • CouchDB() • Redis(やまひろ) • 7つのDB 7つの世界 予備日 • 7つのDB 7つの世界 残り部分 • 各DB比較 - NoSQLプログラミング実践活用技法 • その後 • 各製品 Deep Dive