了解java软件开发的小伙伴对数据库应该不会陌生,尤其是sql数据库,毕竟是高频率需要使用到的,那么你了解过nosql数据库吗?有哪些nosql数据库呢?使用nosql有什么好处?
nosql分类如下所示:
Key-value stores键值存储, 保存keys+BLOBs (二进制大对象Binary Large OBjects)
Table-oriented 面向表列, 主要有Google的BigTable和Cassandra.
Document-oriented面向文档, 文本是一种类似XML文档,MongoDB 和 CouchDB
Graph-oriented 面向图论. 如Neo4J
面向文档与面向表列或键值存储的区别:面向列族或键值存储需要定义数据结构(半结构化),面向文档无需结构(非结构化)。
NoSQL与关系数据库的区别:NoSQL绝对不支持Join。noSQL其实否定了关系数据库的第二索引和join。joins导致数据库切分sharding无法实施。
nosql具体产品种类有:
Google: Bigtable Amazon: Dynamo Amazon: SimpleDB Yahoo: HBase Microsoft: Dynomite Facebook: Cassandra LinkedIn: Voldemort
nosql内部模式如下所示:
Distributed Hash Tables (DHT)分布式哈希;
Scalable 可伸缩;
Partitioned 分区;
Fault-tolerant 容错;
Decentralized 非集中式;
Peer to peer 点对点;
Popularized;
Node ring 节点环;
Consistent Hashing 一致性哈希;
几个主要nosql特点介绍:
关键点:超快Blazing fast ,IM data structure engine,支持五种,Key-value最简单。只有Redis有事务机制 。
适合: 不支持第二索引,在可以控制的数据库大小情况下(放得下整个内存),快速改变数据,快速写数据。
案例:股票价格系统 分析,实时数据收集,联系等等。
Redis Cluster可以进行复制和手工failover.
Riak:
关键点: 容错性Fault tolerance 失败恢复 内置全文本搜索
适合: 如果你希望有类似Cassandra-like (Dynamo-like)风格, 但是你不想处理器复杂性和膨胀性。单服务器有良好可伸缩性scalability, 可用性availability 和容错性 fault-tolerance, 采取是昂贵的多站点复制multi-site replication.
案例:销售点数据收集,工厂控制系统,那些不能允许几秒当机的场合。
HBase:
关键点: 十亿级别的行 X 百万级别的列 大容量
大表模型(高一致性)。
Map/reduce with Hadoop 能够实时获得基于查询的优化性能的节约型网关适合:
适合:随机 实时的读写操作,高吞吐量写,随机访问大数据集。
案例: Facebook 消息数据库
键点: 继承BigTable的列结构、Dynamo的最终一致性。
适合: 当写操作多于读操作 (如logging).
案例:: 银行Banking, 金融系统,写必须快于都的场合,实时的数据分析等.
HBase和Cassandra 比较:
Hbase更加适合于数据仓库、大型数据的处理和分析(如进行Web页面的索引等)慢活。高一致性CP。
Cassandra 则更适合于实时事务处理和提供交互型数据 ,快活,最终一致性AP。Cossip 完全对称
CouchDB:
关键点: 最终一致性, 易用。
写操作不会阻塞读操作。
内部嵌入Hadoop之类map/reduce算法。
实时更新。
累计计算, 偶尔改变数据, 预先定义的查询. 非常注重版本控制的场合.
例如: CRM, CMS系统。
Couch 适合实时性要求不高,易于使用。文本数据库
MVCC 模型:copy-on-modified?
任何修改都会引起一个拷贝,这引起索引修改,再引起一个索引拷贝,以此类推:
CouchDB 的长处正是Redis的短处
Redis提供了简单的索引机制和复杂的数据结构,而CouchDB提供的是复杂的索引和简单的数据结构
CouchDB:存储大量的不易变但会被经常查询的大量的文档型数据。
Redis :存储小量的常变数据,存储实时数据 。
Couchbase :
Couchbase基于Membase与CouchDB开发了一款个面向文档的数据库,Membase是个键/值、持久化、可伸缩的解决方案,使用了memcached wire协议。因此,对于数据的读写来说都能提供低延迟的访问。
与CouchDB区别:Couchbase产品包含了CouchDB的一个副本。Couchbase产品向CouchDB添加了缓存、集群等功能,
Couchbase在内部数据中心使用Membase风格的复制,在数据中心之间使用CouchDB风格的复制,支持碰撞检测和决议。
MongoDB:
关键点: 强迫性一致;类SQL,容易上手 , 内置分片碎片
适合: 需要动态查询. 愿意事先定义索引indexes, 需要巨大的数据库有良好性能。
案例:适合90%所有MySQL等RDBM场合。
问题:数据集大于内存很慢。
MongoDB 使用MapReduce替代SQL的聚合功能进行分析,但是当前是单线程,并不可伸缩。
NEO4J:
图数据库,适合社会网络应用LinkedIn Facebook 文件系统角色关系
由nodes, relationships and properties.组成
内存中的节点图,自动持久。
那么以上就是有关nosql数据库的所有相关内容了,还想了解更多java入门信息,记得关注本站消息获取更多知识哦。