mycat分库分表如何实现?原理是什么?

TheDisguiser 2020-05-04 16:47:06 java常见问答 10245

今天要和小伙伴讲解的是mycat中的分库分离,大家知道要怎么实现吗?它又是什么原理呢?一起来了解一下吧。

原理

Mycat是通过一种功能来实现分库分表的,在路由规则里它会定义分片字段、分片算法。分片算法有多种,如常见的hash、取模、范围分片等。在mycat中,所有传递的sql语句都会被做路由处理;路由处理的依据就是表是否分片,如果分片,那么需要依据分片字段和对应的分片算法来判断sql应该传递到哪一个、或者哪几个、又或者全部节点去执行。

实现

在mycat的conf目录中,有着这么三个配置文件,所有的读写分离/分库分表都需要依赖它们才能够完成。

1.server.xml:

配置了mycat的用户(账号:root 密码:root) --> 账号和密码可以根据情况随意更改

<!--
        整个user标签中就是配置了mycat的账号和密码
            name===》就是mycat的账号
            defaultAccount====》表示该账号为管理员账号,而且只能出现一次
            property:属性标签
                password===》就是name的密码
            无论是账号还是密码都可以随意定制,开心就好!!!
            readOnly:只读(该账号只能查询数据,不能写入数据)
        schemas:指向的是mycat的数据库(mycat的虚拟库!!!这个库并不是真实存在的,是需要通过mysql的数据库进行映射的),一个mycat中可以有多个schema
        隐藏mysql的真实库的名字
            连接mysql:
                jdbc:mysql:localhost:3306/数据库名
            连接mycat:
                jdbc:mysql:ip地址:端口号/mycat的虚拟库名
        schemas中的配置和mysql的数据库可以一样,也可以不一样
    -->
    <user name="root" defaultAccount="true">
        <property name="password">123456</property>
        <property name="schemas">TEACH</property>
    </user>

2.rule.xml:

定义了mycat的规则

<!--
        所有的规则配置一个tableRule对应一个function,如果需要进行配置必须要配置一对,不能单独配置一个(如果单独配置了一个的情况下,mycat启动的时候会直接报错)
        一共有十种规则:
            homework1:
                百度把这10种规则全部弄明白,然后整理一份用自己语言描述的电子文档
        mod-long:(轮询)
            mysql01
                mysql数据库
                    teach
                        student
            mysql02
                mysql数据库
                    teach
                        student
            当客户端发送请求===插入数据===》mycat===请求mysql===》会把第一条数据插入进mysql01,
                会把第二条数据插入进mysql02
        依次循环
    -->
    <tableRule name="mod-long">
        <rule>
            <columns>id</columns>
            <algorithm>mod-long</algorithm>
        </rule>
    </tableRule>
    
    
    <function name="mod-long" class="io.mycat.route.function.PartitionByMod">
        <!--
            代表了datanode的节点数量
            如果只有两台datanode就必须要写2
        -->
        <property name="count">2</property>
    </function>

3.schema.xml:

读写分离和分库分表的具体实现

<?xml version="1.0"?>
<!DOCTYPE mycat:schema SYSTEM "schema.dtd">
<mycat:schema xmlns:mycat="http://io.mycat/">
    <!--
        !!!schema标签的name属性值必须要和server.xml中的schames保持一致!!!
        schema就类似于mysql的数据库
        checkSQLschema:检查SQL语句是否错误(select * from user wher id = 1)
            默认值为false,不需要改为true,把对SQL语句的检查交给mysql处理
        sqlMaxLimit:最大执行SQL语句的数量
            一次性可以执行多少条SQL语句
        在schame标签中有table标签,这个标签就是定义了mycat中的表
            类似于mysql数据库中的表
            和mysql中的表名可以重复也可以不一致
        dataNode:数据节点
            在HDFS中存放数据
            在mycat中映射的就是真实mysql数据库(可以有多个,也可以只有一个),名字可以随意起
            今天的目标是实现分库分表,需要用到两台mysql数据库,所以只需要配置dn1和dn2
        rule:配置规则
            配置一定要和rule.xml中保持一致
    -->
    <schema name="TEACH" checkSQLschema="false" sqlMaxLimit="100">
        <!-- auto sharding by id (long) -->
        <table name="book" dataNode="dn1,dn2" rule="mod-long" />
    </schema>
    
    <!--
        datanode标签对应的是table标签中的datanode属性
            也就是说datanode属性值必须要和dataNode的标签name属性值保值一致
            dn1:代表了mysql01服务器==》mysql数据库
            dn2:代表了mysql02服务器==》mysql数据库
        dataHost:才是真正的配置了分库分表和读写分离的核心配置
        database:映射的是真实mysql的数据库名
    -->
    <dataNode name="dn1" dataHost="localhost1" database="TEACH" />
    <dataNode name="dn2" dataHost="localhost2" database="TEACH" />
    
    <!--
        dataHost标签必须要和dataNode标签中的dataHost属性保持一致
            如果dataHost属性名重复了,映射的是同一个dataHost
        每一个dataHost标签就是一个真实的mysql数据库
        maxCon:最大连接数
        minCon:最小连接数
        balance:        homework2:
            把balance,writeType,switchType弄明白,并且用自己的语言描述每个值代表什么意思,记录电子文档负载均衡
        writeType:写入的类型(读写分离使用)
        switchType:转换的类型(读写分离所使用的数据)
        dbType:数据库的类型(在最早的版本mycat只支持mysql一种数据库,后来发展支持很多种数据库)
        dbDriver:数据库驱动(使用本地驱动,使用的是mycat所提供的驱动)
        slaveThreshold:自己查!!!!
            master:主节点
            slave:从节点
            threshold:入口
    -->
    <dataHost name="localhost1" maxCon="1000" minCon="10" balance="0"
              writeType="0" dbType="mysql" dbDriver="native" switchType="1"  slaveThreshold="100">
              <!--
                heartbeat:心跳
                    mycat一直在监视mysql的user表(心跳),如果一旦发现mysql的user不再有心跳,就会认为这一台mysql处于宕机状态,也就不会再向这一台mysql进行做增删改查的操作
              -->
        <heartbeat>select user()</heartbeat>
        <!--
            writeHost:标签是该台mysql数据库为读和写的数据库
            readHost:标签是该台mysql数据库为读的数据库
            writeHost如果单独存在,标识该台mysql数据库为读和写的操作
                如果一旦和readHost一起使用,writeHost就只能做些的操作,所有的读操作都使用readHost完成
                readHost必须要配置在writeHost的内容,不允许单独存在
            host:属性只是标识了该台数据库的操作的内容,可以随意定义
            url:数据库的url
                jdbc:mysql://localhost:3306
            !!!!!如果配置了两个writeHost,那么host的值就必须不能重复!!!!!
        -->
        <writeHost host="write01" url="192.168.23.129:3306" user="root"
                   password="root" />
    </dataHost>
    <dataHost name="localhost2" maxCon="1000" minCon="10" balance="0"
              writeType="0" dbType="mysql" dbDriver="native" switchType="1"  slaveThreshold="100">
        <heartbeat>select user()</heartbeat>
        <writeHost host="write02" url="192.168.23.130:3306" user="root"
                   password="root" />
    </dataHost>
    <!--
        mycat中所映射的真实mysql的表必须要mycat所声明的table的名字保持一致
        也就是说mycat的表名必须要和mysql的表名一模一样,否则映射不到
    -->
</mycat:schema>

Mycat其实也可以看成是一个数据库,只是是一个虚拟的,它把真实的mysql表数据映射进了虚拟库中,所以我们在使用Java项目连接的时候只需要连接mycat即可,不需要再连mysql。

以上就是本文的所有内容,更多Java常见问答知识请关注我们了解详情吧。