欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

MyISAM与InnoDB两者之间区别与选择,详细总结,性能对比

程序员文章站 2022-05-15 13:18:01
1、MyISAM:默认表类型,它是基于传统的ISAM类型,ISAM是Indexed Sequential Access Method (有索引的顺序访问方法) 的缩写,它是存储记录和文件的标准方法。不是事务安全的,而且不支持外键,如果执行大量的select,insert MyISAM比较适合。 2、 ......

1、myisam:默认表类型,它是基于传统的isam类型,isam是indexed sequential access method (有索引的顺序访问方法) 的缩写,它是存储记录和文件的标准方法。不是事务安全的,而且不支持外键,如果执行大量的select,insert myisam比较适合。

2、innodb:支持事务安全的引擎,支持外键、行锁、事务是他的最大特点。如果有大量的update和insert,建议使用innodb,特别是针对多个并发和qps较高的情况。

 

一、表锁差异

myisam:

myisam只支持表级锁,用户在操作myisam表时,select,update,delete,insert语句都会给表自动加锁,如果加锁以后的表满足insert并发的情况下,可以在表的尾部插入新的数据。也可以通过lock table命令来锁表,这样操作主要是可以模仿事务,但是消耗非常大,一般只在实验演示中使用。

innodb :

innodb支持事务和行级锁,是innodb的最大特色。

事务的acid属性:atomicity,consistent,isolation,durable。

并发事务带来的几个问题:更新丢失,脏读,不可重复读,幻读。

事务隔离级别:未提交读(read uncommitted),已提交读(read committed),可重复读(repeatable read),可序列化(serializable)

四种隔离级别的比较

读数据一致性及并发副作用

 

隔离级别

读数据一致性

脏读

不可重复读

幻读

为提交读(read uncommitted)

最低级别,不读物理上顺坏的数据

已提交读(read committed)

语句级

可重复读(repeatable red)

事务级

可序列化(serializable)

*别,事务级

 

查看mysql的默认事务隔离级别“show global variables like ‘tx_isolation’; ”

innodb的行锁模式有以下几种:共享锁,排他锁,意向共享锁(表锁),意向排他锁(表锁),间隙锁。

注意:当语句没有使用索引,innodb不能确定操作的行,这个时候就使用的意向锁,也就是表锁

关于死锁:

什么是死锁?当两个事务都需要获得对方持有的排他锁才能完成事务,这样就导致了循环锁等待,也就是常见的死锁类型。

解决死锁的方法:

1、  数据库参数

2、  应用中尽量约定程序读取表的顺序一样

3、  应用中处理一个表时,尽量对处理的顺序排序

4、  调整事务隔离级别(避免两个事务同时操作一行不存在的数据,容易发生死锁)

 

二、数据库文件差异

myisam :

myisam属于堆表

myisam在磁盘存储上有三个文件,每个文件名以表名开头,扩展名指出文件类型。

.frm 用于存储表的定义

.myd 用于存放数据

.myi 用于存放表索引

myisam表还支持三种不同的存储格式:

静态表(默认,但是注意数据末尾不能有空格,会被去掉)

动态表

压缩表

innodb :

innodb属于索引组织表

innodb有两种存储方式,共享表空间存储和多表空间存储

两种存储方式的表结构和myisam一样,以表名开头,扩展名是.frm。

如果使用共享表空间,那么所有表的数据文件和索引文件都保存在一个表空间里,一个表空间可以有多个文件,通过innodb_data_file_path和innodb_data_home_dir参数设置共享表空间的位置和名字,一般共享表空间的名字叫ibdata1-n。

如果使用多表空间,那么每个表都有一个表空间文件用于存储每个表的数据和索引,文件名以表名开头,以.ibd为扩展名。

 

三、索引差异

1、关于自动增长

myisam引擎的自动增长列必须是索引,如果是组合索引,自动增长可以不是第一列,他可以根据前面几列进行排序后递增。

innodb引擎的自动增长咧必须是索引,如果是组合索引也必须是组合索引的第一列。

2、关于主键

myisam允许没有任何索引和主键的表存在,

myisam的索引都是保存行的地址。

innodb引擎如果没有设定主键或者非空唯一索引,就会自动生成一个6字节的主键(用户不可见)

innodb的数据是主索引的一部分,附加索引保存的是主索引的值。

3、关于count()函数

myisam保存有表的总行数,如果select count(*) from table;会直接取出出该值

innodb没有保存表的总行数,如果使用select count(*) from table;就会遍历整个表,消耗相当大,但是在加了wehre       条件后,myisam和innodb处理的方式都一样。

4、全文索引

myisam支持 fulltext类型的全文索引

innodb不支持fulltext类型的全文索引,但是innodb可以使用sphinx插件支持全文索引,并且效果更好。(sphinx   是一个开源软件,提供多种语言的api接口,可以优化mysql的各种查询)

5、delete from table

使用这条命令时,innodb不会从新建立表,而是一条一条的删除数据,在innodb上如果要清空保存有大量数据的表,最       好不要使用这个命令。(推荐使用truncate table,不过需要用户有drop此表的权限)

6、索引保存位置

myisam的索引以表名+.myi文件分别保存。

innodb的索引和数据一起保存在表空间里。

 

四、开发的注意事项

1、可以用 show create table tablename 命令看表的引擎类型。

2、对不支持事务的表做start/commit操作没有任何效果,在执行commit前已经提交。

3、可以执行以下命令来切换非事务表到事务(数据不会丢失),innodb表比myisam表更安全:alter table tablename type=innodb;或者使用 alter table tablename engine = innodb;

4、默认innodb是开启自动提交的,如果你按照myisam的使用方法来编写代码页不会存在错误,只是性能会很低。如何在编写代码时候提高数据库性能呢?

a、尽量将多个语句绑到一个事务中,进行提交,避免多次提交导致的数据库开销。

b、在一个事务获得排他锁或者意向排他锁以后,如果后面还有需要处理的sql语句,在这两条或者多条sql语句之间程序应尽量少的进行逻辑运算和处理,减少锁的时间。

c、尽量避免死锁

d、sql语句如果有where子句一定要使用索引,尽量避免获取意向排他锁。

f、针对我们自己的数据库环境,日志系统是直插入,不修改的,所以我们使用混合引擎方式,zion_log_db照旧使用myisam存储引擎,只有zion_game_db,zion_login_db,daum_billing使用innodb引擎。

 

五、究竟该怎么选择

下面先让我们回答一些问题:  

◆你的数据库有外键吗?  

◆你需要事务支持吗?  

◆你需要全文索引吗?  

◆你经常使用什么样的查询模式?  

◆你的数据有多大?  
 
myisam只有索引缓存  
innodb不分索引文件数据文件 innodb buffer  
myisam只能管理索引,在索引数据大于分配的资源时,会由操作系统来cache;数据文件依赖于操作系统的cache。innodb不管是索引还是数据,都是自己来管理  
 
思考上面这些问题可以让你找到合适的方向,但那并不是绝对的。如果你需要事务处理或是外键,那么innodb 可能是比较好的方式。如果你需要全文索引,那么通常来说 myisam是好的选择,因为这是系统内建的,然而,我们其实并不会经常地去测试两百万行记录。所以,就算是慢一点,我们可以通过使用sphinx从innodb中获得全文索引。  
 
数据的大小,是一个影响你选择什么样存储引擎的重要因素,大尺寸的数据集趋向于选择innodb方式,因为其支持事务处理和故障恢复。数据库的在小决定了故障恢复的时间长短,innodb可以利用事务日志进行数据恢复,这会比较快。而myisam可能会需要几个小时甚至几天来干这些事,innodb只需要几分钟。  
 
操作数据库表的习惯可能也会是一个对性能影响很大的因素。比如: count() 在 myisam 表中会非常快,而在innodb 表下可能会很痛苦。而主键查询则在innodb下会相当相当的快,但需要小心的是如果我们的主键太长了也会导致性能问题。大批的inserts 语句在 myisam下会快一些,但是updates 在innodb下会更快一些——尤其在并发量大的时候。  
 
所以,到底你检使用哪一个呢?根据经验来看,如果是一些小型的应用或项目,那么myisam 也许会更适合。当然,在大型的环境下使用 myisam 也会有很大成功的时候,但却不总是这样的。如果你正在计划使用一个超大数据量的项目,而且需要事务处理或外键支持,那么你真的应该直接使用 innodb方式。但需要记住innodb 的表需要更多的内存和存储,转换100gb 的myisam 表到innodb 表可能会让你有非常坏的体验。  
 
对于支持事务的innodb类型的表,影响速度的主要原因是autocommit默认设置是打开的,而且程序没有显式调用begin 开始事务,导致每插入一条都自动commit,严重影响了速度。可以在执行sql前调用begin,多条sql形成一个事务(即使autocommit打开也可以),将大大提高性能。  

 

innodb

innodb 给 mysql 提供了具有事务(commit)、回滚(rollback)和崩溃修复能力 (crash recovery capabilities)的事务安全(transaction-safe (acid compliant))型表。 innodb 提供了行锁(locking on row level),提供与 oracle 类型一致的不加锁读取(non- locking read in selects)。这些特性均提高了多用户并发操作的性能表现。在innodb表中不需要扩大锁定 (lock escalation),因为 innodb 的列锁定(row level locks)适宜非常小的空间。 innodb 是 mysql 上第一个提供外键约束(foreign key constraints)的表引擎。  

innodb 的设计目标是处理大容量数据库系统,它的 cpu 利用率是其它基于磁盘的关系数据库引擎所不能比的。在技术上,innodb 是一套放在 mysql 后台的完整数据库系统,innodb 在主内存中建立其专用的缓冲池用于高速缓冲数据和索引。 innodb 把数据和索引存放在表空间里,可能包含多个文件,这与其它的不一样,举例来说,在 myisam 中,表被存放在单独的文件中。innodb 表的大小只受限于操作系统的文件大小,一般为 2 gb。  
innodb所有的表都保存在同一个数据文件 ibdata1 中(也可能是多个文件,或者是独立的表空间文件),相对来说比较不好备份,免费的方案可以是拷贝数据文件、备份 binlog,或者用 mysqldump。  


myisam  
myisam 是mysql缺省存贮引擎 .  
每张myisam 表被存放在三个文件 。frm 文件存放表格定义。 数据文件是myd (mydata) 。 索引文件是 myi (myindex) 引伸。  
因为myisam相对简单所以在效率上要优于innodb..小型应用使用myisam是不错的选择.  
myisam表是保存成文件的形式,在跨平台的数据转移中使用myisam存储会省去不少的麻烦  
 
以下是一些细节和具体实现的差别:  
 
1.innodb不支持fulltext类型的索引。  
2.innodb 中不保存表的具体行数,也就是说,执行select count(*) from table时,innodb要扫描一遍整个表来计算有多少行,但是myisam只要简单的读出保存好的行数即可。注意的是,当count(*)语句包含 where条件时,两种表的操作是一样的。  
3.对于auto_increment类型的字段,innodb中必须包含只有该字段的索引,但是在myisam表中,可以和其他字段一起建立联合索引。  
4.delete from table时,innodb不会重新建立表,而是一行一行的删除。  
5.load table from master操作对innodb是不起作用的,解决方法是首先把innodb表改成myisam表,导入数据后再改成innodb表,但是对于使用的额外的innodb特性(例如外键)的表不适用。  

另外,innodb表的行锁也不是绝对的,如果在执行一个sql语句时mysql不能确定要扫描的范围,innodb表同样会锁全表,例如 update table set num=1 where name like “%aaa%”  

任何一种表都不是万能的,只用恰当的针对业务类型来选择合适的表类型,才能最大的发挥mysql的性能优势。  

 

六、重复地总结一遍

1、myisam不支持事务,innodb是事务类型的存储引擎,当我们的表需要用到事务支持的时候,那肯定是不能选择myisam了。

2、myisam只支持表级锁,bdb支持页级锁和表级锁默认为页级锁,而innodb支持行级锁和表级锁默认为行级锁
 
表级锁:直接锁定整张表,在锁定期间,其他进程无法对该表进行写操作,如果设置的是写锁,那么其他进程读也不允许
 
myisam是表级锁定的存储引擎,它不会出现死锁问题
 
对于write,表锁定原理如下:
 
如果表上没有锁,在其上面放置一个写锁,否则,把锁定请求放在写锁队列中。
 
对于read,表锁定原理如下 :
 
如果表上没有写锁定,那么把一个读锁放在其上面,否则把锁请求放在读锁定队列中
 
当一个锁定被释放时,表可被写锁定队列中的线程得到,然后才是读锁定队列中的线程。这意味着,如果你在一个表上有许多更新,那么你的select语句将等到所有的写锁定线程执行完。

行级锁:只对指定的行进行锁定,其他进程还是可以对表中的其他行进行操作的。
 
行级锁是mysql粒度最小的一种锁,它能大大的减少数据库操作的冲突,但是粒度越小实现成本也越大。
 
行级锁可能会导致“死锁”,那到底是怎么导致的呢,分析原因:mysql行级锁并不是直接锁记录,而是锁索引。索引分为主键索引和非主键索引两种,如果一条sql语句操作了主键索引,那么mysql就会锁定这个主键索引,如果sql语句操作的是非主键索引,那么mysql会先锁定这个非主键索引,再去锁定主键索引。
 
在update 和 delete操作时mysql不仅会锁定所有where 条件扫描过得索引,还会锁定相邻的键值。
 
“死锁”举例分析:
 
表test:(id,state,time)  主键索引:id  非主键索引:state
 
当执行"update  state =1011 where state=1000"  语句的时候会锁定state索引,由于state 是非主键索引,所以mysql还会去请求锁定id索引
 
当另一个sql语句与语句1几乎同时执行时:“update state=1010 where id=1”  对于语句2 mysql会先锁定id索引,由于语句2操作了state字段,所以mysql还会请求锁定state索引。这时。彼此锁定着对方需要的索引,又都在等待对方释放锁定。所以出现了"死锁"的情况。
 
行级锁的优点:
 
有许多线程访问不同的行时,只存在少量的冲突。
 
回滚时只有少量的更改
 
可以长时间锁定单一的行
 
行级锁缺点:
 
相对于页级锁和表级锁来说占用了更多的内存
 
当表的大部分行在使用时,比页级锁和表级锁慢,因为你必须获得更多的锁
 
当在大部分数据上经常使用group by操作,肯定会比表级锁和页级锁慢。
 
页级锁:表级锁速度快,但是冲突多;行级锁速度慢,但冲突少;页级锁就是他俩折中的,一次锁定相邻的一组记录。

3、myisam引擎不支持外键,innodb支持外键

4、myisam引擎的表在大量高并发的读写下会经常出现表损坏的情况
 
我们以前做的项目就遇到这个问题,表的insert 和 update操作很频繁,原来用的myisam引擎,导致表隔三差五就损坏,后来更换成了innodb引擎。
 
其他容易导致表损坏原因:
 
服务器突然断电导致数据文件损坏,强制关机(mysqld未关闭情况下)导致表损坏
 
mysqld进程在写入操作的时候被杀掉
 
磁盘故障
 
表损坏常见症状:
 
查询表不能返回数据或返回部分数据
 
打开表失败: can’t open file: ‘×××.myi’ (errno: 145) 。
 
error: table 'p' is marked as crashed and should be repaired 。

incorrect key file for table: '...'. try to repair it
 
mysql表的恢复:

对于myisam表的恢复:

可以使用mysql自带的myisamchk工具: myisamchk -r tablename  或者 myisamchk -o tablename(比前面的更保险) 对表进行修复

5、对于count()查询来说myisam更有优势

因为myisam存储了表中的行数记录,执行select count() 的时候可以直接获取到结果,而innodb需要扫描全部数据后得到结果。

但是注意一点:对于带有where 条件的 select count()语句两种引擎的表执行过程是一样的,都需要扫描全部数据后得到结果

6、 innodb是为处理巨大数据量时的最大性能设计,它的cpu效率可能是任何其它基于磁盘的关系数据库引擎所不能匹敌的。

7、myisam支持全文索引(fulltext),innodb不支持

8、myisam引擎的表的查询、更新、插入的效率要比innodb高

网上截取了前辈们测试结论:

测试方法:连续提交10个query, 表记录总数:38万 , 时间单位 s
 
        引擎类型                    myisam                innodb              性能相差
 
        count                      0.0008357            3.0163                3609
 
        查询主键                  0.005708              0.1574                27.57
 
        查询非主键                  24.01                  80.37                3.348
 
        更新主键                  0.008124            0.8183                100.7
 
        更新非主键                0.004141            0.02625              6.338
 
        插入                        0.004188            0.3694                88.21
 

    (1)加了索引以后,对于myisam查询可以加快:4 206.09733倍,对innodb查询加快510.72921倍,同时对myisam更新速度减慢为原来的1/2,innodb的更
  新速度减慢为原来的1/30。要看情况决定是否要加索引,比如不查询的log表,不要做任何的索引。
 
    (2)如果你的数据量是百万级别的,并且没有任何的事务处理,那么用myisam是性能最好的选择。
 
    (3)innodb表的大小更加的大,用myisam可省很多的硬盘空间。
 
        在我们测试的这个38w的表中,表占用空间的情况如下:
            引擎类型                    myisam              innodb
            数据                      53,924 kb          58,976 kb
            索引                      13,640 kb          21,072 kb
            占用总空间              67,564 kb          80,048 kb
 
        另外一个176w万记录的表, 表占用空间的情况如下:
 
            引擎类型                myisam              innordb
            数据                  56,166 kb          90,736 kb
            索引                  67,103 kb          88,848 kb
            占用总空间        123,269 kb        179,584 kb

 

七、性能对比

 

测试的版本是mysql  ver 14.14 distrib 5.1.49, for debian-linux-gnu (i686),使用的是innodb plugin 1.0.8(官方称比built-in版本性能更好)和默认的myisam

测试机器是笔记本,配置如下:intel 酷睿2双核 p8600,2g*2 ddr3 1066内存,320g硬盘5400转。

测试一:数据插入性能测试,这里我分别对innodb_flush_log_at_trx_commit参数打开和关闭都测了了一下,每次测试都是运行40s,表中数字都是实际插入条数。

                       myisam                 innodb (打开)      innodb (关闭)

单线程,逐个插入         120000                 60000              60000

4线程,逐个插入          40000*4                20000*4            40000*4

单线程,批量100条/次插入  3600*100               800*100            3000*100

单线程,批量200条/次插入  1800*200               400*200            1600*200

可以发现批量插入的性能远高于单条插入,但是一次批量的大小对性能影响不大。每条记录是否都刷新日志的参数对innodb性能的影响巨大。总体上来说,myisam性能更优一点。这里有一点需要注意,在插入测试过程中,我对系统资源进行了监控,发现myisam对系统资源占用很低,但是innodb对磁盘占用却很高,应该是对事务控制多了很多需要记录的日志。

测试二:数据读取性能测试。每次随机读取1000条记录,反复进行读取。

                        myisam        innodb

单线程,200次读取         5.7s          16.7s

4线程,200次读取          12s           40.8s

可以看出myisam的读取性能非常恐怖,性能差距在3倍的样子。

以上两个测试发现myisam在无事务的需求下几乎完胜,但是要知道它是表锁,innodb是行锁,那么在并发读写同时存在的情况下,那结果会是怎么样呢?!

测试三:两个线程并发写入,2个线程并发读取。

                       myisam                                 innodb

逐个插入                写入40s:10000*2 读取200次*2:14s        写入40s:60000*2 读取200次*2:50s

批量100条/次插入        写入40s:1000*100*2 读取200次*2:10s      写入40s:1500*100*2 读取200次*2:50s

这下立刻显示出innodb在并发情况下强劲的性能,几乎没有什么性能衰减。而myisam单条插入速度变得非常慢,批量插入也下降了40%性能。

总结一下,在写多读少的应用中还是innodb插入性能更稳定,在并发情况下也能基本,如果是对读取速度要求比较快的应用还是选myisam。