欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

MySQL日常使用遵循的规范建议

程序员文章站 2022-09-13 23:38:35
一 . 基础规范 1.必须使用InnoDB存储引擎 解读:支持事务;支持行级锁;支持MVCC多版本控制;支持外键;死锁自动检测;并发性能更好、CPU及内存缓存页优化使得资源利用率更高。 2. 表字符集推荐使用utf8mb4 解读:utf8 是 Mysql 中的一种字符集,只支持最长三个字节的 UTF ......

一 . 基础规范

1.必须使用innodb存储引擎

解读:支持事务;支持行级锁;支持mvcc多版本控制;支持外键;死锁自动检测;并发性能更好、cpu及内存缓存页优化使得资源利用率更高。

2.  表字符集推荐使用utf8mb4

解读:utf8 是 mysql 中的一种字符集,只支持最长三个字节的 utf-8字符,也就是 unicode 中的基本多文本平面(bmp)。任何不在基本多文本平面的 unicode字符,都无法使用 mysql 的 utf8 字符集存储。包括 emoji 表情(emoji 是一种特殊的 unicode 编码,常见于 ios 和 android 手机上),和很多不常用的汉字,以及任何新增的 unicode 字符等等。要在 mysql 中保存 4 字节长度的 utf-8 字符,需要使用 utf8mb4 字符集,utf8mb4是utf8的超集,有存储4字节例如表情符号时,使用它。

3.  数据表、数据字段必须加入中文注释

解读:方便大家对表的理解,方便dba和开发的沟通,方便历史传承。

4.  禁止使用存储过程、视图、触发器、event

解读:a.对数据库性能影响较大,互联网业务,能让站点层和服务层干的事情,不要交到数据库层,数据库擅长存储和索引。

           b.调试,排错,迁移都比较困难,扩展性较差。

5.  禁止存储大文件或者大照片

解读:建议存储到专门的类型数据库中。

二 . 命名规范

1.  库名,表名,列名必须用小写,采用下划线分隔

解读:a.数据库服务器端开了大小写敏感,提高数据库服务器性能

           b.只有一套标准,避免abc,abc混淆(sql)

2.  库名,表名,列名必须见名知义,长度不要超过32字符

解读:见名知义,便于理解;长度不要过长,便于书写。

三 . 表设计规范

1.  表必须有主键,推荐使用bigint,表数据量少也可使用unsigned int为主键

解读:删除无主键的表,如果是row模式的主从架构,从库会挂住

2.  主从表可使用自增bigint做主键,冗余无业务含义的字段做关联字段,并做非聚集索引

解读:a.如order表自增主键id,冗余order_no字段,order_detail表自增主键id,冗余order_no字段;order\order_detail和通过order_no关联,并对order_no做非聚集索引

           b.可有效减少数据文件和索引文件提示查询性能

3.  禁止使用外键,如果要保证完整性,应由应用程式实现

解读:外键使得表之间相互耦合,影响update/delete等sql性能,有可能造成死锁,高并发情况下容易成为数据库瓶颈点

4.  建议将大字段,访问频度低的字段拆分到单独的表中存储,分离冷热数据

解读:会显著提升该表的查询性能

5.  表必须有字段create_by、create_time、modify_by、modify_time、disabled

解读:便于表的维护。

四 . 列设计规范

1. 根据业务区分使用tinyint/int/bigint,分别会占用1/4/8字

解读:数据量大时,表字段的类型会显著影响性能

2. 根据业务区分使用char/varchar

解读:a.字段长度固定,或者长度近似的业务场景,适合使用char,能够减少碎片,查询性能高

          b.字段长度相差较大,或者更新较少的业务场景,适合使用varchar,能够减少空间

3. 根据业务区分使用datetime(3)/timestamp(3)

解读:a.前者占用8个字节,后者占用4个字节,存储年使用year,存储日期使用date,存储时间使用datetime(3)

          b.如果需要根据时区显示对应时区的时间,使用timestamp

          c.datetime(3)/timestamp(3)保存到毫秒级别,程序端select now(3)

4. 必须把字段定义为not null并设默认值

解读:a.null的列使用索引,索引统计,值都更加复杂,mysql更难优化

          b.null需要更多的存储空间

          c.null只能采用is null或者is not null,不可使用=/!=/in/not in

5.     使用varchar(20)存储手机号,不要使用整数

解读:a.牵扯到国家代号,可能出现+/-/()等字符,例如+86

          b.手机号不会用来做数学运算

          c.varchar可以模糊查询,例如like ‘138%’

6.  使用tinyint来代替enum

解读:enum增加新值要进行ddl操作

五 . 索引规范

1. 非聚集索引使用idx_[字段名]来命名

2. 单张表索引数量建议控制在5个以内

解读:a.互联网高并发业务,太多索引会影响写性能

           b.生成执行计划时,如果索引太多,会降低性能,并可能导致mysql选择不到最优索引

           c.异常复杂的查询需求,可以选择其他等更为适合的方式存储

3. 尽量避免\禁止使用唯一索引

解读:只是比非聚集索引快一个cpu查找的时间,但在delete,update时都要重新排序

4. 组合索引字段数不建议超过3

解读:如果3个字段还不能极大缩小row范围,很可能是设计有问题

5. 不建议在频繁更新的字段上建立索引

6. 非必要不要进行join查询,如果要进行join查询,被join的字段必须类型相同,并建立索引

解读: join字段类型不一致,会导致全表扫描。

7. 理解组合索引最左前缀原则,避免重复建设索引,如果建立了(a,b,c),相当于建立了(a), (a,b), (a,b,c) 

六 . sql语句规范

1.  禁止使用select *,只获取必要字段

解读:a.select *会增加cpu/io/内存/带宽的消耗

           b.指定字段能有效利用索引覆盖

           c.指定字段查询,在表结构变更时,能保证对应用程序无影响

2.  insert必须指定字段,禁止使用insert into t values()

解读:指定字段插入,在表结构变更时,能保证对应用程序无影响

3.  隐式类型转换会使索引失效,导致全表扫描

解读:一定要确保声明的类型和索引字段类型一致

4.  禁止在where条件列使用函数或者表达式

解读:导致不能命中索引,全表扫描

5. 禁止%开头的模糊查询

解读:导致不能命中索引,全表扫描

6.  尽可能不使用大表join和子查询

解读:会占用大量的内存、io、cpu,如果使用到要先缩小结果集在做join(超过1000万的表都应该考虑缩小结果集在做join)

7.  区分inner\left\right\full join,合理使用,join尽量不超过3个表

解读:mysql查询优化器很烂,可在测试环境构造不同的写法,查看对应的执行计划,得出最佳的方案,可使用测试环境最佳实践

8. 同一个字段上的or必须改写为inin的值必须少于50

9. 应用程序必须捕获sql异常

解读:方便定位线上问题