文档章节

MySql 性能优化备忘

夏至如沫
 夏至如沫
发布于 2017/07/27 14:54
字数 1193
阅读 20
收藏 0

有一个数据采集的项目,最初因为功能简单并且终端和服务部将署在一台终端机上,便选用了体积小、安装 简单的MySQL数据库。前期一切顺利,但是现场部署时发现产生的数据量,远比预想的多得多,一个细粒度的子表每天产生将近1万条数据,把所有的业务数据算进去,一个月下来就是一百万的数据量。回头测试一下细粒度的查询视图,果然懵逼了。每次都是超时,连COUNT操作都不能快速返回了。因为之前大多用的都是Oracle 和 SQLServer,也简单做过百万级的优化,就是查询索引和过滤条件的调整,但是这里这些调整在MySQL里的分页查询不起作用了,可能跟 Limit 关键字的机制相关吧。

百万级查询

  • 使用场景,分页视图 分页视图中使用了三个主要的业务表,A 为基础数据表,关联一些ID和名称,B为主业务数据表,是每一次任务的记录,C为详细的业务数据表,是一次任务中包含的全部操作内容,大概每次任务有200行上下。查询条件有在 A 表的 Col1,B表的Col2,C表的Col3、Col4、Col5、Col6,其中Col5、Col6 经常为并且条件。

最初的索引比较简单,只有一个GUID类型(实际存储的是varchar(36))的主键聚集索引和一个时间字段的非聚集索引。当现场采集一周的数据拷贝回来时,大概30万,每次的分页查询已经超过半分钟了。最初的做法是调整索引,按照查询条件中的命中关系和主次关系建立和多个索引,可是发现几乎没有任何效果。然后只能问百度了,最后在很多优化文章中看到,Limit m,n 步长越大,耗时越长并且Select 的字段和索引关系很大,索引中加入该字段会对查询提升很多。最终的方案采用 先使用Limit m,n 取出命中行主键,然后使用关联查询(或者IN的方式)获取全部所需要的字段。最终的结果可能类似于这个样子:

SELECT 
    S.GUID,
    S.HisGUID,
    S.RefGUID,
    A.AddressId,
    A.AddressName
FROM
    T_SNAPDIAGINFO S,
    T_ADDRESS A,
    ( SELECT S.GUID FROM T_SNAPDIAGINFO S 
    WHERE S.SnapTime BETWEEN str_to_date('2017-07-23 00:00:00', '%Y-%m-%d %H:%i:%s') AND str_to_date('2017-07-26 17:25:00', '%Y-%m-%d %H:%i:%s') 
    ORDER BY S.SnapTime DESC  LIMIT 0,10) PT 
    WHERE  A.AddressId = S.AddressId AND S.GUID = PT.GUID

这里还有两个细节的

  • 索引优化

    在基于时间的排序时,如果顺序是已知,比如软件的信息列表优先显示最新的数据记录,这时候在建立索引时,可以将这个时间字段分配为逆序(DESC)。这个操作在默认查询时也有不小的性能提升。

  • 查询优化

    在_LIMIT_字句中应当是单表查询,并且最好只返回主键字段

这里还有一个问题,如果查询字段比较多的话,在建立索引时是它们全部建立在一个索引上,还是按照依赖关系分组建立呢?(不考虑插入效率的印象)

批量数据插入

从现场采集回来的日志中,发现每次任务数据保存的时间有2-5秒,虽说好像对于200行的数据来说,也不是什么大问题,但是总觉得还有提升的空间。o(╯□╰)o真实原因是现场日志中经常还有IO占用的异常,搞得我数据库保存都不自信了。 批量插入的方法比较简单,采用MySQL特有批量插入的语法格式。

INSERT INTO TABLE 
(A, B, C, D) 
VALUES
( a,b,c,d),
(a,bc,d),
...

我这里单表的插入每次最多有60行左右的样子,所以就直接全部拼接在一个SQL中了。如果同时插入上千条甚至上万条的话,需要分批提交,最终的代码可能如下:

        /// <summary>
        /// 执行多条SQL语句,实现数据库事务。
        /// </summary>sql2000数据库
        /// <param name="SQLStringList">多条SQL语句</param>
        public static void ExecuteSqlTran(List<string> SQLStringList)
        {
            using (MySqlConnection conn = new MySqlConnection(MySqlHelper.ConnStr))
            {
                conn.Open();
                MySqlCommand cmd = new MySqlCommand();
                cmd.Connection = conn;
                MySqlTransaction tx = conn.BeginTransaction();
                cmd.Transaction = tx;
                try
                {
                    for (int n = 0; n < SQLStringList.Count; n++)
                    {
                        string strsql = SQLStringList[n].ToString();
                        if (strsql.Trim().Length > 1)
                        {
                            cmd.CommandText = strsql;
                            cmd.ExecuteNonQuery();
                        }
                        if (n > 0 && (n % 500 == 0 || n == SQLStringList.Count - 1))
                        {
                            tx.Commit();
                            tx = conn.BeginTransaction();
                        }
                    }
                    //tx.Commit();
                }
                catch (System.Data.SqlClient.SqlException E)
                {
                    tx.Rollback();
                    throw new Exception(E.Message);
                }
            }
        }

查考文章

Mysql批量插入

博客园 -- MySql百万级数据优化查询

© 著作权归作者所有

共有 人打赏支持
下一篇: EASYUI
夏至如沫

夏至如沫

粉丝 11
博文 40
码字总数 24208
作品 0
郑州
后端工程师
私信 提问
如何构建基于成本的 SQL 优化器?

在 Cockroach 实验室,我们一直在持续关注性能的提升和可扩展性。为了实现这个目标,我们发布的 2.1 版本产品中包含了一个全新的、从零起步的、基于成本的 SQL 优化器。这个优化器因提供了一...

ismdeep
11/20
0
0
Ajax & PHP 边学边练 之三 数据库

在上一篇备忘日历实例中,实现了当鼠标放在某个日期上时,如果当天有备忘信息则会显示出来,但是这些信息是为了测试方便事先写在数组中的数据,不能体现其实时性。本篇将继续通过该实例讲解与...

junwong
2012/03/09
345
0
后台开发常问面试题集锦(问题搬运工,附链接)

Java基础问题 String的’+’的性能及原理 java之yield(),sleep(),wait()区别详解-备忘笔记 深入理解Java Stream流水线 抽象 & abstract关键字 Java final 修饰符知识点总结(必看篇) Java中的...

大黄有故事
2017/11/18
0
0
查看linux默认能最多开启多少个文件数量

ulimit –a ulimit –n #vi /erc/security/limits.conf (修改文件开启的限制) # #<domain> <type> <item> <value> # #* soft core 0 #* hard rss 10000 #@student hard nproc 20 #@faculty ......

eui988
2014/05/16
0
0
CentOS 命令【备忘】

1、查看物理cpu个数 grep 'physical id' /proc/cpuinfo | sort -u | wc -l 2、查看核心数量 grep 'core id' /proc/cpuinfo | sort -u | wc -l 3、查看目录大小 du -hs /usr/local/openresty ......

缤纷世界wb
2014/11/14
0
0

没有更多内容

加载失败,请刷新页面

加载更多

解析JQuery中each方法的使用

each() 方法规定为每个匹配元素规定运行的函数。写的十分的全面细致,具有一定的参考价值,对此有需要的朋友可以参考学习下。如有不足之处,欢迎批评指正。 概述: each() 方法规定为每个匹配...

前端攻城小牛
14分钟前
3
0
深入解析Vue开发动态刷新Echarts组件的教程

需求背景:dashboard作为目前企业中后台产品的“门面”,如何更加实时、高效、炫酷的对统计数据进行展示,是值得前端开发工程师和UI设计师共同思考的一个问题。今天就从0开始,封装一个动态渲...

peakedness丶
27分钟前
3
0
memcached

memcached 为了避免内存碎片化(传统的内存管理方式是,使用完通过malloc分配的内存后通过free来回收内存,这种方式容易产生内存碎片并降低操作系统对内存的管理效率),采用了 slab allocatio...

Cobbage
28分钟前
3
0
keepalived的介绍及配置高可用集群

12月19日任务 18.1 集群介绍 18.2 keepalived介绍 18.3/18.4/18.5 用keepalived配置高可用集群 集群介绍 根据功能划分为2类:高可用和负载均衡 高可用集群:通常为两台服务器,一台工作,另外...

robertt15
29分钟前
5
0
WiFi攻击的三种方式

导读 WiFi的安全问题已经引起了不少的使用者重视,甚至已经出现草木皆兵的现象。那么黑客到底是如何做到绕过身份验证来获取WiFi使用权的呢?主要有以下三种方式,其中最后一种方式十分简单。 ...

问题终结者
43分钟前
6
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部