文档章节

大数据量查询优化——数据库设计、SQL语句、JAVA编码

十九亿少女的梦
 十九亿少女的梦
发布于 2017/05/25 11:26
字数 1731
阅读 4
收藏 0

数据库设计方面:

1、对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。

2、应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描。
             如: select id from t where num is null 
             可以在num上设置默认值0,确保表中num列没有null值,然后这样查询: select id from t where num=0

3、并不是所有索引对查询都有效,SQL是根据表中数据来进行查询优化的,当索引列有大量数据重复时,查询可能不会去利用索引,如一表中有字段sex,male、female几乎各一半,

     那么即使在sex上建了索引也对查询效率起不了作用。

4、索引并不是越多越好,索引固然可以提高相应的 select 的效率,但同时也降低了 insert 及 update 的效率,因为 insert 或 update 时有可能会重建索引,所以怎样建索引需要慎重

     考虑,视具体情况而定。一个表的索引数最好不要超过6个,若太多则应考虑一些不常使用到的列上建的索引是否有必要。

5、应尽可能的避免更新索引数据列,因为索引数据列的顺序就是表记录的物理存储顺序,一旦该列值改变将导致整个表记录的顺序的调整,会耗费相当大的资源。若应用系统需要频

     繁更新索引数据列,那么需要考虑是否应将该索引建为索引。

6、尽量使用数字型字段,若只含数值信息的字段尽量不要设计为字符型,这会降低查询和连接的性能,并会增加存储开销。这是因为引擎在处理查询和连接时会逐个比较字符串中每

     一个字符,而对于数字型而言只需要比较一次就够了。

7、尽可能的使用 varchar/nvarchar 代替 char/nchar ,因为首先变长字段存储空间小,可以节省存储空间,其次对于查询来说,在一个相对较小的字段内搜索效率显然要高些。

8、避免频繁创建和删除临时表,以减少系统表资源的消耗。

9、临时表并不是不可使用,适当地使用它们可以使某些例程更有效,例如,当需要重复引用大型表或常用表中的某个数据集时。但是,对于一次性事件,最好使用导出表。

10、在新建临时表时,如果一次性插入数据量很大,那么可以使用 select into 代替 create table,避免造成大量 log ,以提高速度;如果数据量不大,为了缓和系统表的资源,应先                    create table,然后insert。

11、如果使用到了临时表,在存储过程的最后务必将所有的临时表显式删除,先 truncate table ,然后 drop table ,这样可以避免系统表的较长时间锁定。

 

 

SQL语句方面:

1、应尽量避免在 where 子句中使用!=或<>操作符,否则将引擎放弃使用索引而进行全表扫描。

2、应尽量避免在 where 子句中使用 or 来连接条件,否则将导致引擎放弃使用索引而进行全表扫描
             如: select id from t where num=10 or num=20 
             可以这样查询: select id from t where num=10 union all select id from t where num=20

3、in 和 not in 也要慎用,否则会导致全表扫描。
             如: select id from t where num in(1,2,3) 
             对于连续的数值,能用 between 就不要用 in 了: select id from t where num between 1 and 3

4、下面的查询也将导致全表扫描: select id from t where name like ‘%abc%’

5、如果在 where 子句中使用参数,也会导致全表扫描。因为SQL只有在运行时才会解析局部变量,但优化程序不能将访问计划的选择推迟到运行时;它必须在编译时进行选择。

     然而,如果在编译时建立访问计划,变量的值还是未知的,因而无法作为索引选择的输入项。
             如下面语句将进行全表扫描: select id from t where num=@num 
             可以改为强制查询使用索引: select id from t with(index(索引名)) where num=@num

6、应尽量避免在 where 子句中对字段进行表达式操作,这将导致引擎放弃使用索引而进行全表扫描。
             如: select id from t where num/2=100 
             应改为: select id from t where num=100*2 

7、应尽量避免在where子句中对字段进行函数操作,这将导致引擎放弃使用索引而进行全表扫描。
             如: select id from t where substring(name,1,3)=’abc’   ——name以abc开头的id 
                     select id from t where datediff(day,createdate,’2005-11-30′)=0  ——‘2005-11-30’生成的id 
             应改为:
                     select id from t where name like ‘abc%’ 
                     select id from t where createdate>=’2005-11-30′ and createdate<’2005-12-1′ 

8、不要在 where 子句中的“=”左边进行函数、算术运算或其他表达式运算,否则系统将可能无法正确使用索引。

9、不要写一些没有意义的查询,如需要生成一个空表结构: select col1,col2 into #t from t where 1=0 这类代码不会返回任何结果集,但是会消耗系统资源的,

     应改成这样: create table #t(„)

10、很多时候用 exists 代替 in 是一个好的选择: select num from a where num in(select num from b) 

       用下面的语句替换: select num from a where exists(select 1 from b where num=a.num) 

11、任何地方都不要使用 select * from t ,用具体的字段列表代替“*”,不要返回用不到的任何字段。

12、尽量避免使用游标,因为游标的效率较差,如果游标操作的数据超过1万行,那么就应该考虑改写。

13、尽量避免向客户端返回大数据量,若数据量过大,应该考虑相应需求是否合理。

14、尽量避免大事务操作,提高系统并发能力。

 

java方面:

1、尽可能的少造对象。

2、合理摆正系统设计的位置。大量数据操作,和少量数据操作一定是分开的。大量的数据操作,肯定不是ORM框架搞定的。

3、使用jDBC链接数据库操作数据。

4、控制好内存,让数据流起来,而不是全部读到内存再处理,而是边读取边处理。

5、合理利用内存,有的数据要缓存

 

     文章转载地址:http://www.cnblogs.com/zhoubang521/p/5200169.html

© 著作权归作者所有

共有 人打赏支持
十九亿少女的梦
粉丝 3
博文 32
码字总数 31625
作品 0
杭州
程序员
私信 提问
在 Hibernate 中直接操作 JDBC 接口

简介: Hibernate 在处理多表关联及分组排序等复杂数据库查询操作时,其固有的 O-R 映射机制会产生大量冗余 SQL 操作,系统性能比传统的 JDBC 低很多。本文分析了 Hibernate 产生此类问题的原...

红薯
2010/04/16
751
2
Mybatis应用学习——简单使用示例

传统JDBC程序中存在的问题 1. 一个简单的JDBC程序示例: 2. 上面代码造成的问题: 频繁的创建和释放数据库连接对象,极大消耗数据库性能,解决:可以通过数据库连接池技术(c3p0、DBCP、dru...

江左煤郎
11/22
0
0
JDBC 轻量级封装的持久化工具包 - openhandx real

OpenHandX-Real是一个小巧的JDBC轻量级封装的持久化工具包,其核心的特性是查询结果集、以及增、删、改、按主键查询的封装。可以直接将查询出来的结果集封装成JavaBean,维护表数据时自动匹配...

辛巴8
04/17
0
0
大数据开发培训:0基础学习Java编程语言有哪些知识点?

Java 技术通用、高效、具有平台移植性和安全性,广泛应用于PC、数据中心、游戏控制台、科学超级计算机、移动电话和互联网等,学习Java首先要知道学习知识点有哪些。在这就用加米谷大数据培训...

加米谷大数据
07/25
0
0
理解 pureQuery:IBM 最新的 Java 数据库应用编程范例

pureQuery 项目为数据库应用开发人员提供了一套基于 GUI 且易用的方法,它能够显著提高应用程序的设计和实现阶段的生产效率。通过将关系数据自动转换为 Java 对象的实现方式,方便了用户对数...

红薯
2008/12/15
429
0

没有更多内容

加载失败,请刷新页面

加载更多

以太坊PHP离线交易开发包

EthTool开发包适用于希望采用裸交易的PHP以太坊应用开发,主要包含以下特性: 支持裸交易部署/调用合约 内置etherscan和infura支持 keystore生成与读取,兼容geth/parity 采用裸交易的一个好...

笔阁
19分钟前
0
0
SRE的含义及与 DevOps 如何关联?

虽然站点可靠性工程师(site reliability engineer SRE)角色在近几年变得流行起来,但是很多人 —— 甚至是软件行业里的 —— 还不知道 SRE 是什么或者 SRE 都干些什么。为了搞清楚这些问题...

linuxCool
20分钟前
1
0
月入3万之一个程序员的转行坎坷历程

陈年往事 “我月入3万,怎么会少少了你一个鸡蛋啊?” 这是2017年9月左右的一个新闻,一位煎饼摊大妈因和顾客争执时脱口而出这样一句话而走红。当时还上了各大新闻的头条。 互联网兴起今天,...

苏南-首席填坑官
42分钟前
2
1
OSChina 周一乱弹 —— 眼看着这颗陨石砸了下来

Osc乱弹歌单(2018)请戳(这里) 【今日歌曲】 @莱布妮子:分享Nachtblut的单曲《Antik》 《Antik》- Nachtblut 手机党少年们想听歌,请使劲儿戳(这里) @mr_chip :上海的初雪之后有点冷 ...

小小编辑
今天
394
7
Confluence 6 修改导航显示选项

选择 子页面(Child pages)来在边栏中查看当前页面的子页面。 选择 页面树(Page tree)来查看整个空间的页面树,扩展当前的页面。 你也可以选择是否完全隐藏导航显示选项或者添加你希望可见...

honeymose
今天
2
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部