文档章节

MySql 几种查询相同字段中相同数据,及删除相同字段的相同数据的方法

陈爱茹cx1992
 陈爱茹cx1992
发布于 2016/07/26 17:34
字数 1093
阅读 19
收藏 0
比如现在有一人员表  (表名:peosons)

若想将姓名、身份证号、住址这三个字段完全相同的记录查询出来

select   p1.*   from   persons   p1,persons   p2   where   p1.id<>p2.id

 and   p1.cardid   =   p2.cardid  

 and   p1.pname   =   p2.pname   

 and   p1.address   =   p2.address

可以实现上述效果.

几个删除重复记录的SQL语句

 1.用rowid方法

2.用group by方法

3.用distinct方法

 1。用rowid方法

据据oracle带的rowid属性,进行判断,是否存在重复,语句如下:
查数据:
     select * from table1 a 

     where rowid !=(select   max(rowid)  
     from table1 b 

     where a.name1=b.name1 and a.name2=b.name2......)
删数据:
    delete   from table1 a 

     where rowid !=(

          select   max(rowid)  
             from table1 b where a.name1=b.name1 and a.name2=b.name2......

     )

2.group by方法

查数据:
  select count(num), max(name) from student --列出重复的记录数,并列出他的name属性 
  group by num 
  having count(num) >1 --按num分组后找出表中num列重复,即出现次数大于一次 
删数据:
  delete from student 
  group by num 
  having count(num) >1
  这样的话就把所有重复的都删除了。

3.用distinct方法 -对于小的表比较有用

create table table_new as   select distinct *   from table1 minux 
truncate table table1;
insert into table1 select * from table_new;

查询及删除重复记录的方法大全

1、查找表中多余的重复记录,
重复记录是根据单个字段(peopleId)来判断
select * from people
where peopleId in (select  peopleId  from  people  group  by  peopleId  having  count(peopleId) > 1)

2、删除表中多余的重复记录,重复记录是根据单个字段(peopleId)来判断,
只留有rowid最小的记录
delete from people 
where peopleId  in
 (select  peopleId  from people  group  by  peopleId   having  count(peopleId) > 1)
and rowid not in 
(select min(rowid) from  people  group by peopleId  having count(peopleId )>1)

3、查找表中多余的重复记录(多个字段) 
select * from vitae a
where (a.peopleId,a.seq) in 
 (select peopleId,seq from vitae group by peopleId,seq  having count(*) > 1)

4、删除表中多余的重复记录(多个字段),只留有rowid最小的记录
delete from vitae a
where (a.peopleId,a.seq) in 
 (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)
and rowid not in 
(select min(rowid) from vitae group by peopleId,seq having count(*)>1)

5、查找表中多余的重复记录(多个字段),不包含rowid最小的记录
select * from vitae a
where (a.peopleId,a.seq) in 
 (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)
and rowid not in 
(select min(rowid) from vitae group by peopleId,seq having count(*)>1)

(二)
比方说
在A表中存在一个字段“name”,
而且不同记录之间的“name”值有可能会相同,
现在就是需要查询出在该表中的各记录之间,“name”值存在重复的项;
Select Name,Count(*) From A Group By Name Having Count(*) > 1
如果还查性别也相同大则如下:
Select Name,sex,Count(*) From A Group By Name,sex Having Count(*) > 1

(三)
方法一declare @max integer,@id integerdeclare cur_rows cursor local for select 主字段,
count(*) from 表名 group by 主字段 having count(*) >;
 1open cur_rowsfetch cur_rows into @id,
@maxwhile @@fetch_status=0beginselect @max = @max -1set rowcount @maxdelete from 表名 
where 主字段 = @idfetch cur_rows into @id,@maxendclose cur_rowsset rowcount 0

方法二"重复记录"有两个意义上的重复记录,一是完全重复的记录,
也即所有字段均重复的记录,二是部分关键字段重复的记录,比如Name字段重复,
而其他字段不一定重复或都重复可以忽略。

  1、对于第一种重复,比较容易解决,使用select distinct * from tableName 
 就可以得到无重复记录的结果集。  
如果该表需要删除重复的记录(重复记录保留1条),
可以按以下方法删除
select distinct * into #Tmp from 
tableNamedrop table tableNameselect * into tableName
 from #Tmpdrop table #Tmp
  发生这种重复的原因是表设计不周产生的,增加唯一索引列即可解决。

  2、这类重复问题通常要求保留重复记录中的第一条记录,操作方法如下
  假设有重复的字段为Name,Address,要求得到这两个字段唯一的结果集
select identity(int,1,1) as autoID, * into #Tmp 
from tableNameselect min(autoID) as autoID 
into #Tmp2 from #Tmp group by Name,autoID
select * from #Tmp where autoID in(select autoID from #tmp2)
  最后一个select即得到了Name,Address不重复的结果集
(但多了一个autoID字段,实际写时可以写在select子句中省去此列)

(四)
查询重复select * from tablename where id in (select id from tablename group by id having count(id) > 1)

本文转载自:http://blog.csdn.net/ruru7989/article/details/25332765

共有 人打赏支持
陈爱茹cx1992
粉丝 0
博文 59
码字总数 0
作品 0
济南
程序员
私信 提问
CentOS 7安装MySQL

安装mysql前提:安装好CentOS 7 64位,CentOS 7系统可以连接网络 完成之后打开终端,检查mysql是否已安装: 在终端中输入 1 如下图: 这显示已经安装了mysql,如果已安装,那么先卸载,在终端...

寰宇01
05/11
0
0
MySQL数据库(python)

安装教程原网址http://www.cnblogs.com/iscodercn/p/5488633.html 慕课网视频教程总结 show create table provinces;查看编码,引擎 整型:tingint->smallint->mediumint->int->bigint; 浮点......

sinat_23880167
2017/10/31
0
0
解决MySQL复合主键下ON DUPLICATE KEY UPDATE语句失效问题

先描述一下这个问题的起因,假设有一张表,里面保存了交易订单,每张订单有唯一的ID,有最后更新时间,还有数据,详情如下: +-------+----------+------+-----+---------------------+-----...

BoyTNT
2016/01/20
0
0
MySQL/MariaDB基础及简单SQL语句

MySQL是一种开放源代码的关系型数据库管理系统(RDBMS),使用最常用的数据库管理语言--结构化查询语言(SQL)进行数据库管理。 在Linux操作系统内核中提供了MySQL或MariaDB的rpm包,CentOS6...

sherlockR
07/25
0
0
MySQL基础命令

mysql > SHOW CHARACTER SET 查看字符集 mysql> SHOW CARIABLES LIKE ‘%char%’; 查看当前系统所用的字符集  mysql > SHOW COLLATION查看支持的排序规则: mysql > SHOW INDEXES FROM stb_......

窝心爱丨Xj
2014/04/09
0
0

没有更多内容

加载失败,请刷新页面

加载更多

剖析Elasticsearch的IndexSorting:一种查询性能优化利器

摘要: 前言 前两周写过一篇《基于Lucene查询原理分析Elasticsearch的性能》,在最后留了一个彩蛋,说下一篇会介绍一种可以极大的优化查询性能的技术。本文就来介绍这种技术——IndexSortin...

阿里云官方博客
19分钟前
0
0
Go 使用channel控制并发

前言 channel一般用于协程之间的通信,channel也可以用于并发控制。比如主协程启动N个子协程,主协程等待所有子协程退出后再继续后续流程,这种场景下channel也可轻易实现。 场景示例 总结 ...

恋恋美食
44分钟前
2
0
斐波那契堆的理解,节点mark属性和势函数

斐波那契堆 看了好多博客,都是照搬算法导论的内容,没有自己的理解,比如为什么有mark属性,势函数的作用,以及为什么叫斐波那契堆,下面说说鄙人的理解。 势函数 势函数是根节点个数加上2...

杨喆
49分钟前
6
0
NIO源码详解

阻塞io和无阻塞io: 阻塞io是指jdk1.4之前版本面向流的io,服务端需要对每个请求建立一堆线程等待请求,而客户端发送请求后,先咨询服务端是否有线程相应,如果没有则会一直等待或者遭到拒 ...

沉稳2018
54分钟前
1
0
如何把已经提交的commit, 从一个分支放到另一个分支

在本地master提交了一个commit(8d85d4bca680a5dbcc3e5cfb3096d18cd510cc9f),如何提交的test_2分之上? git checkout test_2git cherry-pick 8d85d4bca680a5dbcc3e5cfb3096d18cd510cc9f......

stephen_wu
57分钟前
2
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部