文档章节

Java集合框架总结(2)——Set接口的使用

期待变强的菜鸟
 期待变强的菜鸟
发布于 2015/03/17 14:47
字数 2195
阅读 155
收藏 2

1、Set接口的使用

    Set集合里多个对象之间没有明显的顺序。具体详细方法请参考API文档(可见身边随时带上API文档有多重要),基本与Collection方法相同。只是行为不同(Set不允许包含重复元素)。

      Set集合不允许重复元素,是因为Set判断两个对象相同不是使用==运算符,而是根据equals方法。即两个对象用equals方法比较返回true,Set就不能接受两个对象。

public class TestSet
{	public static void main(String[] args) 
	{
		Set<String> books = new HashSet<String>();		
		//添加一个字符串对象
		books.add(new String("Struts2权威指南"));		
		//再次添加一个字符串对象,
		//因为两个字符串对象通过equals方法比较相等,所以添加失败,返回false
		boolean result = books.add(new String("Struts2权威指南"));
		
		System.out.println(result);		
		//下面输出看到集合只有一个元素
		System.out.println(books);	
	}
}
 
      程序运行结果:
false 
[Struts2权威指南]

说明:程序中,book集合两次添加的字符串对象明显不是一个对象(程序通过new关键字来创建字符串对象),当使用==运算符判断返回false,使用equals方法比较返回true,所以不能添加到Set集合中,最后只能输出一个元素。

        Set接口中的知识,同时也适用于HashSetTreeSetEnumSet三个实现类。

2、HashSet类

          HashSet按Hash算法来存储集合的元素,因此具有很好的存取和查找性能。

          HashSet的特点:

(1)HashSet不是同步的,多个线程访问是需要通过代码保证同步 

(2)集合元素值可以使null。

       HashSet集合判断两个元素相等的标准是两个对象通过equals方法比较相等,并且两个对象的hashCode()方法返回值也相等

//类A的equals方法总是返回true,但没有重写其hashCode()方法
class A
{
    public boolean equals(Object obj)
    {
        return true;
    }
}
//类B的hashCode()方法总是返回1,但没有重写其equals()方法
class B
{
    public int hashCode()
    {
        return 1;
    }
}
//类C的hashCode()方法总是返回2,并重写其equals()方法
class C
{
    public int hashCode()
    {
        return 2;
    }
    public boolean equals(Object obj)
    {
        return true;
    }
}
public class TestHashSet
{
    public static void main(String[] args) 
    {
        HashSet<Object> books = new HashSet<Object>();
        //分别向books集合中添加2个A对象,2个B对象,2个C对象
        books.add(new A());
        books.add(new A());
        books.add(new B());
        books.add(new B());
        books.add(new C());
        books.add(new C());
        System.out.println(books);
    }
}
 

程序运行结果:
[B@1, B@1, C@2, A@b5dac4, A@9945ce]

说明:

(1)Object类提供的toString方法总是返回该对象实现类的类名+@+hashCode(16进制数)值,所以可以看到上面程序输出的结果。可以通过重写toString方法来输出自己希望的形式。

(2)即使2个A对象通过equals比较返回true,但HashSet依然把它们当成2个对象;即使2个B对象的hashCode()返回相同值,但HashSet依然把它们当成2个对象。即如果把一个对象放入HashSet中时,如果重写该对象equals()方法,也应该重写其hashCode()方法。其规则是:如果2个对象通过equals方法比较返回true时,这两个对象的hashCode也应该相同。

hash算法的功能

它能保证通过一个对象快速查找到另一个对象。hash算法的价值在于速度,它可以保证查询得到快速执行。

当需要查询集合中某个元素时,hash算法可以直接根据该元素的值得到该元素保存位置,从而可以让程序快速找到该元素。

当从HashSet中访问元素时,HashSet先计算该元素的hashCode值(也就是调用该对象的hashCode())方法的返回值),然后直接到该hashCode对应的位置去取出该元素。

即也是快速的原因。HashSet中每个能存储元素的“曹位(slot)”通常称为“桶(bucket)”,如果多个元素的hashCode相同,但它们通过equals()方法比较返回false,就需要一个“桶”里放多个元素,从而导致性能下降。

继续深入研究HashSet:

          当向HashSet中添加一个可变对象后,并且后面程序修改了该可变对象的属性,可能导致它与集合中其他元素相同,这就可能导致HashSet中包含两个相同的对象。

看下面程序:

class R
{	int count;	public R(int count)
	{		this.count = count;
	}	public String toString()
	{		return "R(count属性:" + count + ")";
	}	public boolean equals(Object obj)
	{		if (obj instanceof R)
		{
			R r = (R)obj;			if (r.count == this.count)
			{				return true;
			}
		}		return false;
	}	public int hashCode()
	{		return this.count;
	}
}public class TestHashSet2
{	public static void main(String[] args) 
	{
		HashSet<R> hs = new HashSet<R>();
		hs.add(new R(5));
		hs.add(new R(-3));
		hs.add(new R(9));
		hs.add(new R(-2));		//打印HashSet集合,集合元素是有序排列的
		System.out.println(hs);		//取出第一个元素
		Iterator<R> it = hs.iterator();
		R first = (R)it.next();     //first指向集合的第一个元素		//为第一个元素的count属性赋值
		first.count = -3;           //first指向的元素值发生改变,地址并没有改变,大家可以试着用Java内存分配机制(栈和堆)思考下。		//再次输出count将看到HashSet里的元素处于无序状态
		System.out.println(hs);
		hs.remove(new R(-3));
		System.out.println(hs);		//输出false
		System.out.println("hs是否包含count为-3的R对象?" + hs.contains(new R(-3)));		//输出false
		System.out.println("hs是否包含count为5的R对象?" + hs.contains(new R(5)));

	}
}
 
程序运行结果:
[R(count属性:5), R(count属性:9), R(count属性:-3), R(count属性:-2)] 
[R(count属性:-3), R(count属性:9), R(count属性:-3), R(count属性:-2)] 
[R(count属性:-3), R(count属性:9), R(count属性:-2)] 
hs是否包含count为-3的R对象?false 
hs是否包含count为5的R对象?false

说明:程序重写了R类的equals()和hashCode()方法,这两个方法都是根据R对象的count属性来判断。从运行结果可以看出,HashSet集合中有完全相同元素,这表明两个元素已经重复,但因为HashSet在添加它们时已经把它们添加到了不同地方,所以HashSet完全可以容纳两个相同元素。至于第一个count为-3的R对象,它保存在count为5的R对象对应的位置(地址)。当向HashSet中添加可变对象时,必须十分小心。如果修改HashSet集合中的对象,有可能导致该对象与集合中其他对象相等,从而导致HashSet无法准确访问该对象。

 

       HashSet还有一个子类LinkedHashSet,LinkedHashSet集合也根据元素hashCode值来决定元素存储位置,但它同时使用链表维护元素的次序,即当遍历LinkedHashSet集合元素时,HashSet将会按元素的添加顺序来访问集合里的元素。

 

3、TreeSet类

       TreeSet是SortedSet接口的唯一实现,TreeSet可以确保集合元素处于排序状态(元素是有序的)。

       TreeSet提供的几个额外方法:

Comparator comparator(): 返回当前Set使用的Comparator,或者返回null,表示以自然方式排序。

Object first():返回集合中的第一个元素。

Object last():返回集合中的最后一个元素。

Objiect lower(Object e):返回集合中位于指定元素之前的元素(即小于指定元素的最大元素,参考元素可以不是TreeSet的元素)。

Object higher(Object e):返回集合中位于指定元素之后的元素(即大于指定元素的最小元素,参考元素可以不需要TreeSet的元素)。

SortedSet subSet(fromElement, toElement):返回此Set的子集,范围从fromElement(包含大于等于)到toElement(不包含小于)。

SortedSet headSet(toElement):返回此Set的子集,由小于toElement的元素组成。

SortedSet tailSet(fromElement):返回此Set的子集,由大于或等于fromElement的元素组成。

 

public class TestTreeSetCommon
{	public static void main(String[] args) 
	{
		TreeSet<Integer> nums = new TreeSet<Integer>();		//向TreeSet中添加四个Integer对象
		nums.add(5);
		nums.add(2);
		nums.add(10);
		nums.add(-9);		//输出集合元素,看到集合元素已经处于排序状态
		System.out.println(nums);		//输出集合里的第一个元素
		System.out.println(nums.first());		//输出集合里的最后一个元素
		System.out.println(nums.last());		//返回小于4的子集,不包含4
		System.out.println(nums.headSet(4));		//返回大于5的子集,如果Set中包含5,子集中还包含5
		System.out.println(nums.tailSet(5));		//返回大于等于-3,小于4的子集。
		System.out.println(nums.subSet(-3 , 4));
	}
}

程序运行结果:
[-9, 2, 5, 10] 
-9 
10 
[-9, 2] 
[5, 10] 
[2]
说明:由运行结果可以看出,TreeSet并不是根据元素的插入顺序进行排序,而是根据元素实际值来进行排序。TreeSet采用红黑树的数据结构对元素进行排序,具体排序内容会在后续文章中说明


© 著作权归作者所有

期待变强的菜鸟
粉丝 19
博文 57
码字总数 75590
作品 0
郑州
程序员
私信 提问
JAVA基础再回首(三十)——JAVA基础再回首完美结束,感概万千!

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/m366917/article/details/52724939 JAVA基础再回首(三十)——JAVA基础再回首完美结束,感概万千! 经过了几...

Aduroidpc
2016/10/02
0
0
[Java 并发编程] 集合框架之 同步容器类 & 并发容器类

吾生也有涯,而知也无涯。———《庄子》 通过上一篇文章,我们已经知道设计一个线程安全类的原则和步骤,以及在设计过程中我们应当注意的细节。实际上,Java 的集合库包含了线程安全集合和非...

seaicelin
2018/05/25
0
0
你必须掌握的 21 个 Java 核心技术!(干货)

点击上方“java进阶架构师”,选择右上角“置顶公众号” 20大进阶架构专题每日送达 51闲来无事,师长一向不(没)喜(有)欢(钱)凑热闹,倒不如趁着这时候复盘复盘。而写这篇文章的目的是想...

Java进阶架构师
05/03
0
0
Java集合框架(一)——集合概述

本文概述 本篇文章将分三块内容对Java中的集合框架进行介绍: 一. 集合框架相关概念 二. 集合体系通用方法 三. 集合遍历—Iteractor 一. 集合框架相关概念 集合:用于存储多个对象的容器 1....

Mr_Yanger
2017/11/11
0
0
JAVA 私塾第八、九章笔记整理

JAVA 私塾第八、九章笔记整理 第八章 异常和断言 一. 异常的分类 java.lang.Throwable类充当所有对象的父类,可以使用异常处理机制将这些对象超出并捕获。有Error和Exception两个基本子类。...

luodis
2011/02/15
161
1

没有更多内容

加载失败,请刷新页面

加载更多

RxJava进行单元测试的方式

@Test public void completeTask_retrievedTaskIsComplete() { // Given a new task in the persistent repository final Task newTask = new Task(TITLE, ""); ......

SuShine
43分钟前
5
0
正则表达式大全

检验手机号码 # 要求:手机号码必须为11位数字,以1开头,第二位为1或5或8。import redef verify_mobile(): mob = input("请输入手机号码:") ret = re.match(r"1[358]\d{9}", m......

彩色泡泡糖
47分钟前
7
0
QT之border-image属性

一、border-image的兼容性 border-image可以说是CSS3中的一员大将,将来一定会大放光彩,其应用潜力真的是非常的惊人。可惜目前支持的浏览器有限,仅Firefox3.5,chrome浏览器,Safari3+支持...

shzwork
48分钟前
6
0
Kubernetes Operator简易教程

1. 安装operator-sdk //安装 operator-sdk$ apt-get install operator-sdk.....$ operator-sdk versionoperator-sdk version: v0.7.0$ go versiongo version go1.11.4 darwin/amd64 2......

Robotcl_Blog
48分钟前
5
0
再谈DAG任务分解和Shuffle RDD

1、DagScheduler分析 DagScheduler功能主要是负责RDD的各个stage的分解和任务提交。Stage分解是从触发任务调度过程的finalStage开始倒推寻找父stage,如果父stage没有提交任务则循环提交缺失...

守望者之父
54分钟前
4
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部