Java-两个较大的List快速取交集、差集

article/2025/10/25 16:04:08

工作中经常遇到需要取两个集合之间的交集、差集情况，但是普通的retainAll()和removeAll()无法满足数据量大的情况，由此就自己尝试运用其他的方法解决。注：如果数据量小的情况下，还是使用retainAll()和removeAll()方便

1.假使不存在重复数据，如果存在重复数据，也会被覆盖掉，实际情况中，重复数据也无意义。
2.取交集或者差集时存在主数据和从数据的关系，可提前判断一下那个集合数据量更多，来决定主从数据，或者经过两轮比较，或者经过两轮比较，获取两个结果集。下面例举中，list1为主数据，list2为从数据。

取交集

public static void main(String[] args) {//模拟数据List<Integer> list1 = new ArrayList<>();List<Integer> list2 = new ArrayList<>();for (int i = 1; i <= 1000000; i++) {list1.add(i);list2.add(1000000 - i);}//记录开始时间long startTime = System.currentTimeMillis();//最后结果集List<Integer> resultList = new ArrayList<>();//中间存储Map<String, Integer> map = new HashMap<>();list2.forEach(i2 -> {map.put(i2 + "", i2);});list1.forEach(i1 -> {Integer m = map.get(i1 + "");//如果不为空，则证明list1和list2都拥有该数据if (m != null) {resultList.add(i1);}});System.out.println("耗时：" + (System.currentTimeMillis() - startTime) + "ms");System.out.println(resultList.size());}

运行结果
在这里插入图片描述

取差集

 public static void main(String[] args) {//模拟数据List<Integer> list1 = new ArrayList<>();List<Integer> list2 = new ArrayList<>();for (int i = 1; i <= 1000000; i++) {list1.add(i);list2.add(1500000 - i);}//记录开始时间long startTime = System.currentTimeMillis();//最后结果集List<Integer> resultList = new ArrayList<>();//中间存储Map<String, Integer> map = new HashMap<>();list2.forEach(i2 -> {map.put(i2 + "", i2);});list1.forEach(i1 -> {Integer m = map.get(i1 + "");//如果为空，则证明list2中无该数据if (m == null) {resultList.add(i1);}});System.out.println("耗时：" + (System.currentTimeMillis() - startTime) + "ms");System.out.println(resultList.size());}