java list集合数据去重方式

article/2025/9/22 8:55:08

1.概述

最近又是一轮代码review , 发现了一些实现去重的代码,在使用 list.contain …

在这里插入图片描述

我沉思,是不是其实很多初学者也存在这种去重使用问题?

所以我选择把这个事情整出来,分享一下。

2.contain 去重

首先是造出一个 List 模拟数据,一共2W条,里面有一半数据1W条是重复的:

public static List<String> getTestList() {List<String> list = new ArrayList<>();for (int i = 1; i <= 10000; i++) {list.add(String.valueOf(i));}for (int i = 10000; i >= 1; i--) {list.add(String.valueOf(i));}return list;
}

先看看我们用 contain 去重的代码:

/*** 使用 list.contain 去重** @param testList*/
private static void useContain2Distinct(List<String> testList) {System.out.println("contains 开始去重,条数:" + testList.size());List<String> testListDistinctResult = new ArrayList<>();for (String str : testList) {if (!testListDistinctResult.contains(str)) {testListDistinctResult.add(str);}}System.out.println("contains 去重完毕,条数:" + testListDistinctResult.size());
}

我们调用一下看看耗时:

public static void main(String[] args) {List<String> testList = getTestList();StopWatch stopWatch = new StopWatch();stopWatch.start();useContainDistinct(testList);stopWatch.stop();System.out.println("去重 最终耗时" + stopWatch.getTotalTimeMillis());
}

耗时:
在这里插入图片描述
评价:list.contain 的效率,我的建议是,知道就行,别用。

3.HashSet 去重

众所周知 Set 不存在重复数据, 所以我们来看看使用 HashSet 去重的性能:

ps:这里是采取使用 set 的 add 方法做去重

/*** 使用set去重** @param testList*/
private static void useSetDistinct(List<String> testList) {System.out.println("HashSet.add 开始去重,条数:" + testList.size());List<String> testListDistinctResult = new ArrayList<>(new HashSet(testList));System.out.println("HashSet.add 去重完毕,条数:" + testListDistinctResult.size());
}

我们调用一下看看耗时:

public static void main(String[] args) {List<String> testList = getTestList();StopWatch stopWatch = new StopWatch();stopWatch.start();useSetDistinct(testList);stopWatch.stop();System.out.println("去重 最终耗时" + stopWatch.getTotalTimeMillis());
}

耗时:
在这里插入图片描述
评价:HashSet 的效率,我的建议是推荐。

我们创建了一个高质量的技术交流群,与优秀的人在一起,自己也会优秀起来,赶紧点击加群,享受一起成长的快乐。

4.list.contains

为什么耗时差距这么大?

不多说,我们看源码:
list.contains(o):
在这里插入图片描述可以看到里面用到了 index(o) :

时间复杂度 :O(n) n: 元素个数

那么我们看看 set.add(o) 是怎么样的
在这里插入图片描述
map的add , 老生常谈就不谈了,hash完 直接塞到某个位置, 时间复杂度 :O(1) 。

所以 O(n) 和 O(1) 谁快谁慢?显然。
在这里插入图片描述ps:顺嘴说下 hashset 的 contain

时间复杂度也是:O(1)
在这里插入图片描述

5.传统去重

那么我们最后再看看别的去重:

双for循环 ,remove去重

/*** 使用双for循环去重* @param testList*/
private static void use2ForDistinct(List<String> testList) {System.out.println("list 双循环 开始去重,条数:" + testList.size());for (int i = 0; i < testList.size(); i++) {for (int j = i + 1; j < testList.size(); j++) {if (testList.get(i).equals(testList.get(j))) {testList.remove(j);}}}System.out.println("list 双循环  去重完毕,条数:" + testList.size());
}
public static void main(String[] args) {List<String> testList = getTestList();StopWatch stopWatch = new StopWatch();stopWatch.start();use2ForDistinct(testList);stopWatch.stop();System.out.println("去重 最终耗时" + stopWatch.getTotalTimeMillis());
}

耗时:
在这里插入图片描述
评价:知道就行,图个乐,别用,贼慢,而且代码看起来乱

stream的distinct去重:

/*** 使用Stream 去重** @param testList*/
private static void useStreamDistinct(List<String> testList) {System.out.println("stream 开始去重,条数:" + testList.size());List<String> testListDistinctResult = testList.stream().distinct().collect(Collectors.toList());System.out.println("stream 去重完毕,条数:" + testListDistinctResult.size());
}
public static void main(String[] args) {List<String> testList = getTestList();StopWatch stopWatch = new StopWatch();stopWatch.start();useStreamDistinct(testList);stopWatch.stop();System.out.println("去重 最终耗时" + stopWatch.getTotalTimeMillis());
}

耗时:
在这里插入图片描述
评价:还不错,主要是代码也蛮简洁,有一点点动心。

最后,如果你还有其他高效去重方法的话,欢迎留言区分享一下呗~


http://chatgpt.dhexx.cn/article/5c4NomlA.shtml

相关文章

Java【List】去重的 6种方法

list集合去重 一、HashSet去重二、TreeSet去重三、LinkedHashSet去重四、迭代器去重五、Stream去重六、contains判断去重等等... 其它实现方法 一、HashSet去重 我们知道 HashSet 天生具备“去重”的特性&#xff0c;那我们只需要将 List 集合转换成 HashSet 集合就可以了&…

List 去重的 6 种方法,这种方法最完美!

在日常的业务开发中&#xff0c;偶尔会遇到需要将 List 集合中的重复数据去除掉的场景。这个时候可能有同学会问&#xff1a;为什么不直接使用 Set 或者 LinkedHashSet 呢&#xff1f;这样不就没有重复数据的问题了嘛&#xff1f; ​ 不得不说&#xff0c;能提这个问题的同学很…

List去除重复数据的五种方式

你知道的越多&#xff0c;不知道的就越多&#xff0c;业余的像一棵小草&#xff01; 你来&#xff0c;我们一起精进&#xff01;你不来&#xff0c;我和你的竞争对手一起精进&#xff01; 编辑&#xff1a;业余草 blog.csdn.net/qq_37939251/article/details/90713643 推荐&…

List元素去重的六种方式

上周的时候完成公司交付的任务&#xff0c;突然间遇到了需要把重复元素去掉的功能&#xff0c;当时我的大脑飞速运转&#xff0c;努力回想以前学习关于list的知识&#xff0c;后来&#xff0c;我发现已经忘得差不多了&#xff0c;所以我就找到了这篇文章&#xff0c;说的很详细…

子图是什么

子图和真子图 设 G <V, E>, <, >是两个图(同为无向,或同为有向图). 若 V 且 E, 则称 为 G 的子图, G 为 的母图, 记作 G 若 V 或 E, 称 为 G 的真子图. 生成子图 若 G 且 V , 则称 为 G 的生成子图 两个导出子图 设 V 且 &#xff08;空集&a…

latex绘制子图,并为子图添加

如下代码所示&#xff1a; 通过\subfigure绘制子图&#xff0c;\centering使图片居中&#xff0c;可以直接在子图中为为图片添加标注&#xff0c;如代码中的{\scriptsize{误差均值}}&#xff0c;该命令表示在子图上面添加标注。有时需要同时在子图的左边也添加竖排标注&#xf…

Python Matplotlib 子图

目录 1、绘制多个子图 2、绘图在指定的子图上 3、subplots命令&#xff1a;快速生成多个子图框架 3.1 快速布局 3.2 画一个图形 3.3 多个图形共用一个轴 3.4 与seaborn联合使用 3.5 使用数组方式指定子图 3.6 嵌套图 在matplotlib中&#xff0c;所有的绘图操作实际上都是以…

Matplotlib多子图绘图后保存单个子图

import numpy as np import matplotlib.pyplot as plt# 用于单独保存子图的函数 def save_subfig(fig,ax,save_path,fig_name):bbox ax.get_tightbbox(fig.canvas.get_renderer()).expanded(1.02, 1.02)extent bbox.transformed(fig.dpi_scale_trans.inverted())fig.savefig(…

Matplotlib子图

子图 **有时候我们需要从多个角度进行数据的比较、分析&#xff0c;因此就需要用到子图。**子图的本质是在一个较大的图形中同时放置一组较小的坐标轴&#xff0c;布局形式可以多种多样&#xff0c;不拘泥于我们在第五集中举的那种网格图的形式。 一般化的子图 我们先进行一…

latex生成子图及并列图

latex生成子图及并列图 \usepackage{graphicx}%插入图片 \usepackage{subfigure} %子图 子图 代码 \begin{figure} \centering \subfigure[Average total cost with different schemes.]{ \includegraphics[width3in]{V9-1-vary-S} } \subfigure[Average time delay with …

【数据分析之道-Matplotlib(三)】Matplotlib 绘制子图

文章目录 专栏导读1、前言2、subplot()函数2.1创建一个包含 2x2 的子图布局&#xff0c;并在每个子图中绘制不同的图形2.2创建一个包含 1x3 的子图布局&#xff0c;并绘制三种不同类型的图形2.3创建一个包含 2 行 1 列的子图布局&#xff0c;绘制散点图和柱状图 3、subplots()函…

matplotlib 基础_子图创建

目录 创建Axes方法1 、 add_subplot 函数&#xff1a;快速创建1.1 设置不等尺寸的子图 2、add_axes 函数&#xff1a;自由设置子图的位置、大小3、指定子图空间&#xff1a;当子图大小成倍数时 一张图理解matplotlib Figure 和 Axes Figure 就是图片&#xff0c;一个完整的图片…

plt.plot画子图时,子图变形,调整子图大小

在画图时候遇到的记录一下 希望可以帮到遇到相同问题的伙伴儿~~ 本来是这样&#xff1a; 本来代码&#xff1a; plt.subplot(1, 2, 1)plt.rcParams[font.sans-serif] [SimHei]plt.rcParams[axes.unicode_minus] Falseplt.rcParams[figure.dpi] 1080plt.rcParams[figure.fi…

关于图论中导出子图的概念

关于图论中导出子图的概念 1、导出子图 A subgraph H is called an induced subgraph of X if for any a , b ∈ E ( H ) a,b \in E(H) a,b∈E(H) if and only if a , b ∈ E ( X ) a,b \in E(X) a,b∈E(X). 2、点导出子图 设S是V(G)的子集&#xff0c;以S为点集&#xf…

极大连通子图与极小连通子图

无向图 连通图&#xff1a; 在无向图中&#xff0c;若从定点V1到V2有路径&#xff0c;则称顶点V1和V2是连通的。如果图中任意一对顶点都是连通的&#xff0c;则称此图是连通图。&#xff08;连通的无向图&#xff09;极大连通子图&#xff1a; 1.连通图只有一个极大连通子图&a…

python数据可视化玩转Matplotlib subplot子图操作,四个子图(一包四),三个子图,子图拉伸

目录 一、创建子图 1.1 下图是绘制的子图&#xff1a; 1.2 代码释义&#xff1a; 二、绘制子图 2.1 代码引入 2.2 图形绘制 三、子图布局 3.1 子图布局说明 四、子图大小 4.1 子图大小调整 五、子图间距 5.1 子图代码调整 六、子图位置 6.1 代码引入 6.2 完整代码…

极大连通子图与极小连通子图(带图讲解)

因为本人对于这一块知识存在疑惑&#xff0c;在学习了相关知识后将自己的理解分享给大家&#xff0c;如有错误&#xff0c;欢迎纠正。 首先我们先明确一下&#xff0c;极小连通子图与极大连通子图是在无向图中进行讨论的。 极大强连通子图是在有向图中进行讨论的&#xff0c;不…

Python 调整子图大小、位置【plt.axes()自定义子图】

效果图&#xff1a; plt.axes()绘图结果 上图一共三个子图&#xff0c;两个横向子图对齐右侧纵向长图。 本来想用plt.subplot()函数画&#xff0c;结果找了半天都是下图这种结果&#xff1a; 只能合并列&#xff0c;不能合并行 plt.subplot()绘图结果 因此&#xff0c;我放…

子图的概念

设G(V,E)为一个图,H(V’,E’)也是一个 图,称H为G的一个子图(subgraph),如果 ,并且对任意的边euv∈E’必须有u,v∈V’,记为 , 此时也称G为H的母图(super graph). 设H(V’,E’)为G(V,E)的一个子图,称H为G的生成(支撑)子图(spanning subgraph),如果V’V. 设G(V,E)是一个图,,构造一…

最大完全子图和极大连通子图

最近学习图论的一串小结之一 完全图&完全子图&最大完全子图 完全图&#xff1a;任意两点都恰有一条边相连的图(任意两点都相邻)。 完全子图&#xff1a;满足任意两点都恰有一条边相连的子图&#xff0c;也叫团。 最大完全子图&#xff1a;所有完全子图中顶点数最大…