Nat. Mach. Intell. | 人工智能的透明度和可重复性

article/2025/8/23 17:26:54

        今天给大家介绍多伦多大学的研究人员发表在nature machine intelligence上的一篇文章。文章指出McKinney等人利用AI在乳腺癌筛选上的工作,缺乏研究方法和代码实现的细节,阻碍了透明且可重复(transparent and reproducible)的AI研究,文章为扫除这些障碍提供了解决方案。

1.背景

McKinney等人的工作证明了AI在医学成像中的潜力,同时指出了使此类工作具有可重复性所面临的挑战。McKinney等人认为他们的系统提高了乳腺癌筛查的速度和健壮性,可以推广到训练集以外的人群,并且在特定环境中的表现优于放射科医生。经过成功的临床验证并获得监管机构的批准,此新系统具有简化临床工作流程,减少假阳性和改善患者预后的巨大潜力。但是,由于缺乏足够的文献记录方法和计算机代码,系统的科学价值大受影响,也限制了其他人对此工作的验证,无法为临床实施此类技术提供必要依据。通过讨论McKinney等人面临的透明且可重复(transparent and reproducible)AI研究的障碍,作者提供了对更广泛领域具有潜在意义的解决方案。

 

2.编码障碍

科学进步取决于独立研究人员是否有能力仔细审查研究结果、利用研究材料再现研究的主要结果,以及在未来研究中加以利用。文献记载不足的研究成果不符合科学发现的核心要求。仅仅是深度学习模型的文本描述可能掩盖了其高度的复杂性,计算机代码中的细微差别也可能会对结果的训练和评估产生明显的影响,从而导致意想不到的后果。因此,用于训练模型并得出其最终参数集的实际计算机代码的透明度对于研究可重复性至关重要。

 

McKinney等人表明,用于训练模型的代码“大量依赖于内部工具,基础架构和硬件”,并声称因此不可能发布代码。计算重现性对于高质量AI的应用是必不可少的,更复杂的方法要求更透明。在没有代码的情况下,可重现性依赖于从文本描述中复制方法。尽管McKinney等人声称在他们文章中的补充方法部分对所有实验和实现的细节进行了足够详细的描述,以“支持使用非专有库的复制”,但仍缺乏有关其分析的关键细节。即使进行了广泛的描述,仅基于文本来复制复杂的计算流程也是一项具有挑战性的任务。

 

除了纯文本描述方法固有的可重复性挑战外,McKinney等人的关于模型开发以及数据处理和训练策略中缺少关键的细节,缺少模型架构的几个超参数的定义,没有透露训练策略和增强策略的细节,所使用的转换是随机的,这会大大影响模型的性能。没有这些关键信息,就不可能独立复制训练过程。

作者介绍了许多使人工智能研究更加透明的框架和平台,包括Bitbucket,GitHub和GitLab的这类可以共享代码的工具。作者还创建了一些小的人工示例,或者使用了一些小的公共数据集来显示如何处理新数据以训练模型并生成预测。除了隐私问题外,共享模型架构以及学习参数很容易达成,隐私可能会泄露有关用于训练模型的患者的敏感信息,但是存在用于实现差异隐私的技术来减轻这种担忧。许多学习模型,包括TensorFlow Hub,ModelHub.ai,ModelDepot和Model Zoo,并支持多个框架(例如PyTorch和Caffe)以及原作者使用的TensorFlow库。除了改善可访问性和透明度之外,此类资源还可以大大加速模型开发,验证以及向生产和临床实施的过渡。

3.数据障碍

作者认为确保可重复性的另一个关键方面在于模型所使用的数据。McKinney等人在他们的研究中使用了两个获得许可的大型数据集,并在他们的论文中适当地解释了这一限制。由于隐私问题,对患者健康信息的共享受到严格监管。尽管存在这些挑战,但原始数据的共享在生物医学文献中已变得越来越普遍,从2000年代初的不足1%增长到如今的20%。如果无法共享数据,则应发布模型预测和数据标签本身,以便进行进一步的统计分析。最重要的是,对数据隐私的关注不应当作为一种避免发布代码要求的方式。

 

尽管人们普遍认为共享代码和数据是科学研究的关键部分,但在各个领域,采用情况却有所不同。在基因组学等领域,数十年来共享了复杂的计算策略和敏感数据集,与基因组数据有关的指导方针清晰,详细,并有效地得到执行。通常来说,所有代码和数据都与出版物一起发布。从整体上看,在医学和科学的其他领域中,这种情况要少得多,很少提供数据和代码。作者认为,对于可以预见临床应用并危及人类生命的科学研究,透明度的标准应该更高。如果由于许可或其他不可克服的问题而无法与整个科学界共享数据集,则至少应设置一种机制,以使某些独立研究人员可以访问数据并验证分析。

 

4.结论

在重要的科学出版物中缺少对代码和数据的访问可能会导致不必要的甚至潜在有害的临床试验。这些不幸的教训并没有在期刊编辑及其读者身上消失。期刊有义务使作者遵守可再现性标准,这不仅使其他研究人员受益,也使作者本身受益。使自己的方法具有可在现性,可能会在出版之前对作者造成一些偏见或不足。但防止对模型进行外部验证则会降低其影响,因为它会阻止其他研究人员在将来的研究中使用和建立模型。

 

作者指出我们对AI方法在医学上的应用寄予厚望,但是要确保这些方法发挥其潜力,这就要求这些研究在科学上是可重复,是透明的,这样才能扩大已发布的深度学习算法的影响力,并使新的研究方法在临床环境上加速转化。

 

参考资料

  1. Haibe-Kains, B., Adam, G.A., Hosny, A. et al. Transparency and reproducibility in artificial intelligence. Nature 586, E14–E16 (2020).

    https://doi.org/10.1038/s41586-020-2766-y

  2. McKinney, S.M., Sieniek, M., Godbole, V. et al. International evaluation of an AI system for breast cancer screening. Nature 577, 89–94 (2020).

    https://doi.org/10.1038/s41586-019-1799-6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


http://chatgpt.dhexx.cn/article/DGo9gMnV.shtml

相关文章

网络安全学习中的工具

1> Nmap Nmap,也就是Network Mapper,最早是Linux下的网络扫描和嗅探工具包。 系统管理员可以利用nmap来探测工作环境中未经批准使用的服务器,但是黑客会利用nmap来搜集目标电脑的网络设定,从而计划攻击的方法。 其基本功能有三…

p2p网络测试工具_(官方更新)IPFS的网络层——libp2p在2020的发展

如果您在分散的点对点空间中执行任何操作,您可能听说过 libp2p - 用于对等应用程序的模块化网络堆栈。 libp2p 由许多模块化库组成,p2p 网络开发人员可以从中选择和重用所需的协议,同时便于应用程序之间的升级和互操作。这有助于 Web3 开发人…

NAT会话穿越应用程序(STUN)(RFC-5389)

RFC文档链接 摘要 NAT会话穿越应用程序 (STUN) 是一种协议,在处理网络地址转换(Network Address Translator, NAT)穿越时充当其他协议的工具。终端可以使用它来确定NAT分配给它的IP地址和端口。它还可以用来检查两端之间的连通性,并作为keep-alive协议…

教你用 CSS 实现超真实的 3D 相册,让你的照片立体感 UPUP

前言 现如今网页越来越趋近于动画,相信大家平时浏览网页或多或少都能看到一些动画效果,今天我们来做一个有意思的动画效果,通过 css3 实现 3d 效果的立方体相册,下面一起看看吧。 实现思路 首先我们要确定好 html 的结构以及要使…

HTML+CSS实现3D立体相册

程序员的浪漫&#xff0c;话不多说上代码。 HTML: <body><div id"cube"><!--外层盒子--><ul><li><img src"./imgs/1.jpg" ></li><li><img src"./imgs/2.jpg" ></li><li>&l…

该换壁纸啦,记录一个用CSS和HTML做的3D立体相册

这几天看东宫沉迷于陈星旭&#xff0c;李承鄞太绝了&#xff01;这不得把壁纸安排上&#xff1f;简单记录一下制作过程。 1、准备照片 需要1张大的背景图和6张3d相册用图存放在img文件夹中。 可以先使用PS、美图秀秀或者其他修图软件等将相册用图改成200px*200px。 注意文件…

抖音程序员HTML相册,快手抖音程序员表白女朋友3D立体相册源码html网页相册代码...

前几天分享了一套源码&#xff0c;今天又为大家带来一套类似的源码&#xff0c;希望大家喜欢! 快手抖音很火的程序员女朋友3D立体相册源码html网页相册代码&#xff0c;经测试在IE8浏览器下无法预览&#xff0c;建议使用支持HTML5与css3效果较好的360浏览器预览本源码。 代码如…

H5 3d立体相册 CSS3特性

CSS3 变形特性,立方相册,3d旋转 之前看见过3d效果的立体相册,挺羡慕的,现在自己也有机会实现属于自己的3d立体相册了~~~话不多说,开搞… 一, 准备材料 六张自己喜欢的图片,六个面,怎么简单方便怎么来,名字直接取123456,后缀.jpg,放到img文件夹下一张小图片,大点也不要紧,为了浏…

js制作3d立体旋转相册

使用js做一个3d立体旋转相册 可自由拖拽 源码如下 <!DOCTYPE html> <html> <head> <meta charset"utf-8"><title>1</title><style type"text/css">.main{perspective: 800px;}#mian img{width: 200px;height:…

3D立体动态相册(带背景音乐)HTML+CSS脚本

3D立体动态相册&#xff08;带背景音乐&#xff09;HTMLCSS脚本。程序员硬核送礼方式。。。 动画效果 截图效果&#xff1a; 照片准备&#xff1a; 命名为1、2、3、…… 音乐&#xff1a; 将文件依次放在各自文件夹中&#xff1a; CSS文本&#xff0c;命名&#xff1a;index.…

抖音3d相册html代码,抖音3D立体相册表白代码.doc

抖音3D立体相册表白浪漫代码 首先先建立html文件css-3d旋转 之后再新建一个CSS的文件夹 并在css文件夹中建立txt文件&#xff0c;并且把代码复制进去&#xff0c;修改后缀名为.css html{ background: #000; height: 100%; } /*最外层容器样式*/ .wrap{ position: relative; pos…

打造3D立体相册

项目目录结构&#xff1a; HTML代码&#xff1a; <!DOCTYPE html> <html><head><meta charset"utf-8" /><title></title><link type"text/css" rel"styleSheet" href"css/wrap.css" /><…

MATLAB竟也能制作3D相册?教你用MATLAB制作立体动态相册

效果 教程部分 1 图片导入与大小重设 需要有一个名为album的文件夹和当前m文件在同一文件夹&#xff0c;另外ablum文件夹内至少要有一张jpg格式图片 path.\album\;%文件夹名称 filesdir(fullfile(path,*.jpg)); picNumsize(files,1);%遍历路径下每一幅图像 for i1:picNumfi…

HTML 3d立体旋转相册

效果&#xff1a;&#xff08;实际是动态旋转&#xff09; 目录&#xff1a;&#xff08;根据自己需要替换图片就行了 大照片是400*400 小照片是100*100&#xff09; 提取码&#xff1a;1122 代码链接 index.html <!DOCTYPE html> <html lang"en"> <…

3D立体相册不过是冷锋蓝plus版 html+css

一.话不多&#xff0c;先看效果&#xff1a; 转念一想&#xff0c;好像很久很久没出css特效的文章了&#xff0c;特别是工作之后&#xff0c;更少了。偶然翻看电脑内存的时候&#xff0c;发现这个自己1年多以前写的特效&#xff0c;甚美&#xff0c;又勾起我一段尘封的回忆。。…

创意相册、3D立体相册

3D表白相册 精美的3D动态相册&#xff0c;快去做给她吧&#xff01; 点我下载 换的图片格式要一样&#xff0c;实在不一样就去代码里面改后缀名 https://download.csdn.net/download/weixin_43474701/60386577

3D立体相册,一个可旋转的立体相册

11359.gif 主要功能&#xff1a;立体球体展示 可自行添加本地照片 可旋转&#xff0c;照片可放大 商城下载&#xff1a; App Store github下载 用的代码是用的云标签的code&#xff0c;代码略有改动 主要代码调用 // 调用展示 self.sphereView [[YoungSphere alloc] initWithF…

还在买鲜花送女神?手把手教你搭建3D立体相册网站,包女神稀饭

是不是一款人见人爱的相册网站&#xff0c;看下图演示马上知晓。360度3D立体旋转&#xff0c;随意放大缩小任一张照片&#xff0c;合适每一个女生的小胃口&#xff0c;保证女神眼前一亮&#xff0c;对您刮目相看。 我们的特点是——情人节圣诞节女神生日纪念日都适合当礼物&am…

css3 3D立体相册实现

这几天无聊&#xff0c;看到有博主弄的电子相册有点意思&#xff0c;就照葫芦画瓢也实现了一个&#xff0c;一个半透明的正方体包含着一个小正方体&#xff0c;相册自动旋转&#xff0c;当获得焦点时变化效果&#xff0c;截图如下&#xff1a; 一&#xff0c;代码目录结构 二&a…

3D立体相册 html+css

前言 用css的transform属性做一个3D相册~~~ 值translate表示偏移&#xff1b; scale表示缩放&#xff1b; rotate就是转动。 一、先看效果 二、实现步骤 1.我们知道一个正方体有6个面&#xff0c;所以定义一个父亲元素然后定义6个子元素作为6个面。每个面放一张图片。里面q1…