卧槽!GitHub排行榜即将下线;酷炫的Python热重载工具;开发者体验·电子书;C++最佳实践合辑;前沿论文 | ShowMeAI资讯日报

article/2025/5/14 0:59:02

👀日报合辑 | 📆电子月刊 | 🔔公众号下载资料 | 🍩@韩信子

👀日报合辑 | 📆电子月刊 | 🔔公众号下载资料 | 🍩@韩信子

📢 卧槽!GitHub Trendind板块即将下线,微软也要降本增效了?

注意了! 趋势标签将被废弃。由于『今日热门存储库』和『今日热门开发者』两项功能使用率很低,从2022年9月30日起,标签将不再可用。

Trending 趋势是微软 GitHub 于 2018 年推出的一项功能,根据star、fork、提交、follow数等进行统计,每天更新8次,用以查看社区热门存储库和开发者。Trending Repositories 展示了前25个有潜力的开源项目,用户可对项目进行赞助。

工具&框架

🚧 『hmr-benchmarks』3D姿态和形状估计基准测试

https://github.com/smplbody/hmr-benchmarks

MMHuman3D 是一个基于 PyTorch 的开源代码库,是 OpenMMLab 项目的一部分,用于在计算机视觉和计算机图形中使用三维人体参数模型。本项目建立在 MMHuman3D 的基础上,添加了多个功能。

🚧 『Lhotse』使语音和音频数据准备更灵活的Python库

https://github.com/lhotse-speech/lhotse

https://lhotse.readthedocs.io/en/latest/

Lhotse是一个Python库,旨在使语音和音频数据的准备工作更加灵活,它是下一代Kaldi语音处理库的一部分。具备以下特点:

  • 为常用的语料库提供标准的数据准备流程
  • 为语音和音频相关任务提供 PyTorch 数据集类
  • 为模型训练提供灵活的数据准备,包括音频切割的概念
  • 高效率,特别是在I/O带宽和存储容量方面

🚧 『Reloadium』为Python程序增加热重载功能,编辑代码可实时看到效果

https://github.com/reloadware/reloadium

https://reloadium.io/

Reloadium为Python程序添加热重载和分析功能,Reloadium在改变时将重新运行当前函数,开发人员可以立即得到代码是否正常工作的反馈。

🚧 『Zed』超结构化数据工具,一种新的更简单的数据操作方式

https://github.com/brimdata/zed

https://zed.brimdata.io/

Zed 提供了一种新的数据方法,使其更容易操作和管理你的数据。Zed 新的超级结构化数据模型,可以让混乱的 JSON 数据很容易地被赋予关系表的完全类型化的精确性。

🚧 『TorToiSe』以质量为重的多语音TTS系统

https://github.com/neonbjb/tortoise-tts

https://nonint.com/static/tortoise_v2_examples.html

Tortoise 是一个的文本转语音程序,具备强大的多声道能力、高度逼真的发音&语调等优点。GitHub 项目包含在推理模式下运行 Tortoise TTS 所需的所有代码。

博文&分享

👍 『开发者体验:探索与重塑』电子书

https://github.com/dx-angel/dx-book

https://dx.phodal.com/

开发者体验是开发人员对于针对使用或期望使用的产品、系统或者服务的认知印象和回应。有所不同的是,用户关注的内容变为库,SDK,文档,框架,开源解决方案,通用工具,API 等的开发人员的体验。

作者经历了多个低代码前端项目的售前,以及一个低代码项目的技术实践强化后,发现国内的 IT 企业缺乏对于『开发者体验』缺乏系统性的思考。所以结合自己的项目经历、社区经验、国内外实际情况等,编写一个简要的开发者体验电子书。

👍 『Flamingo』用单个视觉语言模型搞定多个任务

https://www.deepmind.com/blog/tackling-multiple-tasks-with-a-single-visual-language-model

一个孩子看过书中几张动物的照片后,就可以在动物园中认出真正的动物,尽管两者之间存在差异。但要从图像中计数和识别出动物(如『两只火烈鸟』),典型视觉模型必须收集数千张图像,并用它们的数量和种类对每张图像进行注释。这个过程效率低、成本高、资源密集,需要大量带注释的数据,并且每次面临新任务时都需要训练新模型。

论文『Flamingo: a Visual Language Model for Few-Shot Learning』介绍了 Flamingo 这种单一的视觉语言模型 (VLM) 只需几个特定任务的示例就可以解决许多难题,而无需任何额外的训练。

数据&资源

🔥 『Awesome BEV Perception from Multi-Cameras』多相机3D目标检测和俯视图分割文献列表

https://github.com/chaytonmin/Awesome-BEV-Perception-Multi-Cameras

🔥 『cpp-best-practices』C++ 最佳实践

https://github.com/cpp-best-practices/cppbestpractices

此在线资源是 Jason Turner 收集的 C++ 最佳实践资源的一部分。

研究&论文

可以点击 这里 回复关键字 日报,免费获取整理好的论文合辑。

公众号后台回复关键字 日报,免费获取整理好的论文合辑。

科研进展

  • 2022.08.07 『图像分类』 No More Strided Convolutions or Pooling: A New CNN Building Block for Low-Resolution Images and Small Objects
  • 2022.08.15 『计算机视觉』HoW-3D: Holistic 3D Wireframe Perception from a Single Image
  • 2022.08.12 『意图识别』Pre-training Tasks for User Intent Detection and Embedding Retrieval in E-commerce Search
  • 2022.08.18 『重排序』Adaptive Re-Ranking with a Corpus Graph

⚡ 论文:No More Strided Convolutions or Pooling: A New CNN Building Block for Low-Resolution Images and Small Objects

论文时间:7 Aug 2022

领域任务:Image Classification, object-detection, 图像分类目标检测

论文地址:https://arxiv.org/abs/2208.03641

代码实现:https://github.com/labsaint/spd-conv

论文作者:Raja Sunkara, Tie Luo

论文简介:Convolutional neural networks (CNNs) have made resounding success in many computer vision tasks such as image classification and object detection./卷积神经网络(CNN)在许多计算机视觉任务中取得了巨大的成功,如图像分类和物体检测。

论文摘要:卷积神经网络(CNN)在许多计算机视觉任务中取得了巨大的成功,如图像分类和物体检测。然而,在图像分辨率较低或物体较小的情况下,其性能会迅速下降。在本文中,我们指出,这根源于现有CNN架构中一个有缺陷但又常见的设计,即使用分层卷积和/或池化层,这导致了细粒度信息的损失和学习不太有效的特征表示。为此,我们提出了一个新的CNN构建模块,称为SPD-Conv,以取代每个分层卷积层和每个池化层(从而完全消除它们)。SPD-Conv由一个空间-深度(SPD)层和一个非分层卷积(Conv)层组成,可以应用于大多数甚至所有的CNN架构。我们在两个最具代表性的计算机视觉任务下解释这种新的设计:物体检测和图像分类。然后,我们通过将SPD-Conv应用于YOLOv5和ResNet来创建新的CNN架构,并通过经验表明,我们的方法明显优于最先进的深度学习模型,特别是在低分辨率图像和小物体的艰难任务上。我们已将我们的代码开源到了 https://github.com/LabSAINT/SPD-Conv 。

⚡ 论文:HoW-3D: Holistic 3D Wireframe Perception from a Single Image

论文时间:15 Aug 2022

领域任务计算机视觉

论文地址:https://arxiv.org/abs/2208.06999

代码实现:https://github.com/wenchao-m/how-3d

论文作者:Wenchao Ma, Bin Tan, Nan Xue, Tianfu Wu, Xianwei Zheng, Gui-Song Xia

论文简介:This paper studies the problem of holistic 3D wireframe perception (HoW-3D), a new task of perceiving both the visible 3D wireframes and the invisible ones from single-view 2D images./本文研究了整体三维线框感知(HoW-3D)的问题,这是一项从单视角二维图像中感知可见三维线框和不可见线框的新任务。

论文摘要:本文研究了整体三维线框感知(HoW-3D)的问题,这是一项从单视角二维图像中感知可见三维线框和不可见线框的新任务。由于物体的非正面不能在单视图中直接观察到,在HoW-3D中估计非视线(NLOS)的几何形状是一个根本性的挑战问题,在计算机视觉中仍然是开放的。我们通过提出ABC-HoW基准来研究HoW-3D的问题,该基准是在来自ABC数据集的CAD模型的基础上创建的,包括12000张单视图图像和相应的整体3D线框模型。有了大规模的ABC-HoW基准,我们提出了一个新的深度空间格式塔(DSG)模型,以学习可见的连接点和线段为基础,然后通过遵循人类视觉系统的格式塔原则,从可见的线索中推断出NLOS三维结构。在我们的实验中,我们证明了我们的DSG模型在从单视角图像推断整体三维线框方面表现非常好。与强大的基线方法相比,我们的DSG模型在检测单视角图像中不可见的线条几何方面优于之前的线框检测器,甚至与之前将高保真点云作为重构3D线框的输入的艺术相比,也非常有竞争力。

⚡ 论文:Pre-training Tasks for User Intent Detection and Embedding Retrieval in E-commerce Search

论文时间:12 Aug 2022

领域任务:Intent Detection, Question Answering, 意图识别问答系统

论文地址:https://arxiv.org/abs/2208.06150

代码实现:https://github.com/jdcomsearch/jdsearch-22

论文作者:Yiming Qiu, Chenyu Zhao, Han Zhang, Jingwei Zhuo, TianHao Li, Xiaowei Zhang, Songlin Wang, Sulong Xu, Bo Long, Wen-Yun Yang

论文简介:Pretrain-Finetune paradigm recently becomes prevalent in many NLP tasks: question answering, text classification, sequence labeling and so on./预训练-微调范式最近在许多NLP任务中变得很流行:问题回答、文本分类、序列标签等。

论文摘要:预训练-微调范式最近在许多NLP任务中变得很流行:问题回答、文本分类、序列标签等等。作为最先进的模型,在一般语料库(如维基百科)上预训练的BERT已被广泛用于这些任务中。然而,这些BERT式的模型在某些场景下仍然显示出局限性,特别是对于以下两种情况:一种是包含与一般语料库维基百科非常不同的文本的语料库,另一种是为特定目的学习嵌入空间分布的任务(例如,近似的近邻搜索)。在本文中,为了解决我们在工业电子商务搜索系统中也遇到的上述困境,我们为两个关键模块提出了新颖的定制化预训练任务:用户意图检测和语义嵌入检索。经过特定微调的定制化预训练模型,其规模不到BERT-base的10%,以便在具有成本效益的CPU服务方面是可行的,在离线评估指标和在线效益方面都明显改善了其他同行。为了可重复性和未来的工作,我们已经开放了我们的数据集。

⚡ 论文:Adaptive Re-Ranking with a Corpus Graph

论文时间:18 Aug 2022

领域任务:Passage Ranking, Re-Ranking,重排序

论文地址:https://arxiv.org/abs/2208.08942

代码实现:https://github.com/terrierteam/pyterrier_adaptive

论文作者:Sean MacAvaney, Nicola Tonellotto, Craig Macdonald

论文简介:Search systems often employ a re-ranking pipeline, wherein documents (or passages) from an initial pool of candidates are assigned new ranking scores./搜索系统通常采用一个重新排名的管道,其中来自初始候选池的文件(或段落)被分配新的排名分数。

论文摘要:搜索系统通常采用一个重新排名的管道,其中来自最初的候选池的文件(或段落)被分配新的排名分数。这个过程可以使用高效但昂贵的评分函数,这些函数不适合直接用于倒置指数或近似近邻指数等结构。然而,重新排名的管道本质上受到初始候选库的召回率的限制;那些没有被初始检索函数确定为重新排名的候选文件无法被识别。我们提出了一种新的方法来克服基于公认的聚类假说的召回限制。在整个重新排名的过程中,我们的方法将那些与到目前为止得分最高的文件最相似的文件添加到池中。这个反馈过程使候选文件池适应那些可能也会产生高排名分数的文件,即使它们不在最初的文件池中。它还可以提高那些出现在池子深处的文件的分数,否则这些文件会因为有限的重新排名预算而被跳过。我们发现,我们的基于图形的自适应重排(GAR)方法在精度和召回率方面显著提高了重排管道的性能,是对各种现有技术(如密集检索)的补充,对其超参数是稳健的,并且对计算和存储成本的贡献最小。例如,在MS MARCO通道排名数据集上,当应用monoT5排名器时,GAR可以将BM25候选库的nDCG提高8%。

我们是 ShowMeAI,致力于传播AI优质内容,分享行业解决方案,用知识加速每一次技术成长!

◉ 点击 日报合辑,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。

◉ 点击 电子月刊,快速浏览月度合辑。

ShowMeAI 致力于传播AI优质内容,分享行业解决方案,用知识加速每一次技术成长!点击专栏 👇,查看历史消息。公众号(ShowMeAI研究中心)回复关键字 日报 ,可以获取资源包(资料整理汇总与AI电子月刊)。

文章来源:https://blog.csdn.net/ShowMeAI/article/details/126535136
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://chatgpt.dhexx.cn/article/wxapmMBq.shtml

相关文章

GitHub 用户排行榜

排行榜预览网址:Github | Githack | UNPKG | Gitee Github 中国用户排名,全球仓库 Star 最多排名,通过 Github API v3 来生成页面数据,排行榜预览,最近还添加了 SegmentFault 思否近期热门、开发者头条最近热门分享、3…

GitHub 全球用户排行榜

排行榜预览网址:Github | Githack | UNPKG | Gitee Github 中国用户排名,全球仓库 Star 最多排名,通过 Github API v3 来生成页面数据,排行榜预览,最近还添加了 SegmentFault 思否近期热门、开发者头条最近热门分享、3…

毫无争议的github顶级有用的开源项目排行榜

github顶级有用的开源项目排行 TOP 14. 假装自己中病毒软件 https://github.com/bitdust/WamaCry 这个用途可太广泛了: 0. 一周没进展要开周会了怎么办 明天就是deadline了可是论文还没写完怎么办这稿子还想再拖一周可是借口都用完了怎么办不想加班,…

2021 GitHub年度排行榜出炉!中文Top3项目诞生!

点击上方“Github中文社区”,关注 看Github,每天提升 第060期分享 来自:机器之心 & GitHub 大家好,我是Huber。 2021 已经过去了,2022年我们相约。 2021年 GitHub表现如何,中文Top3花落谁家呢&#xf…

伪彩色处理

伪彩色处理 文章目录 伪彩色处理代码展示效果展示 代码展示 #include<opencv2\opencv.hpp> using namespace cv;int main() {Mat img imread("D:\\Images\\test2.png", 0);imshow("原图", img);Mat R img.clone();Mat G img.clone();Mat B img.c…

深度图伪彩色处理(matlab)+gray2color

深度图 深度图衡量场景中的深度信息&#xff0c;每一个像素点的像素值代表该采样点对应的场景点到相机的距离&#xff0c;因此深度图是单通道的&#xff0c;从图像的视觉效果来看即灰度图。 判断深度图的质量我们可以通过观察和数据分析两种方法&#xff0c;通常最后的输出图在…

伪彩色图像处理 python,matlab代码

伪彩色图像处理 冈萨雷斯数字图像处理 伪彩色图像&#xff08;也称假彩色图像&#xff09;图像处理包含根据特定标准对灰度值赋予颜色。 伪彩色图像用于区分对单色图像赋予彩色的处理和与真彩色图像相关的处理。因为人眼对彩色图像更为敏感。&#xff08;人眼可以辨别几千种色调…

Matlab 伪彩色处理方法总结(密度分割法、灰度级变换法、频域变换法)

伪彩色处理方法总结 伪彩色处理是将黑白图像转换为彩色图像&#xff0c;方法分为空域变换及频域变换。空域变换其基本原理是构建颜色映射函数&#xff0c;将灰度值转换为彩色值。因为人眼对彩色图像的分辨能力大于黑白图像&#xff0c;所以伪彩色处理是为了增强人眼对图像的细…

伪彩色图像(RGB彩色空间)

%f为一幅焊缝图像 f imread(hanfeng.tif); g ice(image,f); 第一幅图像为变化前&#xff1b;第二幅为变化后的图像。 图&#xff08;一&#xff09; 图&#xff08;二&#xff09;

Python-图像-伪彩色图像处理

目录 1.强分层法 2.灰度级彩色变换 3.频率域彩色变换 1.强分层法 按层划分灰度级数(像素幅值)&#xff0c;每层灰度与单一颜色进行映射 def strong_layering(img,layer):"""强分层法:param img: 输入灰度图像:param layer: 灰度级数分层数:return:伪彩色增…

数字图像处理第六章彩色图像处理(颜色模型,伪彩色图像处理,全彩色图像处理,彩色图像分割、彩色图像边缘检测,后续补充)

本章节主要内容包括彩色模型分类、伪彩色图像处理、全彩色图像处理、彩色变换、彩色图像的基本变换、彩色图像的平滑和锐化、基于彩色图像的分割、噪声、压缩。 6.1彩色模型 颜色模型又叫颜色空间或者颜色系统&#xff0c;其目的是在某些标准下用通常可以接受的方式方便地对彩…

【MATLAB图像分割结果可视化】利用伪彩色更好的展示你的分割结果(含代码)

【MATLAB图像分割结果可视化】利用伪彩色更好的展示你的分割结果&#xff08;含代码&#xff09; 古典方法初级高级 终极方法函数测试 其他 by HPC_ZY 今天不飞了&#xff0c;一起写代码吧。做图像分割、目标检测、物体识别的老铁都会遇到&#xff0c;在得到结果之后需要显示m…

图像处理(第九章彩色图像处理,彩色模型、RGB、HSI、YCbCr、伪彩色处理、全彩色图像处理、直方图、平滑、锐化、分割、去红眼)

图像处理第九章彩色图像处理 第九章9.1彩色基础9.1.1色度学基础&#xff08;了解即可&#xff09; 9.2彩色模型9.2.1RGB彩色模型&#xff08;了解即可&#xff09;9.2.2CIE XYZ模型&#xff08;了解即可&#xff09;9.2.3Lab颜色模型&#xff08;了解即可&#xff09;9.2.4HSI彩…

彩色图像--伪彩处理 灰度图转伪彩色图像

学习DIP第68天 转载请标明本文出处&#xff1a;http://blog.csdn.net/tonyshengtan &#xff0c;出于尊重文章作者的劳动&#xff0c;转载请标明出处&#xff01;文章代码已托管&#xff0c;欢迎共同开发&#xff1a;https://github.com/Tony-Tan/DIPpro #开篇废话 观察了一下冈…

C++ 灰度图像伪彩色处理

真彩色是指影像中的物体颜色和人类肉眼所见的颜色非常相似。在黑白影像中全彩则是指物体的明亮程度。但因为颜色染料等媒体的化学等性质和人类肉眼不同&#xff0c;因此不可能得到绝对的真彩色。 伪彩色的概念就是相较于真彩色提出来的。对于灰度图像&#xff0c;我们可以依据不…

偏振融合伪彩色图像(原理)

最近的大作业是基于偏振图像 的HSI伪彩色增强&#xff0c;现把原理进行分享~~&#xff0c;里面有很多公式上传不了进行了截图&#xff0c;特别上传了word&#xff0c;想直接copy公式也OK 指纹识别程序&#xff0c;附带word-机器学习文档类资源-CSDN下载 二、偏振矢量图像融合…

遥感数字图像处理(实验二)——假彩色合成与伪彩色合成(密度分割)

目录 实验内容二&#xff1a; 实验步骤&#xff1a; 一、假彩色合成 1.假彩色合成基本内容 2.假彩色合成的目的 3.Landsat8常见的波段组合形式&#xff0c;表1 二、波段组合 三、伪彩色合成&#xff08;密度分割&#xff09; 1.密度分割基本内容 2.密度分割的用途 3…

Matlab实现伪彩色处理:灰度图像转换为彩色图像

灰度图像可以简单理解为一个灰度值矩阵&#xff0c;其中灰度值的取值范围是[0, 255]&#xff0c;且灰度值为整数。 现在需要将这个灰度值矩阵中的每一个值拆分成3个通道&#xff08;RGB&#xff09;&#xff0c;分别是红色通道&#xff08;red, R&#xff09;、绿色通道&#…

数字图像的类型——伪彩色,真彩色,假彩色

参考&#xff1a; http://blog.sina.com.cn/s/blog_764b1e9d0100t9c8.html 伪彩色图像 同灰度图像一样,也是单波段的图像&#xff0c;但是这个单波段图像是有颜色的&#xff0c;不再是灰度图那样的&#xff0c;而是它的每一个灰度值都对应颜色空间中的某一种颜色。它可以是彩…

matlab实现灰度图像伪彩色处理

1.基于灰度图像的伪彩色处理 代码展示&#xff1a; clear all; close all;I double(rgb2gray(imread(图片1.jpg))); [M N] size(I); I2 zeros(M, N, 3); %初始化三通道for x 1 : Mfor y 1 : Nif I(x, y) < 127 …