大家都是在哪些网站找数据?

article/2025/9/21 12:22:13

简介

对于统计专业的学生/学者,除了对统计理论/方法的学习之外,我们也应该有产生和获取数据的能力。而不能闭门造车,仅仅做一些理论的内容。小编认为更应该从实际出发(数据出发),观察数据中存在的问题,进而使用一些统计理论解决问题。

上面的话主要从统计大咖们的讲座中受到启发。于是,我也开始以这种思维进行科研和学习。

下面分享一些,自己“存”的数据以及可以获得数据的开源网站。

GitHub——Awesome Public Datasets

该仓库收藏量高达 51k,可想而知它的影响力有多大了吧。内部包含各个领域的开源数据。目录可见下面照片:

小编暂时还没有探索这么多的数据集。有兴趣的读者可以自行探索~

Kaggle——datasets

Kaggle 中给了很多开源的数据集,并且有很多数据集都被人探索过,也会分析一些分析代码。读者可以根据大佬们的代码,逐步实现/学习。

类似的数据竞赛网站还包括:DataCastle、天池、Datafountain等。

UCI——数据仓库

该网站目前维护了 622 个经典的机器学习、数据挖掘数据集,包含分类、聚类、回归等问题下的多个数据集(截止今天)。

博客——数据科学的100个开源数据集

这篇博客给出了数据科学开源的 100 个数据集,感兴趣也可以看看。

NASA——Open Data

小编的研究方向偏工业工程,这里推荐下 NASA 的网站,里面包含了很多工业数据集。很多研究都是基于这些数据集进行的。

小编有话说

这里小编只是简单罗列了下,可以获取数据的一些网站。当然你也可以通过其他方式获得数据,例如:国家数据、世界银行公开数据、中国统计信息网、国家统计局、世界银行、WTO、美国政府开放数据等。

知乎上也有类似问题与回答,可供参考。

当然不同领域可能会有自己的数据库/网站等。如果读者愿意分享出来,欢迎文末留言,让信息开源,共享给更多人吧~


http://chatgpt.dhexx.cn/article/3gHUYG8J.shtml

相关文章

数据哪里找?200个源数据网站全给你!

作者:王术,发表于知乎 来源:https://www.zhihu.com/question/22698541/answer/22367802;部分内容来自网络 01 搜索引擎 搜索引擎是我们信息资料搜集的最重要的渠道之一,用搜索引擎查找信息资料需要使用恰当的关键词和一…

原始数据哪里找?这些网站要用好!200个国内外数据网站大全

导读:资料搜集是个相当繁琐与累的工作,也是数据分析入门的基本,良好的信息资料搜集能力有利于我们快速了解基本情况,为后续的调研及一手资料的获得打下较好的基础。 作者:王术,发表于知乎来源: …

找数据?这几个数据源网站你都知道吗!?

来源:经管学苑 转自:经管学苑 大家好,我是小z 在这个用数据说话的时代,能够打动人的往往是用数据说话的理性分析,无论是对于混迹职场的小年轻,还是需要数据进行分析和研究的同学,能够找到合适的…

最全的数据查询网站

1、国家数据——主要用户:社会情况研究人员 国家统计局开设网站,公布我国各个领域的宏观经济情况,权威度高 2、中国裁判文书网——主要用户:法律从业/学习/爱好者 中国最高人民法院开设,权威可信,可用于…

这些数据获取方式,一般人不知道

全世界只有3.14 % 的人关注了 数据与算法之美 在这个用数据说话的时代,能够打动人的往往是用数据说话的理性分析,无论是对于混迹职场的小年轻,还是需要数据进行分析和研究的同学,能够找到合适的数据源都是非常重要的。特别是想要对…

9个网站,给不知道去哪找数据的你

Data tells story. 在这个处处用数据说话的时代,掌握数据的来源渠道非常重要。 本文从宏观数据、行业数据、互联网搜索数据、公司数据等角度为大家整理了多个网站,解决您的数据需求。 01 国家统计局(宏观数据) 网站包含了人口…

图灵简述

图灵 在计算机的世界中,图灵声名赫赫,是大神级的存在。他被誉为计算机和人工智能之父,计算机界的最高奖“图灵奖”就是以他的名字命名,被称为计算机界的诺贝尔奖。1999年《时代》周刊将图灵评为“二十世纪最重要的一百人”之一。现…

图灵机

内容&#xff1a; 练习&#xff1a; 1、关于“图灵机”&#xff0c;下列说法不正确的是_____。 A 图灵机给出的是计算机的理论模型,是一种离散的、有穷的、构造性的问题求解思路 B 图灵机的状态转移函数<q, X, Y, R(或L或N), p>&#xff0c;其实就是一条指令&#xff…

【置顶】图灵近期出版和即将出版的新书

图灵近期重点新书 堪与《重构》媲美的软件实战图书Amazon 5星评价里程碑性著作 中文书名&#xff1a; 修改代码的艺术 英文书名&#xff1a; Working Effectively with Legacy Code 原书作者&#xff1a; Michael Feathers 译者 : 刘未鹏 原书出版公司&#xff1a; Prentic…

【图神经网络】图数据和图数据相关任务

引言 本文是学习刘忠雨老师所著的《深入浅出图神经网络》过程中的笔记和记录整理&#xff0c;最后会有参考文献标注对应章节和内容中可能出现的参考文献、博文出处。 目录 概述图的基本类型图数据同构图&#xff08;Homogeneous Graph&#xff09;异构图&#xff08;Heterogen…

图灵9本新书上市!

《人工智能简史&#xff08;第2版&#xff09;》 作者&#xff1a;尼克 定价&#xff1a;79元 页数&#xff1a;368页 《人工智能简史》全面讲述人工智能的发展史&#xff0c;几乎覆盖人工智能学科的所有领域&#xff0c;包括人工智能的起源、自动定理证明、专家系统、神经网…

图的关节点算法实现

关节点&#xff1a;可以将一个连通分量分割成两个或多个连通分量的点。 重连通图&#xff1a;没有关节点的图&#xff0c;在重连通图中任意两点之间至少存在两条路径 关节点求法&#xff1a;算法较难理解&#xff0c;算法结合了先序深度搜索和后序深度搜索&#xff0c;先序深度…

重磅!图灵奖,公布!

来源&#xff1a;青塔 3月22日&#xff0c;现年76岁的以太网发明者、3Com公司创始人鲍勃梅特卡夫&#xff08;Bob Metcalfe&#xff09;荣获2022年图灵奖&#xff0c;这一计算机科学的最高荣誉&#xff0c;表彰他为引领大众进入超级连接时代所做的贡献。 鲍勃梅特卡夫发明的以太…

图神经网络_03-基于图神经网络的节点表征学习

基于图神经网络的节点表征学习 图节点预测或边预测任务过程&#xff1a;使用图神经网络来生成节点表征&#xff0c;并通过基于监督学习的对图神经网络的训练&#xff0c;使得图神经网络学会产生高质量的节点表征。 高质量的节点表征能够用于衡量节点的相似性&#xff0c;同时高…

基于图神经网络的节点表征学习

节点表征 在图的节点预测或者边预测任务中, 需要先构造节点表征, 这一点尤为重要 节点的属性可以是类别型, 也可以是数值型 以下分别使用MLP, GCN, GAT, GraphSage来进行节点预测 1.获取并分析数据集、构建一个方法用于分析节点表征的分布2.使用MLP进行节点预测3.分别使用GCN,…

图网络算法——信息传递和节点分类

图网络算法——信息传递和节点分类 在开始介绍下面的算法问题之前&#xff0c;我们首先从提出一个问题&#xff0c;给定一个某些节点具有分类标签的网络结构&#xff0c;我们应该如何去预测网络中其他节点的标签呢&#xff1f; 这种节点分类的方式称为半监督的节点分类。 一、…

网络图结构中节点度分布的散点图

import matplotlib.pyplot as plt #导入科学绘图包 import networkx as nx Gnx.random_graphs.barabasi_albert_graph(1000,10)#生成n1000,m10的无标度的图 print ("某个节点的度:",G.degree(0))#返回某个节点的度 # print("所有节点的度:",G.degree())#返…

[图神经网络] 图节点Node表示---GAT

一. 概括 图神经网络已经成为深度学习领域最炽手可热的方向之一。本文提出Graph Attention Networks(GATs)&#xff0c;将注意力机制应用到图神经网络中&#xff0c;每一层学习节点每个邻居对其生成新特征的贡献度&#xff0c;按照贡献度大小对邻居特征进行聚合&#xff0c;以…

图灵 | 一站式图应用平台

点击「京东金融技术说」可快速关注 「引言」随着社会的日益发展&#xff0c;数据急剧增长&#xff0c;而数据背后的关系的挖掘的就显得更加重要&#xff0c;目前越来越多的人通过图技术去挖掘海量数据中的价值&#xff0c;却没有一个统一的平台&#xff0c;而【图灵】是为此而诞…

图神经网络基础--基于图神经网络的节点表征学习

图神经网络基础–基于图神经网络的节点表征学习 引言 在图节点预测或边预测任务中&#xff0c;首先需要生成节点表征&#xff08;Node Representation&#xff09;。我们使用图神经网络来生成节点表征&#xff0c;并通过基于监督学习的对图神经网络的训练&#xff0c;使得图神…