数据元与元数据

article/2025/8/26 11:29:58

元数据:描述其它数据的数据(data about other data)

元数据是关于数据的数据,在某些时候不特指某个单独的数据,可以理解为是一组用来描述数据的信息组/数据组,该信息组/数据组中的一切数据、信息,都描述/反映了某个数据的某方面特征,则该信息组/数据组可称为一个元数据。

元数据可以为数据说明其元素或属性(名称、大小、数据类型等),或其结构(长度、字段、数据列),或其相关数据(位于何处、如何联系、拥有者)。

在日常生活中,元数据无所不在。只要有一类事物,就可以定义一套元数据。

举个例子:在电影数据库IMDB上可以查到每一部电影的信息。IMDB本身也定义了一套元数据,用来描述每一部电影。下面是它的一级元数据,每一级下面又列出了二级元数据,总共加起来,可以从100多个方面刻画一部电影:

Cast and Crew(演职人员)、Company Credits(相关公司)、Basic Data(基本情况)、Plot & Quotes(情节和引语)、Fun Stuff(趣味信息)、Links to Other Sites(外部链接)、Box Office and Business(票房和商业开发)、Technical Info(技术信息)、Literature(书面内容)、Other Data(其他信息)。

元数据最大的好处是,它使信息的描述和分类可以实现结构化,从而为机器处理创造了可能。

数据元:可理解为数据的基本单元

卫生信息基本数据元规范和定义了医药卫生领域所有相关信息的唯一中文名称与代码,并且代码以字母、汉字、数字式的字符串形式表示。

数据元列举并定义了特定语义环境中的一种信息资源。

完整的数据元名称=对象类术语+特征类术语+表示类术语+(限定类术语)

其中:

一个数据元有且仅有一个对象类术语(object class):是现实世界或抽象概念中事物的集合,有清楚的边界和含义,因其特性和行为遵循同样的规则而能加以标识。

一个数据元有且仅有一个特征类术语(property):是对象类的所有个体所共有的某种性质,也是对象有别于其他成员的依据,是用来区分和识别事物的一种手段。特征类术语是任何一个数据元名称所必须的成分,在数据元概念可完整、准确、无歧义表达的情况下,其他术语可以酌情简略。

一个数据元有且仅有一个表示类术语(representation):是值域、数据类型和表示方式的组合,也包括计量单位和字符集等信息。当表示类术语与特征类术语有重复或部分重复时,可从名称中将冗余词删除。

限定类术语由专业领域给定,限定类术语是可选的。

数据元基本模型

数据元与元数据的区别和联系

  1. 元数据不可能涵盖理解数据元所要表示的数据所必需的所有信息。

  2. 数据元的相关信息是任何一个(组织的)元数据的一个完整的组成部分。

  3. 元数据的每一个元素都是一个数据元,用符合数据元标准的元数据属性和描述方法来说明元数据。

  4. 将元数据存储于一个库中,并使之条理化就需要建模,建模就需要从数据元的注册系统中或库中获取元数据。

  5. 元数据,它是以一种一致、标准的方式来表达的数据元。

  6. 元数据与数据元字典格式均由行号、中文名称、英文名称、标识符(短语)、定义、约束/条件、最大出现次数、数据类型、数据的值域等属性组成。不同之处是数据元字典格式中另有语境和同义词名称等属性。

总而言之,元数据和数据元的定义是从不同角度论述的。由于描述的侧重面不同,元数据和数据元的描述属性也有些区别,但是元数据和数据元的字典格式是基本一致的。

------------------------------------------------------------------------------------------------

1元数据Metadata

1.1元数据概念

1、主要是描述数据属性(property)的信息;

2、描述数据的数据;

3、关于数据的结构化数据;

4、描述数据的内容、覆盖范围、质量、管理方式、数据的所有者、数据的提供方式等信息,是数据和数据用户之间的桥梁。

举例:

学生信息表包括:姓名、性别、学号等。

姓名、性别、学号都是数据元,但是这些数据元有自己的元数据,即描述数据,分别是长度、类型、值域等。

对于学生信息表而言,姓名、性别、学号是描述学生信息的数据,是它的元数据。

数据是手提箱,而元数据是它上面的标牌。

数据是文件夹,而元数据是文件夹上面的标签。

1.2元数据的作用

1、数据描述:对信息对象的内容属性等的描述能力是元数据最基本的功能。

2、数据检索:支持用户发现资源的能力,即利用元数据来更好地组织信息对象建立他们之间的关系为用户提供多层次多途径的检索体系,从而有利于用户便捷快速的发现其真正需要的信息资源。

3、数据选择:支持用户在不必浏览信息对象本身的情况下能够对信息对象有基础的了解和认识从而决定对检出信息的取舍。

4、数据定位:提供信息资源本身的位置方面的信息,如DOI、URL、URN等信息,由此可准确获知信息对象之所在,便于信息的获取。

5、数据管理:保存信息资源的加工存档结构使用管理等方面的相关信息权限管理版权、所有权、使用权、防伪措施、电子水印、电子签名等。

6、数据评估:保存资源被使用和被评价的相关信息,通过对这些信息的使用分析,方便资源的建立与管理者更好的组织资源并在一定程度上帮助用户确定该信息资源在同类资源中的重要性。

2数据元(Data element)

2.1数据元概念

1、用一组属性描述定义、标识、表示和允许值的数据单元。

2、又称数据类型,通过定义、标识、表示以及允许值等一系列属性描述的数据单元。在特定的语义环境中被认为是不可再分的最小数据单元。

3、数据元一般由三部分组成:对象、特性、表示

举例:

“执业类别代码”为数据元,“01”为数据元的值。

“执业类别代码”中,“执业”为对象词,“类别”是该数据元的特性词,“代码”是该数据元的表示词。

2.2数据元的作用

1、数据元本身也是数据单元,即也是数据。

2、它是一个用来对各行业的数据进行自身规范化的一个方法或一套指导的理论。

3、用这一套方法对行业数据进行统一的名、型、值规范及分类。

4、规划好行业数据元之后,可以为行业构建出统一、集成的、稳定的数据模型奠定基础,同时它也为数据交换奠定基础。

3元数据管理

3.1元数据管理的建设目标

3.2元数据管理的范围

4资源目录

4.1资源目录要解决的问题

4.2业务流程示意图

4.3资源目录功能特点

5参考资料

https://baike.baidu.com/item/%E5%85%83%E6%95%B0%E6%8D%AE/1946090?fr=aladdin

https://wenku.baidu.com/view/9789bb30f68a6529647d27284b73f242336c31ff.html

https://baike.baidu.com/item/%E6%95%B0%E6%8D%AE%E5%85%83/7681154?fr=aladdin


http://chatgpt.dhexx.cn/article/IQEMpOUY.shtml

相关文章

什么是元数据(Metadata)

元数据(Metadat)   元数据(Metadata),可能又是一个困惑的中文译文。 【元】,会意字。从一,从兀。甲骨文字形。象人形。上面一横指明头的部位。 上一短横是后加上去的,依汉字造字规律,顶端是一横的,其上可加一短横。…

元数据是什么?如何管理元数据?

元数据是什么?如何管理元数据? 01 什么是元数据?02 元数据的类型1. 业务元数据2. 技术元数据3. 操作元数据 03 元数据管理的目标1. 建立指标解释体系2. 提高数据溯源能力3. 数据质量稽核体系 04 元数据管理的技术1. 元数据采集2. 元数据管理3…

加强防护,近期勒索病毒有点疯狂!

愈演愈烈的勒索病毒攻击 2021年5月7日,美国最大的成品油管道运营商在本月受到重大网络攻击。公司被迫一度关闭整个能源供应网络,极大影响美国东海岸燃油等能源供应。公司在当日缴纳了500万美元赎金。 紧接着,5月14日爱尔兰卫生服务执行局&am…

勒索病毒.[tsai.shen@mailfence.com].faust、.[support2022@cock.li].faust引起的数据被加密恢复

勒索病毒的危害 勒索病毒是最具破坏性和恐怖性的一种病毒。最近[tsai.shen@mailfence.com].faust勒索病毒、.[support2022@cock.li].faust勒索病毒引起了广泛的关注和担忧。 如果您的数据已被勒索软件加密,恢复数据的最可靠方法是使用备份。如果您有备份,可以将备份文件恢复…

勒索预警,近期一大波新型勒索病毒来袭

点击蓝字关注我们 目前勒索病毒仍然是全球最大的威胁,最近一年针对企业的勒索病毒攻击越来越多,大部分勒索病毒是无法解密的,一定要保持高度的重视,近期又有一大波新型勒索病毒来袭...... HildaCrypt勒索病毒 加密后的文件后缀名H…

勒索病毒危害,企业该如何预防勒索病毒

勒索病毒是一种恶意软件,它会对企业内的计算机系统或数据进行加密或锁定,并要求企业支付赎金以解锁或解密。 勒索病毒危害: 数据丢失:勒索病毒可以加密您的文件、照片、视频和其他重要数据,使其无法访问或恢复。如果…

查杀linux服务器木马,定时查杀病毒并隔离

接收到了阿里云服务器的安全告警,主要文件是 /usr/bin/.sshd, /root/aa,使用以下三种方法解决 一. 使用clamav (一)下载 下载方式: (1)下载压缩文件:wget http://www.clamav.net/downloads/…

保障出行安全|科力锐助力长沙黄花国际机场灾备建设

一、民航灾备建设背景 随着我国经济建设的发展,我国机场业已初具规模,机场数量不断提升,航班业务愈加繁忙,机场服务保证能力也在不断增强。为了衔接“空管全球一体化”的发展趋势,实现中国现代化民航系统的建设战略&a…

Mac OS X: 再续〉安全警告,病毒就在你身边

Mac OS X: 再续〉安全警告,病毒就在你身边 1. 沉重 这次心情很沉重!因为这个间谍软件居然和咱们中国又有着联系!联想到前些日子的Goolge对中国说不做恶,指责中国如何如何的,这些就不重复了,结果是那些外国…

暴力破解介绍

暴力破解介绍 1、原理说明 暴力破解即账号枚举,攻击者使用自己的用户名和密码字典,对目的服务器进行一个一个尝试登陆,主要字典足够强大,肯定就会猜解成功。尝试爆破成功后,为攻击者下一步渗透做准备。 2、危害说明 目…

Petya勒索病毒

Petya勒索病毒 1、原理说明 2017年6月27日晚,印度、俄罗斯、西班牙以及欧洲多国遭受大规模Petya勒索病毒袭击,该病毒远程锁定设备,并索要赎金。其中乌克兰地区受灾害最为严重,政府、银行、电力系统、通讯系统、企业等都受到不同…

服务器该怎么预防勒索病毒

场景描述 随着互联网飞速发展,各企业不论大小基本都搭建了属于自己公司的服务器。例如文件服务器、代码服务器、业务系统服务器、数据库服务器等。虽然服务器种类各有不同,但共同点都在于:是公司重要的数据中心。一旦被勒索病毒侵占&#xf…

MSF(Metaspolit)复现MS12-020蓝屏漏洞

什么是漏洞? 漏洞(Vulnerability)又叫脆弱性,这一概念早在1947年冯诺依曼建立计算机系统结构理论时就有涉及。 微软的RPC漏洞和蠕虫病毒 RPC接口中的缓冲区溢出冲击波蠕虫病毒——》席卷全球80%计算机 MS08-067漏洞Conficker&…

新型勒索病毒已经出现

今日一个使用Go语言编写的勒索病毒正在攻击国内企业。该勒索病毒会加密计算机中的重要文件,将文件后缀修改为“.locked”,索要赎金0.2BTC。我们根据其加密后缀将其称为“locked”勒索病毒。 0x1传播分析 黑客通过“永恒之蓝”漏洞入侵企业中的一台计算…

勒索病毒“顽疾”,没有“特效药”吗?

基础设施瘫痪、企业和高校重要文件被加密、毕业论文瞬间秒没……这就是六年前的今天,WannaCry勒索攻击爆发时的真实场景。攻击导致150多个国家数百万台计算机受影响,也让勒索病毒首次被全世界广泛关注。 六年后,勒索攻击仍是全球最严重的网络…

勒索病毒SARA,请勿用于非法用途。

大家好,我是ViciousSpider🕷,今天我和大家分享一个我在初中的时候玩的一个名为SARA的安卓勒索病毒,注意请勿用作违法行为。 1.我们在kali上面使用克隆命令来克隆这个项目git clone https://github.com/termuxhackers-id/SARA 然后…

.locked勒索病毒来势汹汹该怎么办?

一、勒索病毒来势汹汹 从8月28日开始,多个社交媒体以及安全技术社区均有用户称遭遇“.locked”后缀勒索病毒攻击,计算机文件被病毒加密,用户“中招”后,需支付0.2比特币“赎金”(约2.7万人民币)。截止当前,已经确认来…

Crysis勒索病毒中毒经历及漏洞查堵[勒索邮箱openpgp@foxmail.com]

Crysis 勒索病毒中毒经历及漏洞查堵[勒索邮箱openpgpfoxmail.com] 发现中毒出现空白快捷方式图标文件后缀改变确认中毒 处理病毒断网排查病毒定位病毒 查堵漏洞确定时间发现漏洞处理漏洞 总结 写在前面:本文没有提供勒索病毒加密文件解密方式,仅介绍亲身…

机器学习背景及简介

一、机器学习应用 1、机器学习技术正在支撑着各类搜索引擎(尤其是贝叶斯学习技术)等 2、机器实际上是一个应用驱动的学科,其根本的驱动力是:“更多、更好地解决实际问题”。由于近20年的飞速发展,机器学习已经具备了一…

机器学习保研复习

PCA:主成分分析(无监督) PCA(Principal Component Analysis)是一种常用的数据降维技术,用于将多维数据集投影到低维空间中,同时保留数据的重要信息。PCA 的目标是在保持最大方差的同时&#xff…