最长公共子序列(LCS)

article/2025/9/6 15:44:40

此文全文参考自:https://blog.csdn.net/dq_dm/article/details/45043689,特此感谢!
然后自己参考了:http://www.ahathinking.com/archives/115.html 和July的ppt讲义《十分钟搞定LCS》,为表示版权,特地留下July的log:)。

一、最长公共子序列定义

最长公共子序列,即Longest Common Subsequence,LCS
子序列:一个序列S任意删除若干个字符得到新序列T,则T叫做S的子序列。
最长公共子序列:两个序列X和Y的公共子序列中,长度最长的那个,定义为X和Y的最长公共子序列。
注意:最长公共子串要求联系,而最长公共子序列未必连续。

二、LCS的意义和应用

       求两个序列中最长的公共子序列算法,广泛的应用在图形相似处理、媒体流的相似比较、计算生物学方面。生物学家常常利用该算法进行基因序列比对,由此推测序列的结构、功能和演化过程。
       LCS可以描述两段文字之间的“相似度”,即它们的雷同程度,从而能够用来辨别抄袭。另一方面,对一段文字进行修改之后,计算改动前后文字的最长公共子序列,将除此子序列外的部分提取出来,这种方法判断修改的部分,往往十分准确。简而言之,百度知道、百度百科都用得上。

三、暴力破解:穷举法

1)假定序列X,Y的长度分别为m,n;

2)X的一个子序列即下标序列{1, 2, …, m}的严格递增子序列,因此,X共有2m个不同子序列;同理,Y有2n个不同子序列,从而穷举搜索法需要指数时间O(2m . 2n);

3)对X的每一个子序列,检查它是否也是Y的子序列,从而确定它是否为X和Y的公共子序列,并且在检查过程中选出最长的公共子序列;

显然,不可取。

四、LCS解法

什么是LCS记号?
这里写图片描述

结尾符相等时

若Xm = Yn(最后一个字符相同),则:Xm与Yn的最长公共子序列Zk的最后一个字符必定为Xm(也=Yn)。
即有:

Zk= Xm= Yn
LCS(Xm,Yn) = LCS(Xm-1,Yn-1)+Xm

公式:
这里写图片描述

举例:
这里写图片描述

结尾符不相等时

1)如果xm≠yn,那么zk≠xm意味着Z是xm-1和Y的一个LCS。也就是
LCS(Xm,Yn)=LCS(Xm-1,Yn)
2)如果xm≠yn,那么zk≠yn意味着Z是X和Yn-1的一个LCS。也就是,
LCS(Xm,Yn)=LCS(Xm,Yn-1)

公式:
这里写图片描述

举例:
这里写图片描述

总结

这里写图片描述

五、LCS代码

伪代码:

这里写图片描述

举例:

这里写图片描述

代码(仅计算LCS长度):
int Lcs_length(string s1, string s2)
{int m = s1.size(); //字符串1的长度int n = s2.size();//int dp[m + 1][n + 1];vector<vector<int> > dp(m+1,vector<int>(n+1,0));for (int j = 0; j < n; ++j)dp[0][j] = 0;  //first rank init 0for (int i = 0; i < m; ++i)dp[i][0] = 0;  //first column init 0for (int i = 1; i <= m; ++i)for (int j = 1; j <= n; ++j){if (s1[i] == s2[j]){dp[i][j] = dp[i - 1][j - 1] + 1;}else{dp[i][j] = max(dp[i - 1][j], dp[i][j - 1]); //max value}}return dp[m][n];
}
代码(计算LCS长度并打印其中一个公共子序列):
void  Lcs_lengthAndStr(string s1, string s2)
{int m = s1.size(); //字符串1的长度int n = s2.size();//int dp[m + 1][n + 1];vector<vector<int> > dp(m+1,vector<int>(n+1,0));for (int j = 0; j < n; ++j)dp[0][j] = 0;  //first rank init 0for (int i = 0; i < m; ++i)dp[i][0] = 0;  //first column init 0for (int i = 1; i <= m; ++i)for (int j = 1; j <= n; ++j){if (s1[i] == s2[j]){dp[i][j] = dp[i - 1][j - 1] + 1;}else{dp[i][j] = max(dp[i - 1][j], dp[i][j - 1]); //max value}}printf("len of LCS is: %d\n", dp[m][n]);/* 输出LCS 本来是逆序打印的,可以写一递归函数完成正序打印这里采用的方法是将Y作为临时存储LCS的数组,最后输出Y*/int i = m;int j = n;char Y[200];  //Y存放LCS字符串,后面也可以使用new char*或者stringint k = dp[i][j];Y[k] = '\0';while (i && j){if (dp[i][j] == dp[i - 1][j - 1] + 1){Y[--k] = s1[i - 1];--i; --j;}else if (dp[i - 1][j] > dp[i][j - 1]){--i;}else{--j;}}printf("%s\n", Y);
}

http://chatgpt.dhexx.cn/article/dYoXEywV.shtml

相关文章

动态规划——最长公共子序列

先来讲解以下什么是最长公共子序列。最长公共子序列不是最长相同字符串&#xff0c;有点相似但不一样&#xff0c;来举个简单的例子&#xff0c;有字符串s1bcdea&#xff0c;s2abce&#xff0c;最长相同字符串是bc&#xff0c;最大公共部分是2&#xff1b;而最长公共子序列则是…

动态规划---例题2.最长公共子序列问题

本题与力扣主站1143题相同. 一.问题描述 一个给定序列的子序列是在该序列中删去若干元素后得到的序列。 确切地说&#xff0c;若给定序列X<x1, x2,…, xm>&#xff0c;则另一序列Z<z1, z2,…, zk>是X的子序列是指存在一个严格递增的下标序列 <i1, i2,…, ik&g…

知识图谱本体建模之RDF、RDFS、OWL详解

&#xff08;一&#xff09;知识图谱本体建模之RDF、RDFS、OWL详解 1.语义网体系 知识图谱于2012年由Google提出&#xff0c;并不是新概念&#xff0c;而是由语义网络(Semantic Network)衍生而来。语义网络由相互连接的节点和边组成&#xff0c;节点表示概念或者对象&#xf…

OWL本体基础知识

备注&#xff1a; OWL本体中对象属性和数据属性都可以有进一步的注释属性&#xff0c;被称之为公理 <owl:NamedIndividual rdf:about"http://www.semanticweb.org/bob/ontologies/2022/11/untitled-ontology-20#刘二菲"><like rdf:resource"http://www…

protege系列(一):本体开发101:创建第一个本体的指南

protege作为领域本体编辑工作一直为自然语言处理和语义网、知识图谱等行业人士喜爱&#xff0c;但是还没有比较完整的官方Protege中文文档&#xff0c;本系列旨在通过对protege官方网站上教程等内容的翻译和再现&#xff0c;为广大网友提供一个全面的、权威的protege教程。 本…

动态本体 palantir

102解析器与106本体耦合&#xff0c;106本体与108数据库耦合&#xff1b; 106本体有一个或多个110对象类型和116属性类型 110对象类型实例化多个112对象 每一个对象有一个或多个属性 116属性类型实例化114A和114B属性 116属性类型有一个或多个118组件&#xff0c;组件有字符串、…

什么是计算机科学中的“本体论”

最近看用户画像&#xff0c;里面提到了本体论。故把知乎一个回答放于此地。 一、本体的概念 本体的概念有两层意思&#xff0c;一层是哲学层面的意思&#xff0c;一层是引申到信息科学中的语义层面的意思。 举个最通俗的例子来解释一下这两层意思&#xff0c;我们就拿苹果来举…

本体建模学习笔记

目录 1. 语义网 & 语义网络 1.1 链接数据与知识图谱 的区别 1.2 本体构建的两种方式 1.3 知识图谱数据的来源 0. RDF、OWL 与RDFS 0.1 RDF序列化 0.2 关系 / 属性 0.3 RDFS词汇 0.4 本体映射词汇&#xff08;Ontology Mapping&#xff09; 2. Protege实现本体建模…

知识元与知识本体

元数据&#xff08;Metadata&#xff09;就是“关于数据的数据”,是对数据进行组织和处理的基础。元数据法就是对信息单元及其集合进行规范描述从而形成元数据&#xff0c;并依其将分布式的信息资源整合成有机信息体系的基准、方法和工具。主题词表&#xff1a;也称叙词表。它是…

本体语言 OWL

万维网本体语言OWL2 文章目录 万维网本体语言OWL2一、引言二、本体语言的需求三、OWL2和RDF/RDFS的兼容性3.1 OWL2 Full&#xff1a;基于RDF的语义3.2 OWL2 DL&#xff1a;直接语义 四、OWL语言五、OWL2 概要六、实验 OWL的构造七、总结 一、引言 通俗的讲&#xff0c;RDF被限…

本体概述

目录1.定义2.本体的目标和作用3.本体构成要素4.领域本体与上层本体5.本体语言6. 构造Ontology 的规则 7.本体在信息检索的应用 1.定义 – 1991/Neches 等&#xff1a;给出构成相关领域词汇的基本术语和关系&#xff0c;以及利用这些术语和关系构成的规定这些词汇外延的规则…

本体 摘抄笔记

一、本体的一些介绍 &#xff08;来源&#xff1a;https://blog.csdn.net/shendeguang/article/details/8241164&#xff09; 1. 本体论语义学的特点&#xff1a; 本体论语义学与其他人工智能理论、自然语言加工系统相比有自己的一些鲜明特点。 其一&#xff0c;它强调对意义…

图构建:领域本体设计原则与动态本体

图构建&#xff1a;领域本体设计原则与动态本体 前文《思考总结&#xff1a;领域知识图谱平台构建与业务应用》中提到&#xff1a;“本体设计是图应用中的重中之重&#xff0c;一切的图展示、图计算、图分析、图挖掘、图模式匹配…的基础在图构建&#xff0c;而图构建的核心是…

常用本体建模工具

常用本体建模工具&#xff1a; Apollo、OntoStudio、TopBraid Composer、Semantic Turkey、Knoodl、Chimaera、OliEd、WebODE、Kmgen和DOME Protg Protg[1]是一款由斯坦福大学编写并维护的开源本体建模和编辑工具&#xff0c;其支持Web版本和PC版本&#xff0c;使用OWL语言…

本体(Ontology)

我是在撰写毕业论文中接触到知识表示方面的内容&#xff0c;有时需要理论与实践相结合&#xff0c;关于这方面的理论知识学习&#xff0c;除了网页资料、书籍、另外推荐一个网站&#xff1a;熊猫学术(https://sc.panda321.com/)&#xff0c;可以查阅很多相关的学术论文&#xf…

知识图谱初步学习(一)——本体+Protege新手学习

文章目录 前言&#xff08;本体详解&#xff09;1.本体概念2.本体分类3.本体组成4.本体构建方法5.本体构建的原则6.本体应用 一、protege简介二、软件使用步骤1.安装2.使用3.案例 三、问题解决方案汇总 前言&#xff08;本体详解&#xff09; 在开始学习知识图谱的过程中&…

本体调研

1.1本体概念 本体是用于描述一个领域的术语集合&#xff0c;其组织结构是层次结构化的&#xff0c;可以作为一个知识库的骨架和基础。 本体不等同于个体&#xff0c;它是相应领域内公认的概念集合。 1.2 本体分类 依照领域依赖程度: &#xff08;1&#xff09;顶层本体&…

知识图谱初步学习(零)——本体是什么

知识图谱初步学习&#xff08;零&#xff09;——本体是什么 文章目录 知识图谱初步学习&#xff08;零&#xff09;——本体是什么前言一、 哲学层面理解二、 引申到语义层面理解三、学术层面四、其他层面- 术语- 语义网 五、本体与类、本源、实体、符号的区别六、用语义三角形…

本体(Ontology)概述

认识本体 本体&#xff08;Ontology&#xff09;的概念源自于哲学领域&#xff0c;在哲学中的定义为“对世界上客观事物的系统描述&#xff0c;即存在论”。哲学中的本体关心的是客观现实的抽象本质。而在计算机领域&#xff0c;本体可以在语义层次上描述知识&#xff0c;可以看…

区块链 Vs. 互联网,创新在哪里?

本文转载自共识未来公众号 引言&#xff1a;最近关于区块链革命的提法少了很多&#xff0c;我们很少再听到“区块链即将颠覆互联网”的提法&#xff0c;这似乎也寓意着区块链技术&#xff08;加密技术&#xff09;正在进入一个理性发展的阶段&#xff0c;如果按照Gartner的技术…