我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

算法竞赛 │ 图解KMP算法

类别：科技发布时间：2022-12-10 11:00:00 来源：书圈

KMP比较难搞懂。本文用图解清晰地解释了KMP的思想，给出了模板代码，解析了几个经典例题。

KMP是字符串模式匹配算法，它包括预处理模式串和匹配两部分，复杂度为 O( m+n )，是此类算法能达到的最优复杂度。KMP的思路和编码很巧妙。

朴素的模式匹配算法

模式匹配（Pattern Matching）问题：在一篇长度为 n 的文本 S 中，找某个长度为 m 的关键词 P 。P 可能多次出现，都需要找到。

最优的模式匹配算法复杂度能达到多好？由于至少需要检索文本 S 的 n 个字符和关键词 P 的 m 个字符，所以复杂度至少是 O ( m+n ) 。

先考虑朴素的模式匹配算法（暴力方法）：从 S 的第一个字符开始，逐个匹配 P 的每个字符。例如 S = “abcxyz123 ” ， P = “ 123 ”。第1轮匹配，P [ 0 ] ≠ S [ 0 ] ，称为“失配”，后面的 P [1] 、P [2] 不用再比较。一共比较 6+3=9 次：前6轮比较 P 的第1个字符，第7轮比较 P 的3个字符。

(把P看成一个滑块，在轨道S上滑动，直到匹配。)

■朴素的模式匹配算法例1

这个例子比较特殊，P 和 S 的字符基本都不一样。在每轮匹配时，往往第1个字符就对不上，用不着继续匹配 P 后面的字符。复杂度差不多是 O ( n ) ，这已经是字符串匹配能达到的最优复杂度了。所以，如果字符串S 、 P符合这个特征，暴力法是不错的选择。

但是如果情况很坏，例如 P 的前m − 1个都容易找到匹配，只有最后一个不匹配，那么复杂度就退化成 O ( nm ) 。例如S = “ aaaaaaaab ” ， P = “aab ” 。图2中 i 指向 S [i]，j 指向P [ j ] ， 0 ≤ i < n ， 0 ≤ j < m 。第1轮匹配后，在 i = 2 ， j = 2 的位置失配。第2轮让 i 回溯到1，j 回溯到0，重新开始匹配。最后经过7轮，共匹配7×3 = 21次，远远超过上面例子中的9次。

■图2 朴素的模式匹配算法例2

KMP算法

KMP是一种在任何情况下都能达到O ( n+m )复杂度的算法。它是如何做到的？用KMP算法时，指向 S 的 i 指针不会回溯，而是一直往后走到底。与朴素方法比较，大大加快了匹配速度。

在朴素方法中，每次新的匹配都需要对比 S 和 P 的全部 m 个字符，这实际上做了重复操作。例如第一轮匹配 S 的前3个字符 “aaa” 和 P 的 “aab”，第二轮从 S 的第2个字符‘ a ’ 开始，与和 P 的第一个字符‘ a ’比较，这其实不必要，因为在第一轮比较时已经检查过这两个字符，知道它们相同。如果能记住每次的比较，用于指导下一次比较，使得 S 的 i 指针不用回溯，就能提高效率。

如何让 i 不回溯？分析两种情况。

01.

P在失配点之前的每个字符都不同

例如S = “ abcabcd ” ， P = “ abcd ” ，第一次匹配的失配点是 i = 3 ， j = 3 。失配点之前的 P 的每个字符都不同，P [0] ≠ P [1] ≠ P [2]；而失配点之前的 S 与 P 相同，即P [0] = S [0] 、 P [1] = S [1] 、P [2] = S [2] 。下一步如果按朴素方法，j 要回到位置0，i 要回到1，去比较P [0] 和S [1] 。但 i 的回溯是不必要的。由P [0] ≠ P [1] 、 P [1] = S [1] 推出P [0] ≠ S [1] ，所以 i 没有必要回到位置1。同理，P [0] ≠ S [2] ，i 也没有必要回溯到位置2。所以 i 不用回溯，继续从i = 3 、 j = 0 开始下一轮的匹配。

■图3 失配点之前的P的每个字符都不同

下面画出示意图。当 P 滑动到左图位置时，i 和 j 所处的位置是失配点，S 与 P 的阴影部分相同，且阴影内部的 P 的字符都不同。下一步直接把 P 滑到 S 的 i 位置，此时 i 不变、j 回到0，然后开始下一轮的匹配。

■图4 P的每个字符都不同的滑动情况

02.

P在失配点之前的字符有部分相同

再细分两种情况：

1）相同的部分是前缀（位于 P 的最前面）和后缀（位于 j 的前面）。

这里给出前缀和后缀的定义：字符串 A 和 B ，若存在A = BC，其中 C 是任意的非空字符串，称 B 为 A 的前缀；同理可定义后缀，若存在A = B， C 是任意非空字符串，称 B 为 A 的后缀。从定义可知，一个字符串的前缀和后缀不包括自己。

当 P 滑动到下面左图位置时，i 和 j 所处的位置是失配点，j 之前的部分与 S 匹配，且子串1（前缀）和子串2（后缀）相同，设子串长度为 L 。下一步把 P 滑到右图位置，让 P 的子串1和 S 的子串2对齐，此时 i 不变、j = L，然后开始下一轮的匹配。注意，前缀和后缀可以部分重合。

■图5 相同的部分是前缀和后缀

2）相同部分不是前缀或后缀。

下面左图，P 滑动到失配点 i 和 j ，前面的阴影部分是匹配的，且子串1和2相同，但是1不是前缀（或者2不是后缀），这种情况与“（1）失配点之前的P的每个字符都不同”类似，下一步滑动到右图位置，即 i 不变，j 回溯到0。请读者自己分析。

■图6 相同的部分不是前缀或后缀

通过上面的分析可知，不回溯 i 完全可行。KMP算法的关键在于模式 P 的前缀和后缀，计算每个P [j] 的前缀、后缀，记录在 Next [ ] 数组（也有写成 shift 或者 fail ）中，Next [j] 的值等于 P [0] − P [ j−1 ] 这部分子串的前缀集合和后缀集合的交集的最长元素的长度。把这个最长元素称为 “最长公共前后缀”。

例如P = “ abcaab ”，计算过程如下表，每一行的红色带下划线的子串是最长公共前后缀。

■图7 最长公共前后缀

Next [ ] 只和 P 有关，通过预处理 P 得到。下面介绍一种复杂度只有 O ( m ) 的极快的方法，它巧妙地利用了前缀和后缀的关系，从 Next [i] 递推到 Next [ i+1 ] 。

假设已经计算出了 Next [i] ，它对应 P [0] − P [ i−1 ] 这部分子串的后缀和前缀，见下面图8(1)所示。后缀的最后一个字符是P [ i−1 ] 。阴影部分 w 是最长交集，交集 w 的长度为 Next [i] ，这个交集必须包括后缀的最后一个字符P [ i−1 ] 和前缀的第一个字符 P [0] 。前缀中阴影的最后一个字符是 P [j] ， j = Next [i] − 1 。

图8(2)推广到求 Next [ i+1 ] ，它对应P [0]~P [i] 的后缀和前缀。此时后缀的最后一个字符是 P [ i ]，与这个字符相对应，把前缀的 j 也往后移一个字符，j = Next [ i ] 。判断两种情况：

（1）若P [ i ] = P [ j ] ，则新的交集等于“阴影w + P [ i ] ”，交集的长度 Next [ i + 1 ] = Next [ i ] + 1 。如图(2)所示。

■图8 若p[i] = p[j]，从Next[i]推广到Next[i+1]

（2）若P [ i ] ≠ P [ j ] ，说明后缀的“阴影 w + P [ i ] ”与前缀的“阴影w + P [ j ] ”不匹配，只能缩小范围找新的交集。把前缀往后滑动，也就是通过减小 j 来缩小前缀的范围，直到找到一个匹配的P [ i ] = P [ j ] 为止。如何减小 j ？只能在 w 上继续找最大交集，这个新的最大交集是 Next [ j ] ，所以更新j ’ = Next [ j ] 。下图(2)画出了完整的子串P [ 0 ] ，最后的字符 P [ i ] 和 P [ j ]不等。斜线阴影 v 是 w 上的最大交集，下一步判断：若P [ i ] = P [ j ’ ] ，则 Next [ i + 1 ] 等于 v 的长度加1，即 Next [ j ’ ] + 1 ；若P [ i ] ≠ P [ j ’ ]，继续更新 j ’ 。

■图9 若p[i] ≠ p[j]，更新j’ = Next[j]

重复以上操作，逐步扩展 i ，直到求得所有的 Next [ i ] 。

模板代码

用下面的例题 hdu 2087给出模板代码，包括 getNext ( ) 、 kmp ( ) 两个函数。getNext ( ) 预计算 Next [ ] 数组，是前面图解思路的完全实现，请对照注释学习这种巧妙的方法。kmp ( ) 函数在 S 中匹配所有的 P ，注意每次匹配到的起始位置是s [ i + 1 − plen ] ，末尾是s [ i ] 。

KMP算法的复杂度：getNext ( ) 函数的复杂度为O ( m ) ；匹配函数 kmp ( ) 从 S [ 0 ] 到 S [ n − 1 ] 只走了一遍，S 的每个字符只与 P 的某个字符比较了1次，复杂度为 O ( n ) ；总复杂度为 O ( n + m ) 。

剪花布条 hdu 2087

题目描述：一块花布条，上面印有一些图案，另有一块直接可用的小饰条，也印有一些图案。对于给定的花布条和小饰条，计算一下能从花布条中尽可能剪出几块小饰条。

输入：每一行是成对出现的花布条和小饰条。#表示结束。

输出：输出能从花纹布中剪出的最多小饰条个数。

Sample Input：

abcde a3

aaaaaa aa

Sample Output：

本题代码套用了KMP的模板。找到的 P 有很多个，而且可能重合，例如“ aaaaaa ” 包含了5个“ aa ” 。但在本题中，需要找到能分开的子串，即剪出不同的小饰条。这个问题容易解决，只需要在程序中加一句 if ( i − last > = plen ) 进行判断即可。

# include

usingnamespacestd;

constintN = 1005;

charstr[N], pattern[N];

intNext[N];

intcnt;

voidgetNext( char*p, intplen) { //计算Next[1]~Next[plen]

Next[ 0]= 0; Next[ 1]= 0;

for( inti= 1; i < plen; i++){ //把i的增加看成后缀的逐步扩展

intj = Next[i]; //j的后移：j指向前缀阴影w的后一个字符

while(j && p[i] != p[j]) //阴影的后一个字符不相同

j = Next[j]; //更新j

if(p[i]==p[j]) Next[i+ 1] = j+ 1;

elseNext[i+ 1] = 0;

}

intkmp( char*s, char*p) { //在s中找p

intlast = -1;

intslen= strlen(s), plen= strlen(p);

getNext(p, plen); //预计算Next[]数组

intj= 0;

for( inti= 0; i

while(j && s[i]!=p[j]) //失配了。注意j==0是情况(1)

j=Next[j]; //j滑动到Next[j]位置

if(s[i]==p[j]) j++; //当前位置的字符匹配，继续

if(j == plen) { //j到了P的末尾，找到了一个匹配

//这个匹配，在S中的起点是i+1-plen，末尾是i。如有需要可以打印：

// printf("at location=%d, %s\n", i+1-plen,&s[i+1-plen]);

//-------------------30--33行是本题相关

if( i-last >= plen) { //判断新的匹配和上一个匹配是否能分开

cnt++;

last=i; //last指向上一次匹配的末尾位置

}

//-------------------

}

intmain{

while(~ scanf( "%s", str)){ //读串

if(str[ 0] == '#') break;

scanf( "%s", pattern); //读模式串

cnt = 0;

kmp(str, pattern);

printf( "%d\n", cnt);

}

return0;

}

————————————————

原文链接：https: //blog.csdn.net/weixin_43914593/article/details/117533364

例题

01.

最短循环节问题

洛谷 P4391

题目描述：字符串 S1 由某个字符串 S2 不断自我连接形成，但是字符串 S2 未知。给出 S1 的一个长度为 n 的片段 S ，问可能的 S2 的最短长度是多少。例如给出 S1 的一个长度为8的片段P=“cabcabca”，求最短的 S2 长度，答案是3，S2 可能是“abc”、“cab”、“bca ”等。

题解：求字符串 P 的最短循环节，读者可能想不到和最长公共前后缀、KMP 的 Next [ ] 数组有关。下面讨论两种情况，请读者自己画图帮助理解。

1）P 由完整的 k 个 S2 连接而成。则 Next [ n ] 等于 k−1 个 S2 的长度，那么剩下的 n − Next [ n ] 等于一个 S2 的长度。

2）P 由 k 个完整的 S2 和1个不完整的 S2 连接而成。设 S2 长度为 L ，不完整的部分长度为 Z 。则 Next [ n ] = ( k − 1 ) L + Z ， n − Next [ n ] = kL + Z − ( k − 1 ) L − Z = L 就是答案。

综合起来答案等于 n − Next [ n ] 。本题例子“ cabcabca ” ， n = 8 ， Next [ n ] = 5，最长公共前后缀是“ cabca” ，答案是 n − Next [ n ] = 3 。

这一题可以帮助深入理解最长公共前后缀和 Next [ ] 数组。

02.

在S中删除所有的P

洛谷 P4824

题目描述：给定一个字符串 S 和一个子串 P ，删除 S 中第一次出现的 P ，把剩下的拼在一起，然后继续删除 P ，直到 S 中没有 P ，最后输出 S 剩下的部分。S 中最多有10 6 个字符。

本题的麻烦之处在于，删除一个 P 之后两端的字符串有可能会拼接出一个新的 P 。例如 S = “ababccy”，P=“abc”，删除第一个 P 后，S=“abcy”，出现了一个新的 P ，继续删除，得 S=“y”。

题解：在 S 中找 P 是典型的 KMP 算法。不过，如果每找到并删除一个 P 后，就重组 S 然后在新的 S 上再做一次 KMP，会超时。能不能在删除一个 P 后，继续在原 S 上匹配和删除，总共只做一次 KMP？

如果对 KMP 算法中 i 、 j 指针的移动有深刻理解，本题的任务是能用一次 KMP 完成的。如图10所示，图(1)在i = 2 ， j = 2处失配。图(2)找到了一个匹配，i = 4 ，在正常情况下，j 应该回到0开始下一轮的匹配，但是这里让 j 回到被删除的 P 前面的值，即 i = 2 时的 j = 2 ，然后直接与 i = 5 对比，这样就衔接上了被删除的 P 前后的字符串。在这个过程中 S 不用重组，i 不用回溯，一共只做了一次 KMP。

■图10 删除P后衔接前后的字符

编码时在正常KMP中加入两条：

1）定义一个和 S 一样大的数组记录每个字符对应的 j 值，用于删除一个 P 后 j 回到 P 前面的值。

2）用一个栈记录删除 P 后的结果。每移动一次 i 就把S [ i ] 进栈，若 KMP 匹配到一个 P ，此时栈顶就是 P ，把栈顶的 P 弹出栈，相当于删除了这个 P 。最后栈中留下的就是 S 删除了所有 P 的结果。

参考书籍返回搜狐，查看更多

责任编辑：

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2022-12-13 18:23:09

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于算法,竞赛的资讯：

龙源电力“新能源智能算法竞赛”开赛

... 陆成宽） 1月15日，由龙源电力举办的首届“新能源智能算法竞赛”正式开赛，首批来自全国各地的40余支优秀算法团队齐聚北京、西安进行算力比拼，助推新能源产业数字化、智能化转型

2024-01-18 02:47:00

“数融万物智算未来”2023年智能分析算法专项职工劳动和技

...一场围绕“数融万物智算未来”为主题的2023年智能分析算法专项职工劳动和技能竞赛启动仪式在市北高新园区隆重举行。本次竞赛以习近平新时代中国特色社会主义思想为指导，全面贯彻落实

2023-09-22 11:51:00

2025年安徽工业大数据算法技术技能大赛开赛

大皖新闻讯 2025年10月18日，2025年安徽省工业大数据算法技术技能大赛在安庆师范大学开幕。大赛为双人团体赛，分为职工组（含教师）和学生组两个组别，共有参赛队伍42组，其

2025-10-19 14:29:00

第五届全球校园人工智能算法精英大赛全国总決赛在宁开幕

...，2023年“智青春·算未来”——第五届全球校园人工智能算法精英大赛全国总决赛在河海大学江宁校区开幕。本次全国总决赛由江苏省科学技术协会、江苏省工业和信息化厅指导，江苏省人工

2023-12-10 16:37:00

当“电气”遇上“智能” 全国大学生电子设计竞赛湖北赛区开赛

...觉、机器学习和人工智能等多学科知识，通过高效的控制算法和多种人工智能算法，确保该装置能实时获取棋盘信息、稳定地抓取棋子，实现人机对战。“自动行驶小车”的制作并不复杂，但是该赛

2024-08-09 17:42:00

人工智能赛事火热，百余选手角逐“最强大脑”

人工智能赛事火热，百余选手角逐“最强大脑”“算法高手”指尖翻飞键盘之上跃动智慧南报网讯（记者余梦迪）“嗒嗒！嗒嗒！”9月7日的南京开放大学（南京工匠学院）赛场内，键盘敲击声此起

2025-09-10 07:43:00

编程教育热度不减竞赛背后机遇与挑战并存

...部分，分为普及组(CSP-J)和提高组(CSP-S)，旨在认证学生的算法设计能力和编程能力。近年来，参加非专业级软件能力认证的人数不断增多

2024-12-18 20:06:00

竞赛砺精兵逐梦正当时—第一届全国气象行业职业技能大赛（气象服

...气象部门的248名领队、教练、选手齐聚于此，在气象服务算法、气象融媒体视频服务、气象服务解决方案三条“赛道”上展开角逐。记者走进气象服务算法竞赛的考场，只见选手们两两一组，有

2023-09-15 15:23:00

2024年海口市职业技能竞赛——“工会杯”人工智能训练师职业

...职业技能竞赛”将在海口开赛，来自海口各地的人工智能算法测试员和数据标注员参赛。本次竞赛为期一天，竞赛项目分为人工智能训练师（人工智能算法测试员）、人工智能训练师（数据标注员）

2024-10-23 19:53:00

济宁学院学子在计算机学科竞赛多赛道突围

...家级奖项107项、省部级奖项318项，年均获奖增长率32%，在算法竞技、通信技术、机器人开发、网络安全等多赛道实现全面突破。获奖名单济宁学院计算机科学与工程学院积极构建“一核

2025-05-20 09:31:00

更多关于科技的资讯：

论知识经济形势下的会计创新

崔楠摘要：在数字化、智能化快速发展的今天，知识经济以知识为核心生产要素、信息技术为驱动、人力资本为关键支撑的特征，对传统会计体系提出了全方位挑战

2026-03-03 07:05:00

节后复工首周平均招聘薪酬前十行业出炉

新年新气象，各行各业都铆足干劲，开局冲刺之势十足。日前智联招聘基于全国就业市场供需数据对春招市场展开监测，连续每周发布《2026年春招市场行情周报》

2026-03-02 23:46:00

百度智能云亮相ISLE 2026 云智一体全面赋能智慧显示产

2026年3月5日至7日，全球极具影响力的视听科技盛会——ISLE国际智慧显示及系统集成展在深圳隆重举办。百度智能云携“云智一体”核心技术与产业解决方案重磅亮相

2026-03-02 22:30:00

开滦山矿公司：“掘进机搭子”上岗掘进支护告别“人抬肩扛”

河北新闻网讯（郝壮）“开启第三个控制手柄，将顶板前端抬起……”近日，在开滦集团唐山矿业公司（简称“开滦山矿公司”）的掘进作业现场

2026-03-02 18:20:00

立标助力消费提质升级上海市消保委呼吁标准建设系统性变革

中国消费者报报道（记者刘浩）2月28日，上海市消费者权益保护委员会、上海市消保基金会联合主办2026年第一期“提振消费维护权益”大讲堂

2026-03-02 18:46:00

海信“智慧风”新品风神空调南京首发

江南时报讯 3月2日，“五星之选封神之作”海信智慧风·风神空调新品发布会在南京京东MALL举行，海信发布“智慧风”系列首款线下产品风神空调

2026-03-02 19:35:00

柠檬豆助力一人公司：数字化转型的新引擎

鲁网3月2日讯随着AI技术的快速迭代，“一人公司”（OPC）作为新型创业形态加速崛起，单人依托智能工具实现“单人成军”

2026-03-02 14:11:00

马力全开！北桥全力冲刺“开门红”

江南时报讯春启新程，奋楫争先。春节假期刚刚落幕，苏州相城经开区北桥街道辖区内各企业陆续按下复工复产“快进键”，生产车间机器轰鸣

2026-03-02 16:35:00

安恒恒脑安全智能体全面对标Claude Code Secur

日前，Anthropic推出Claude Code Security，这款人工智能工具可以扫描代码中的漏洞并提出解决方法

2026-03-02 16:35:00

广西中烟辊压法薄片试验线调试工作正式启动

近日，随着烘后薄片顺利从切丝设备出料，广西中烟工业有限责任公司辊压法薄片试验线完成了干湿混合段、辊压成型段、干燥切丝段等三个工艺段首次带料试车

2026-03-02 16:36:00

首届“紫金光影”微视听创新大赛启动在即

2月27日，在北京国际饭店举办的2026年北京市东城区优化营商环境大会上，首届“紫金光影”微视听创新大赛预热短片同步展示

2026-03-02 15:02:00

工信部：春节9天刷出878.3万TB，5G流量超七成

中国网3月2日讯据工信微报公众号消息，2026年春节，通信业网络运行平稳，国内移动数据流量保持较快增长，国际及港澳台漫游业务持续活跃

2026-03-02 12:25:00

涉未成年人新规3月1日正式实施！首创四类清单，划定红线

网络低俗信息、不当打造“网红儿童”、算法推送不良内容、诱导孩子打赏追星……当前，各类网络信息乱象及平台责任虚化等问题突出

2026-03-02 13:00:00

加快推动人工智能向现实生产力转化厦门人工智能创新生态社区集

在厦门人工智能创新生态社区，具身智能机器人化身“售货员”上岗。厦门网讯（文/图厦门日报记者林露虹）空中成像技术领军企业在此落子

2026-03-02 08:28:00

一季度义乌计划组织超300家次企业赴境外参展 “世界超市”组

浙江日报讯（记者何贤君杜羽丰共享联盟·义乌吴峰宇）北京时间2月26日上午11时（美国东部时间2月25日晚10时）

2026-03-02 08:56:00

头条订阅服务

算法竞赛 │ 图解KMP算法