算法-- KMP

2022-11-16 03:51:34 网站UI设计 ℃

　　百度百科定义：KMP算法是一种改进的字符串匹配算法，由D.E.Knuth，J.H.Morris和V.R.Pratt提出的，因此人们称它为克努特—莫里斯—普拉特操作（简称KMP算法）。KMP算法的核心是利用匹配失败后的信息，尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是通过一个next()函数实现，函数本身包含了模式串的局部匹配信息。KMP算法的时间复杂度O(m+n)。问题定义先说说要解决什么问题，就是在一个字符串中查找是否包含另一个字符串，如果包含就返回子字符串开始位置的小标，如果不包含就返回-1 分析问题假设长的字符串为str1，长度为N，需要在str1里寻找str2是否存在，str2长度为M。首先想到的最简单的办法，就是从字符串中的0位置开始遍历，是否和字符串中的字符相等，如果不相等，就从下一个字符开始比较，时间复杂度是O（N*M）。那是否有O（N）的解法了，那就是KMP算法了。解决问题 KMP的核心是先知道最长前缀和最长后缀的概念了。最长前缀和最长后缀先介绍下最长前缀和最长后缀是什么意思，先举例：字符串"abaabc"中字符c的最长前缀和最长后缀的长度为2, 值为ab，前缀就是从头开始算，后缀是c的前几个字符，前缀和后缀是相等的。所以说"abaabc"的最长前缀和最长后缀数组为[-1, 0, 0 , 1, 1, 2]（第0个位置和第1个位置比较特殊，定为-1和0），就就是KMP中的next数组，这里我们先把KMP的流程讲明白，再来说这个next数组怎么求解。 KMP流程这里先要求解出str2的next数组。第一步，还是要遍历字符串进行对比第二步，如果有一个字符不相等，按照原始方法是把i1变成1的位置，i2从0位置开始遍历。正是因为我们有next数组，我们可以i1不动，i2移动到该字符的最大前缀处和i1位置进行比较，直到有一个字符串遍历完成。看下代码 public int indexOf(String str1, String str2) {char[] str1Char = str1.toCharArray();char[] str2Char = str2.toCharArray();int i1 = 0;int i2 = 0;int[] next = getNext(str2Char);while (i1 <= str1Char.length - 1 && i2 <= str2Char.length - 1) {//如果相等，就比较下一个位置if (str1Char[i1] == str2Char[i2]) {++i1;++i2;} else if (next[i2] == -1) {//如果是-1，说明是第0个位置，那么直接从i1的第一个位置开始++i1;} else {//如果不相等又不是第0个位置，则从最长前缀的位置开始i2 = next[i2];}} return i2 == str2Char.length ? i1 - i2 : -1;}next数组 next数组第0个位置和第1个位置比较特殊，定为-1和0，从第2个开始算起。假如现在的位置在i，i位置的最大前缀是可以通过i-1算的，这里分两种情况。第一种情况，第i-1个位置如果等于第i-1个位置的最大前缀的位置，那么第i位置的前缀长度就是第i-1个位置的最大前缀+1 第二种情况，如果不相等，位置就跳到前缀的前缀去比较，直到0 代码 public int[] getNext(char[] str) {if (str.length == 1) {return new int[] {-1};}int[] next = new int[str.length];next[0] = -1;next[1] = 0;int i = 2;int pre = 0;while (i < next.length) {if (str[i - 1] == str[pre]) {next[i++] = ++pre;} else if (pre > 0) {pre = next[pre];} else {next[i++] = 0;}}return next;}这些就是KMP算法的全部内容了，就是通过next数组来减少比较的次数。希望对大家有所帮助，有帮助记得点赞哦！可以下，后面持续分享编程类的文章，谢谢！