美团二面算法 之 串联所有单词的子串[困难]
最佳答案 问答题库788位专家为你答疑解惑
优质博文:IT-BLOG-CN
一、题目
给定一个字符串s
和一个字符串数组words
。words
中所有字符串长度相同。s
中的串联子串是指一个包含words
中所有字符串以任意顺序排列连接起来的子串。
例如,如果
words = ["ab","cd","ef"]
, 那么abcdef
,abefcd
,cdabef
,cdefab
,efabcd
,和efcdab
都是串联子串。acdbef
不是串联子串,因为他不是任何words
排列的连接。
返回所有串联子串在s
中的开始索引。你可以以任意顺序返回答案。
示例 1:
输入:s = "barfoothefoobarman", words = ["foo","bar"]
输出:[0,9]
解释:因为words.length == 2
同时words[i].length == 3
,连接的子字符串的长度必须为6
。子串barfoo
开始位置是0
。它是words
中以["bar","foo"]
顺序排列的连接。子串foobar
开始位置是9
。它是words
中以["foo","bar"]
顺序排列的连接。输出顺序无关紧要。返回[9,0]
也是可以的。
示例 2:
输入:s = "wordgoodgoodgoodbestword", words = ["word","good","best","word"]
输出:[]
解释:因为words.length == 4
并且words[i].length == 4
,所以串联子串的长度必须为16
。s
中没有子串长度为16
并且等于words
的任何顺序排列的连接。所以我们返回一个空数组。
示例 3:
输入:s = "barfoofoobarthefoobarman", words = ["bar","foo","the"]
输出:[6,9,12]
解释:因为words.length == 3
并且words[i].length == 3
,所以串联子串的长度必须为9
。
子串foobarthe
开始位置是6
。它是words
中以["foo","bar","the"]
顺序排列的连接。
子串barthefoo
开始位置是9
。它是words
中以["bar","the","foo"]
顺序排列的连接。
子串thefoobar
开始位置是12
。它是words
中以["the","foo","bar"]
顺序排列的连接。
::: warning
1 <= s.length <= 104
1 <= words.length <= 5000
1 <= words[i].length <= 30
words[i]
和s
由小写英文字母组成
:::
二、代码
思路: 记words
的长度为m
,words
中每个单词的长度为n
,s
的长度为ls
。首先需要将s
划分为单词组,每个单词的大小均为n
(首尾除外)。这样的划分方法有n
种,即先删去前i(i=0∼n−1)
个字母后,将剩下的字母进行划分,如果末尾有不到n
个字母也删去。对这n
种划分得到的单词数组分别使用滑动窗口对words
进行类似于「字母异位词」的搜寻。
划分成单词组后,一个窗口包含s
中前m
个单词,用一个哈希表differ
表示窗口中单词频次和words
中单词频次之差。初始化differ
时,出现在窗口中的单词,每出现一次,相应的值增加1
,出现在words
中的单词,每出现一次,相应的值减少1
。然后将窗口右移,右侧会加入一个单词,左侧会移出一个单词,并对differ
做相应的更新。窗口移动时,若出现differ
中值不为0
的键的数量为0
,则表示这个窗口中的单词频次和words
中单词频次相同,窗口的左端点是一个待求的起始位置。划分的方法有n
种,做n
次滑动窗口后,即可找到所有的起始位置。
class Solution {public List<Integer> findSubstring(String s, String[] words) {// 1、先确定s串的首字母是words中的某个单子的首字母,所以要遍历一个 word 长度的循环;// 2、将s串,按照 words 的长度,拆分成一组单词,存放值 Map 中;// 3、根据 words 中的单词,对 Map中的数据进行 -1;// 4、开始移动s串中的单子,不符合时 右边添加一个单词,左边移除一个单词,如果 Map为空时,说明是符合要求,将下表添加至列表中List<Integer> res = new ArrayList<Integer>();if (words.length == 0) {return res;}int m = words.length, n = words[0].length(), ls = s.length();for (int i = 0; i < n; i++) {// 如果单子的长度已经超出了ls的长度,就可以直接返回了if (i + m * n > ls) {return res;}Map<String, Integer> differ = new HashMap<String, Integer>();for (int j = 0; j < words.length; j++) {// 需要 i 的参与String word = s.substring(i + j * n, i + (j + 1) * n);differ.put(word, differ.getOrDefault(word, 0) + 1);}for (String word: words) {differ.put(word, differ.getOrDefault(word, 0) - 1);if (differ.getOrDefault(word, 0) == 0) {differ.remove(word);}}// 滑动 s 串 难点【每次滑动一个单词】for (int start = i; start < ls - m * n + 1; start += n) {// 开始移动,先删除掉最左边的单词if (start != i) {String word = s.substring(start - n , start);differ.put(word, differ.getOrDefault(word, 0) - 1);if (differ.getOrDefault(word, 0) == 0) {differ.remove(word);}// 添加右边元素,我们需要 - n 而不是1,因为是以word为单位的word = s.substring(start + (m-1) * n, start + m * n);differ.put(word, differ.getOrDefault(word, 0) + 1);if (differ.getOrDefault(word, 0) == 0) {differ.remove(word);}}// 判断如果满足条件,将start存入返回值中if (differ.isEmpty()) {res.add(start);}}}return res;}
}
时间复杂度: O(ls×n)
其中ls
是输入s
的长度,n
是words
中每个单词的长度。需要做n
次滑动窗口,每次需要遍历一次s
。
空间复杂度: O(m×n)
其中m
是words
的单词数,n
是words
中每个单词的长度。每次滑动窗口时,需要用一个哈希表保存单词频次。
99%的人还看了
相似问题
猜你感兴趣
版权申明
本文"美团二面算法 之 串联所有单词的子串[困难]":http://eshow365.cn/6-20921-0.html 内容来自互联网,请自行判断内容的正确性。如有侵权请联系我们,立即删除!