LeetCode 692中等堆
前K个高频单词 图解题解
这道题到底在问什么
给定一个单词列表 words 和一个整数 k ,返回前 k 个出现次数最多的单词。 返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率, 按字典顺序 排序。
- words,k
- ["i","love","leetcode","i","love","coding"], 2
- 输出
- ["i","love"]
先想最直接的笨办法
数组/字符串状态条跟着代码走:推进语句是:进入下一轮。处理过的部分不再重新枚举。(动画第 10 步)
最优解:一步一步想明白
- 3下面 9 步动画会按主解代码推进,而不是泛泛讲题型。
- 4先读清 前K个高频单词 的输入输出数组/字符串状态条跟着代码走:先把示例输入映射到代码参数:def topKFrequent(self, words, k):。
- 5cnt = Counter(words)数组/字符串状态条跟着代码走:开局只立住必要变量:cnt = Counter(words)。
- 6开始扫描/递归/弹栈数组/字符串状态条跟着代码走:主流程从这里开始:每轮处理一个状态。
- 7根据题意分情况数组/字符串状态条跟着代码走:题目条件落到这一行:满足条件就进入对应分支。
- 8return sorted(cnt.keys(), key=lambda w: (-cnt[w], w))[:k]数组/字符串状态条跟着代码走:对应代码:return sorted(cnt.keys(), key=lambda w: (-cnt[w], w))[:k]。这一行决定当前轮对答案有什么贡献。
- 9字典序小的在前数组/字符串状态条跟着代码走:边界跟着代码看:先保证特殊输入不会破坏状态。
- 10推进到下一轮数组/字符串状态条跟着代码走:推进语句是:进入下一轮。处理过的部分不再重新枚举。
- 11return sorted(cnt.keys(), key=lambda w: (-cnt[w], w))[:k]数组/字符串状态条跟着代码走:到这里,k 已经能表达题目要求。
- 12return:return sorted(cnt.keys(), key=lambda w: (-cnt[w], w))[:k]数组/字符串状态条跟着代码走:最后检查返回形态:返回值、原地修改或设计类状态,要和 LeetCode 判题方式一致。
- 15记住这题的代码骨架:题意约束先落到状态变量,再用循环或递归维护它。
⚠️ 容易写错的地方
✗ 错:频率相同随便排
✓ 对:字典序小的在前
题目有明确 tie-break
✗ 错:按频率升序
✓ 对:key=(-cnt[word], word)
高频优先
完整代码(Python)
Python
from collections import Counter
class Solution:
def topKFrequent(self, words, k):
cnt = Counter(words)
return sorted(cnt.keys(), key=lambda w: (-cnt[w], w))[:k]复杂度
时间复杂度
O(n + m log m)
m 为不同单词数
空间复杂度
O(m)
频率表
看不够?换成动画再走一遍
上面的推演每一步都对应一帧动画。点开交互动画版,能一步步看着 前K个高频单词 的数据怎么变、指针怎么走,还能切 Python / Java / C++ 跟着练。
面试官可能追问
这道题为什么用「堆」,换最直接的暴力解会差在哪?+
堆抓住了本题的结构特征,把暴力解里重复的工作省掉;暴力解通常要多嵌套一层枚举,数据一大就超时。具体对比见上文「暴力解及其卡点」与「最优解逐步推演」两节。
时间复杂度为什么是 undefined?怎么推出来的?+
按上文复杂度小节的推导,时间复杂度为 undefined。
本平台为独立第三方培训机构,与华为技术有限公司无任何关联;课程的服务内容与权益以购买协议为准,学习效果因个人情况而异。「华为 OD」「华为可信」等仅为对岗位与考试方向的客观描述,相关商标归各自权利人所有。