当前位置：首页 > 编程笔记 > 正文

已解决

275. H 指数 II : 丝滑过渡，从线性到对数，从前置题到本题

来自网友在路上 195895提问提问时间：2023-10-30 18:06:53阅读次数： 95

最佳答案问答题库958位专家为你答疑解惑

题目描述

这是 LeetCode 上的 「275. H 指数 II」 ，难度为 「中等」。

Tag : 「二分」、「数学」

给你一个整数数组 citations，其中 citations[i] 表示研究者的第 i 篇论文被引用的次数，citations 已经按照 **升序排列 **。计算并返回该研究者的 h 指数。

h 指数的定义：h 代表“高引用次数”（high citations），一名科研人员的 h 指数是指他（她）的（n 篇论文中）总共有 h 篇论文分别被引用了至少 h 次。

请你设计并实现对数时间复杂度的算法解决此问题。

示例 1：

输入：citations = [0,1,3,5,6]

输出：3 

解释：给定数组表示研究者总共有 5 篇论文，每篇论文相应的被引用了 0, 1, 3, 5, 6 次。
     由于研究者有 3 篇论文每篇 至少 被引用了 3 次，其余两篇论文每篇被引用 不多于 3 次，所以她的 h 指数是 3 。

示例 2：

输入：citations = [1,2,100]

输出：2

提示：

citations 按升序排列

与前置题关系

本题与前置题 274. H 指数的不同，主要体现在两个方面：

数据范围不同：在 274. H 指数里的范围为，而本题的范围为；
数组是否有序：在 274. H 指数中数组不确保有序，本题则是有序。

增加了数组有序特性，又扩大了数据范围。

容易联想，利用此特性，存在复杂度更低的算法。

基本分析

为了方便，将 citations 记为 cs。

所谓的 h 指数是指一个具体的数值，「该数值为“最大”的满足「至少发表了 x 篇论文，且每篇论文至少被引用 x 次」定义的合法数，重点是“最大”」。

用题面的实例来举个 🌰，给定所有论文的引用次数情况为 cs = [0,1,3,5,6]，可统计满足定义的数值有哪些：

，含义为「至少发表了篇，且这篇论文至少被引用次」，空集即满足，恒成立；
，含义为「至少发表了篇，且这篇论文至少被引用次」，可以找到这样的组合，如 [1]，成立；
，含义为「至少发表了篇，且这篇论文至少被引用次」，可以找到这样的组合，如 [3, 5]，成立；
，含义为「至少发表了篇，且这篇论文至少被引用次」，可以找到这样的组合，如 [3, 5, 6]，成立；
，含义为「至少发表了篇，且这篇论文至少被引用次」，找不到这样的组合，不成立；
...

实际上，「当遇到第一个无法满足的数时，更大的数值就没必要找了」。一个简单的推导：

至少出现次的论文数不足篇 => 至少出现次的论文必然不足篇 => 至少出现次的论文必然不足篇（即更大的不满足）。

计数

首先，「仍能使用「计数」的方式进行求解，该求解为线性复杂度，且不要求数组有序」。

根据分析，最大的 h 不超过。

假设我们预处理出引用次数所对应的论文数量 cnt，其中 cnt[a] = b 含义为引用次数 「恰好」 为 a 的论文数量有 b 篇。

那么再利用 h 是“最大”的满足定义的合法数，我们从开始往前找，找到的第一个满足条件的数，即是答案。

具体的，创建 cnt 数组，对 cs 进行计数，由于最大 h 不超过，因此对于引用次数超过的论文，可等价为引用次数为，即有计数逻辑 cnt[min(c, n)]++。

再根据处理好的 cnt，从开始倒序找 h。

由于我们处理的 cnt[a] 含义为引用次数 「恰好」 为 a，但题目定义则是 「至少」。同时「至少出现次」的集合必然慢「至少出现次」要求（子集关系），我们可以使用变量 tot，对处理过的 cnt[i] 进行累加，从而实现从 「恰好」 到 「至少」 的转换。

Java 代码：

class Solution {
    public int hIndex(int[] cs) {
        int n = cs.length;
        int[] cnt = new int[n + 10];
        for (int c : cs) cnt[Math.min(c, n)]++;
        for (int i = n, tot = 0; i >= 0; i--) {
            tot += cnt[i];
            if (tot >= i) return i;
        }
        return -1; // never
    }
}

C++ 代码：

class Solution {
public:
    int hIndex(vector<int>& cs) {
        int n = cs.size();
        vector<int> cnt(n + 10, 0);
        for (int c : cs) cnt[min(c, n)]++;
        for (int i = n, tot = 0; i >= 0; i--) {
            tot += cnt[i];
            if (tot >= i) return i;
        }
        return -1; // never
    }
};

Python 代码：

class Solution:
    def hIndex(self, cs: List[int]) -> int:
        n = len(cs)
        cnt = [0] * (n + 10)
        for c in cs:
            cnt[min(c, n)] += 1
        tot = 0
        for i in range(n, -1, -1):
            tot += cnt[i]
            if tot >= i:
                return i
        return -1  # never

TypeScript 代码：

function hIndex(cs: number[]): number {
    const n = cs.length;
    const cnt = new Array(n + 10).fill(0);
    for (let c of cs) cnt[Math.min(c, n)]++;
    for (let i = n, tot = 0; i >= 0; i--) {
        tot += cnt[i];
        if (tot >= i) return i;
    }
    return -1; // never
};

时间复杂度：
空间复杂度：

二分答案（线性 `check`）

除了线性复杂度的「计数」做法，我们还容易想到「二分」。

其中「最容易想到的是「二分答案」，该做法复杂度为，同样并不要求数组有序。」

我们发现对于任意的 cs（论文总数量为该数组长度），都必然对应了一个最大的 h 值，且小于等于该 h 值的情况均满足，大于该 h 值的均不满足。

那么，在以最大 h 值为分割点的数轴上具有「二段性」，可通过「二分」求解该分割点（答案）。

最后考虑在什么值域范围内进行二分？

一个合格的二分范围，仅需确保答案在此范围内即可。

再回看我们关于 h 的定义「至少发表了 x 篇论文，且每篇论文至少被引用 x 次」，满足条件除了引用次数，还有论文数量，而总的论文数量只有，因此最大的 h 只能是本身，而不能是比大的数，否则论文数量就不够了。

综上，我们只需要在范围进行二分即可。对于任意二分值 mid，只需线性扫描 cs 即可知道其是否合法。

Java 代码：

class Solution {
    public int hIndex(int[] cs) {
        int n = cs.length;
        int l = 0, r = n;
        while (l < r) {
            int mid = l + r + 1 >> 1;
            if (check(cs, mid)) l = mid;
            else r = mid - 1;
        }
        return r;
    }
    boolean check(int[] cs, int mid) {
        int ans = 0;
        for (int i : cs) if (i >= mid) ans++;
        return ans >= mid;
    }
}

C++ 代码：

class Solution {
public:
    int hIndex(vector<int>& cs) {
        int n = cs.size();
        int l = 0, r = n;
        while (l < r) {
            int mid = (l + r + 1) / 2;
            if (check(cs, mid)) l = mid;
            else r = mid - 1;
        }
        return r;
    }
    bool check(vector<int>& cs, int x) {
        int cnt = 0;
        for (int c : cs) {
            if (c >= x) cnt++;
        }
        return cnt >= x;
    }
};

Python 代码：

class Solution:
    def hIndex(self, cs: List[int]) -> int:
        n = len(cs)
        l, r = 0, n
        while l < r:
            mid = (l + r + 1) // 2
            if sum(c >= mid for c in cs) >= mid:
                l = mid
            else:
                r = mid - 1
        return r

TypeScript 代码：

function hIndex(cs: number[]): number {
    const check = function (cs: number[], x: number): boolean {
        let cnt: number = 0;
        for (let c of cs) {
            if (c >= x) cnt++;
        }
        return cnt >= x;
    }
    const n = cs.length;
    let l = 0, r = n;
    while (l < r) {
        const mid = Math.floor((l + r + 1) / 2);
        if (check(cs, mid)) l = mid;
        else r = mid - 1;
    }
    return r;
};

时间复杂度：对做二分，复杂度为； check 函数需要对数组进行线性遍历，复杂度为。整体复杂度为
空间复杂度：

二分下标（根据与关系）

在上述二分中，我们没有利用本题的「数组有序」的特性。

根据对 h 定义，若升序，我们可推导出：

在最大的符合条件的分割点的右边（包含分割点），必然满足
在最大的符合条件的分割点的左边，必然不满足

因此，我们可以利用 「分割点右边数的个数与分割点的大小关系进行二分」 。

假设存在真实分割点下标，其值大小为，分割点右边的数值个数为，根据 H 指数 的定义，必然有关系：

在分割点的右边：非严格单调递增，数的个数严格单调递减，仍然满足关系；
在分割点的左边：非严格单调递减，数的个数严格单调递增，作为真实分割点，必然不满足关系。

利用此「二段性」进行二分即可，二分出下标后，再计算出数的个数。

Java 代码：

class Solution {
    public int hIndex(int[] cs) {
        int n = cs.length;
        int l = 0, r = n - 1;
        while (l < r) {
            int mid = l + r >> 1;
            if (cs[mid] >= n - mid) r = mid;
            else l = mid + 1;
        }
        return cs[r] >= n - r ? n - r : 0;
    }
}

C++ 代码：

class Solution {
public:
    int hIndex(vector<int>& cs) {
        int n = cs.size();
        int l = 0, r = n - 1;
        while (l < r) {
            int mid = l + r >> 1;
            if (cs[mid] >= n - mid) r = mid;    
            else l = mid + 1;
        }
        return cs[r] >= n - r ? n - r : 0;
    }
};

Python 代码：

class Solution:
    def hIndex(self, cs: List[int]) -> int:
        n = len(cs)
        l, r = 0, n - 1
        while l < r:
            mid = l + r >> 1
            if cs[mid] >= n - mid:
                r = mid
            else:
                l = mid + 1
        return n - r if cs[r] >= n - r else 0

TypeScript 代码：

function hIndex(cs: number[]): number {
    const n = cs.length;
    let l = 0, r = n - 1;
    while (l < r) {
        const mid = l + r >> 1;
        if (cs[mid] >= n - mid) r = mid;
        else l = mid + 1;
    }
    return cs[r] >= n - r ? n - r : 0;
};

时间复杂度：
空间复杂度：

最后

这是我们「刷穿 LeetCode」系列文章的第 No.275 篇，系列开始于 2021/01/01，截止于起始日 LeetCode 上共有 1916 道题目，部分是有锁题，我们将先把所有不带锁的题目刷完。

在这个系列文章里面，除了讲解解题思路以外，还会尽可能给出最为简洁的代码。如果涉及通解还会相应的代码模板。

为了方便各位同学能够电脑上进行调试和提交代码，我建立了相关的仓库：https://github.com/SharingSource/LogicStack-LeetCode 。

在仓库地址里，你可以看到系列文章的题解链接、系列文章的相应代码、LeetCode 原题链接和其他优选题解。

更多更全更热门的「笔试/面试」相关资料可访问排版精美的合集新基地 🎉🎉

本文由 mdnice 多平台发布

查看全文

99%的人还看了

相似问题

猜你感兴趣

版权申明

本文"275. H 指数 II : 丝滑过渡，从线性到对数，从前置题到本题"：http://eshow365.cn/6-27932-0.html 内容来自互联网，请自行判断内容的正确性。如有侵权请联系我们，立即删除！

上一篇: API安全之《大话：API的前世今生》
下一篇: SM3加密udf

晴海小常识分享

晴海小常识分享

275. H 指数 II : 丝滑过渡，从线性到对数，从前置题到本题

最佳答案问答题库958位专家为你答疑解惑

题目描述

与前置题关系

基本分析

计数

二分答案（线性 `check`）

二分下标（根据与关系）

最后

99%的人还看了

相似问题

猜你感兴趣

版权申明

推荐回答

晴海小常识分享

晴海小常识分享

275. H 指数 II : 丝滑过渡，从线性到对数，从前置题到本题

最佳答案 问答题库958位专家为你答疑解惑

题目描述

与前置题关系

基本分析

计数

二分答案（线性 check）

二分下标（根据与 关系）

最后

99%的人还看了

相似问题

猜你感兴趣

版权申明

推荐回答

最佳答案问答题库958位专家为你答疑解惑

二分答案（线性 `check`）

二分下标（根据与关系）