一道美团算法题，Don E.Knuth 花了 24 小时才解出来！

有趣的算法题 12月前 2.1K

大家好，我是吴师兄。

如果有人问你，计算机算法世界中最伟大的大师是有哪些？

你的答案是什么？

我的答案里面必然会有 Don E.Knuth。

KMP 算法、洗牌算法这些耳熟能详的的牛逼算法就是老爷子的创造，他的经典著作《计算机程序设计艺术》更是被誉为算法中“真正”的圣经。

一般说来，不知道此人的程序员是不可原谅的。

但据说，这位至高神面对 LeetCode 上的一道简单题，却花费了 24 小时才解出来，并且我只见过一个人（注：Keith Amling）用更短时间解出此题。

来源：LeetCode 287 评论区。

这道题目有什么神奇之处呢？

我们今天就来一探究竟！

依旧先给没有见过这道题目的小伙伴补充一下前置知识，LeetCode 第 287 号问题 寻找重复数 讲的是，给定一个包含 n + 1 个整数的数组 nums ，其数字都在 [1, n] 范围内（包括 1 和 n），可知至少存在一个重复的整数。

假设 nums 只有一个重复的整数，这个数可能出现两次或者多次，返回这个重复的数。

题目要求我们必须不修改数组 nums ，并且只用常量级 O(1) 的额外空间。

一眼扫过去，题目很好理解，思路也很容易理清，最直观的想法就是使用哈希表不就能马上查找出重复的整数么？

但再看一眼条件，只能用常量级 O(1) 的额外空间，于是哈希表的思路走不通。

一般的解法是采取二分查找的思路来解决，这里简单给大家介绍一下操作：

1、原始数组 nums 中总共包含了 n + 1 个整数，并且这些整数都在 [1, n] 范围内，那么如果设置 n 个抽屉，1 号抽屉存放 1 号整数、2 号抽屉存放 2 号整数、以此类推，那么总是有一个抽屉会至少存放两个数，这个数就是重复的数。

这个结论来自于抽屉原理：如果每个抽屉代表一个集合，每一个苹果就可以代表一个元素，假如有 n + 1 个元素放到 n 个集合中去，其中必定有一个集合里至少有两个元素。

2、接下来，设置两个指针， left 指向最小值 1，right 指向最大值 nums.length - 1，以上图为例，此时 left = 1 ，right = 4 。

3、取 left 和 right 的中间值 mid = ( left + right ) / 2 ，所有的抽屉被划分为两块区间，[ left , mid ] 和 [ mid + 1 , right ]，如果我们知道重复数字会出现在其中一块区间，那么另外一块区间根本不需要去管，不用再去存放数字。

4、统计原始数组 nums 中小于等于 mid 元素的个数 count，此时发现 count = 3，而 [ left , mid ] 只包含了两个抽屉，那么根据抽屉原理，必然会出现两个数挤在相同的抽屉里面。

5、因此，3 号抽屉、4 号抽屉无需再去考虑，只需要考虑 1 号抽屉、2 号抽屉，到底是哪个抽屉存放了重复的数。

6、此时，抽屉的范围发生了变化，由原来的 [ 1 , 4 ] 变成了 [ 1 , 2 ]，即 left 不变，right 变成了 2。

7、接下来，继续将 left 和 right 的区间划分为两块区间，[ 1 , 1 ] 和 [ 2 , 2 ]，此时，mid = 1 ，统计原始数组 nums 中小于等于 mid 元素的个数 count，发现 count = 1，说明 [ 1 , 1 ]这个区间只有一个抽屉一个整数，那么肯定不存在重复的数，重复的数在 [ 2 , 2 ] 这个区间。

8、此时，抽屉的范围发生了变化，由原来的 [ 1 , 2 ] 变成了 [ 2 , 2 ]，即 right 不变，left 变成了 2。

9、当前区间只有一个抽屉，也就说明是这个抽屉存放了重复的数，抽屉的编号是 2，说明重复的数字就是 2，找到答案了。

代码如下：

class Solution {
    public int findDuplicate(int[] nums) {

        int left = 1 ;

        int right = nums.length - 1 ;

        while ( left < right ) {

            int mid = ( left + right ) / 2 ;

            int count = 0;

            for ( int num : nums) {

                if ( num <= mid ){

                    count++ ;

                }
            }

            if ( count > mid) {

                right = mid ;

            }else{

                left = mid + 1;

            }
        }

        return left;

    }
}

由此，这道题目也就解决了，Don E.Knuth 不至于 24 小时还想不出来吧？

问题出在优化！

二分查找解决的代码时间复杂度是O(nlogn)，在面试的时候，面试官会问：还能不能再优化一下呢？

比如，LeetCode 的留言区就有同学懊恼的记录：今天美团面试考了这道题。作出一个解法以为完事了，结果连着追问好几种，整出翔了。

如果执着于二分查找的思路去优化，答案是无果，优化的方向是使用快慢指针。

具体操作如下：

1、对于原始数组 nums 来说，每个数字都有其对应的唯一索引 index，对于每个 index ，可以将其所对应的数字作为它下一个指向的对象，将这些对象串联为链表的形式。

2、比如先选 index = 0 作为链表的起始位置，那么 index = 0 在原始数组 nums 中的对象是 1 ，因此 0 –> 1 。

3、index = 1 在原始数组 nums 中的对象是 3 ，因此 1 –> 3 ，和前面串联起来就是 0 –> 1 –> 3 。

4、index = 3 在原始数组 nums 中的对象是 2 ，因此 3 –> 2 ，和前面串联起来就是 0 –> 1 –> 3 –> 2 。

5、index = 2 在原始数组 nums 中的对象是 4 ，因此 2 –> 4 ，和前面串联起来就是 0 –> 1 –> 3 –> 2 –> 4 。

6、index = 4 在原始数组 nums 中的对象是 2 ，因此 4 –> 2 ，和前面串联起来就是 0 –> 1 –> 3 –> 2 –> 4 –> 2 。

7、在上述的图中，链表中出现了一个环，因为 index = 3 和 index = 4 的对象 nums[3] 和 nums[4] 都等于 2。

8、链表中环的入口就是那个重复的数，那么这道题目也就变成了寻找环入口的题目。

那就和 LeetCode 第 142 号问题：环形链表II 的解法一模一样了。

1、通过快慢指针的方式，在环中寻找它们的第一次相遇的节点位置

2、当快慢指针相遇的时候：

x 代表从头节点到环形入口节点的节点数（不包含头节点）

y 代表从环形入口到第一次相遇节点的节点数（不包含环形入口节点）

z 代表从第一次相遇节点到环形入口的节点数（不包含第一次相遇节点）

此时，快指针走了 x + y + n (y + z)，其中，x + y 表示快指针第一次到达相遇节点，n 代表快指针在环里面绕了多少圈。

而慢指针走了 x + y 步。

那么就出现了一个等式 x + y = [x + y + n (y + z)] / 2，即x = n（y + z）- y。

n（y + z）- y 代表的含义是一个指针从相遇节点开始出发，走了 n 圈之后回到原来的出发位置，往后退 y 步。

由于 x 代表从头节点到环形入口节点的节点数，并且x = n（y + z）- y，所以n（y + z）- y 代表的含义就是一个指针从相遇节点开始出发，走了 n 圈之后回到原来的出发位置，往后退 y 步来到了环的入口位置。

那么，我们就可以设置两个指针，一个从链表的头节点开始出发，一个指针从相遇节点开始出发，当它们相遇的时候，代表着环的入口节点找到了。

代码如下：

class Solution {
    public int findDuplicate(int[] nums) {

        // 1、通过快慢指针的方式，在环中寻找它们的第一次相遇的节点位置

        // 2、定义一个慢指针，每次只会向前移动 1 步
        int slow = 0;

        slow = nums[slow];

        // 3、定义一个快指针，每次只会向前移动 2 步
        int fast = 0;

        fast = nums[nums[fast]];

        // 4、如果链表有环，那么无论怎么移动，fast 指向的节点都是有值的
        while (slow != fast) {
            // 慢指针每次只会向前移动 1 步
            slow = nums[slow];
            // 快指针每次只会向前移动 2 步
            fast = nums[nums[fast]];
        }

        // 快慢指针相遇，说明有环
        // x 代表从头节点到环形入口节点的节点数（不包含头节点）
        // y 代表从环形入口到第一次相遇节点的节点数（不包含环形入口节点）
        // z 代表从第一次相遇节点到环形入口的节点数（不包含第一次相遇节点）
        // y + z 代表环的节点总数
        // 此时，快指针走了 x + y + n (y + z)
        // 其中，x + y 表示快指针第一次到达相遇节点，n 代表快指针在环里面绕了多少圈
        // 此时，慢指针走了 x + y 步

        // 由于快指针每次走 2 步，所以快慢指针第一次相遇的时候出现一个等式
        // x + y = [x + y + n (y + z)] / 2
        // 即 2 * (x + y) = x + y + n (y + z)
        // 即 x + y = n（y + z）
        // 即 x = n（y + z）- y
        // 我们的目的就是去求 x

        // 定义两个指针，一个指向相遇节点，定义为 b，一个指向链表头节点，定义为 a

        // b 在环中绕圈圈，走了 n（y + z）步会回到原处，即回到相遇节点处
        // 由于 y 代表从环形入口到第一次相遇节点的节点数（不包含环形入口节点）
        // 所以 n（y + z） - y 时，b 到达了环形入口节点位置

        // 由于 x 代表从头节点到环形入口节点的节点数（不包含头节点）
        // 所以 a 走了 x 步时，a 到达了环形入口节点位置

        // 当 x = n（y + z）- y 时，找到了环形入口节点位置
        // 5、开始寻找环入口

        // 定义两个指针，一个指向相遇节点，定义为 b，一个指向链表头节点，定义为 a
        // 一个指向相遇节点，定义为 b
        int b = fast;

        // 一个指向链表头节点，定义为 a
        int a = 0;

        // 让 a 、b 两个指针向前移动，每次移动一步，直到相遇位置
        // 由于有环，必然相遇
        // 当 b 走了 n（y + z） - y 时，b 到达了环形入口节点位置
        // 当 a 走了 x 步时，a 到达了环形入口节点位置
        // a 与 b 相遇
        while (a != b) {
            // a 指针每次只会向前移动 1 步
            a = nums[a];
            // b 指针每次只会向前移动 1 步
            b = nums[b];
        }
        // 6、返回 a 和 b 相遇的节点位置就是环形入口节点位置
        return a;
    }
}

此时，时间复杂度来到了神奇的 O(n) 级别！

对比之前的二分查找解法，时间复杂度发生了质的变化。

太神奇了！

一道美团算法题，Don E.Knuth 花了 24 小时才解出来！

一道美团算法题，Don E.Knuth 花了 24 小时才解出来！

Recommend

Hello panic, goodbye try

Service Weaver

FlexiCore Reference Documentation, APIs and services | Wizzdi

Survey: Consumers Concerned About How Brands Will Keep Their Data Secure in the...

Platypus Finance Unveils Recovery Plan For Users Affected In $9.1m Hack

GitHub - metaloom/video4j-fingerprint: Digital Video Fingerprinting Implementati...

Microsoft Azure Marketplace

Ending design handoff: this is our fight

Java source code could switch to UTF-8 encoding

Is Lido's Sole Reliance on Liquid ETH Staking Worrisome? – CryptoMode

About Joyk