14. 不修改数组找出重复的数字

本文最后更新于:2025年1月12日 凌晨

问题描述

给定一个长度为 n+1n+1 的数组nums,数组中所有的数均在 1∼n1∼n 的范围内,其中 n≥1n≥1。

请找出数组中任意一个重复的数,但不能修改输入的数组。

样例

1
2
3
给定 nums = [2, 3, 5, 4, 3, 2, 6, 7]。

返回 2 或 3。

思考题:如果只能使用 O(1)O(1) 的额外空间,该怎么做呢?

解决方案:

(分治,抽屉原理)
这道题目主要应用了抽屉原理和分治的思想。

抽屉原理:n+1 个苹果放在 n 个抽屉里,那么至少有一个抽屉中会放两个苹果。

用在这个题目中就是,一共有 n+1 个数,每个数的取值范围是1到n,所以至少会有一个数出现两次。

然后我们采用分治的思想,将每个数的取值的区间[1, n]划分成[1, n/2]和[n/2+1, n]两个子区间,然后分别统计两个区间中数的个数。
注意这里的区间是指 数的取值范围,而不是 数组下标。

划分之后,左右两个区间里一定至少存在一个区间,区间中数的个数大于区间长度。
这个可以用反证法来说明:如果两个区间中数的个数都小于等于区间长度,那么整个区间中数的个数就小于等于n,和有n+1个数矛盾。

因此我们可以把问题划归到左右两个子区间中的一个,而且由于区间中数的个数大于区间长度,根据抽屉原理,在这个子区间中一定存在某个数出现了两次。

依次类推,每次我们可以把区间长度缩小一半,直到区间长度为1时,我们就找到了答案。

复杂度分析

  • 时间复杂度:每次会将区间长度缩小一半,一共会缩小 O(logn)O(logn) 次。每次统计两个子区间中的数时需要遍历整个数组,时间复杂度是 O(n)O(n)。所以总时间复杂度是 O(nlogn)
  • 空间复杂度:代码中没有用到额外的数组,所以额外的空间复杂度是 O(1)。

python实现:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
class Solution(object):
def duplicateInArray(self, nums):
"""
:type nums: List[int]
:rtype int
"""
m = len(nums)
startN = 1 # 列表数值范围最小值
endN = m # 列表数值范围最大值

while startN <= endN:
# midN = (startN+endN) >> 1 # 二分法中间值
midN = (startN+endN) // 2
numbers = 0
for i in range(m):
if (nums[i] <= midN) & (nums[i] >= startN):
numbers += 1
# 关键(midN - startN+1),如果没有重复元素,startN与midN范围间相差的数字个数
if numbers > (midN - startN+1):
startN, endN = startN, midN
else:
startN, endN = midN+1, endN
if startN == endN: # 最后判断数组出现的次数
number = 0
for j in nums:
if j == startN:
number += 1
if number > 1:
return startN
else:
break
return False


def test_dup():
a = Solution()
assert a.duplicateInArray(nums=[1, 2, 2, 3, 4]) == 2

参考资料:

yxc https://www.acwing.com/solution/acwing/content/693/


14. 不修改数组找出重复的数字
https://yance.wiki/14. 不修改数组找出重复的数字/
作者
Yance Huang
发布于
2019年3月8日
许可协议