分治算法：分治算法（Divide ans conquer …

分治算法（Divide ans conquer ,D&C）

前言

我之前看算法图解这本书，看他讲分治算法有一个很好的例子，我觉得这个例子让我理解分治的思想。

有一个农场主，想把一块长为168m，宽为64m的土地均匀的分成方块，要求分出的方块尽可能的最大。

1.首先的想法就是想划分一个最大的方块看行不行，以宽64m为边长，肯定是最大的方块。但是这样会剩下

40m的土地无法分割，于是转换思路。

2.把剩下的土地（40*64），在细分，适用于这小块的地方的最大的块也是适用于整块土地。后面这句话不好理解，于是我去查阅了欧几里得算法。

欧几里德算法（Euclidean algorithm），是求最大公约数的一种方法。它的具体做法是：用较大数除以较小数，再用出现的余数（第一余数）去除除数，再用出现的余数（第二余数）去除第一余数，如此反复，直到最后余数是0为止。如果是求两个数的最大公约数，那么最后的除数就是这两个数的最大公约数。直接看下面的例子就懂了:

先看几个概念：

公约数，亦称“公因数”。它是指能同时整除几个整数的数。

公约数中最大的称为最大公约数

求104和40的最大公约数

104 % 40 = 24
40 % 24 = 16
24 % 16 = 8
16 % 8 = 0
结论：8就是104和40的最大公约数

回到划分土地，就转换成了，168和64的最大公约数，如下：

168 % 64 = 40
64 % 40 = 24
40 % 24 = 16
24 % 16 = 8
16 % 8 = 0
结论：8x8是划分的最大的

分治算法的意义

把一个较大的问题分解成几个较小的子问题，然后找到子问题的解决方法之后，再找到合适的方法，把他们组合起来最整个问题的解。

分治法适用的情况

分治法所能解决的问题一般具有以下几个特征：

该问题的规模缩小到一定的程度就可以容易地解决
该问题可以分解为若干个规模较小的相同问题，即该问题具有最优子结构性质。
利用该问题分解出的子问题的解可以合并为该问题的解；
该问题所分解出的各个子问题是相互独立的，即子问题之间不包含公共的子子问题。

第一条特征是绝大多数问题都可以满足的，因为问题的计算复杂性一般是随着问题规模的增加而增加；

第二条特征是应用分治法的前提它也是大多数问题可以满足的，此特征反映了递归思想的应用；、

第三条特征是关键，能否利用分治法完全取决于问题是否具有第三条特征，如果具备了第一条和第二条特征，而不具备第三条特征，则可以考虑用贪心法或动态规划法。

第四条特征涉及到分治法的效率，如果各子问题是不独立的则分治法要做许多不必要的工作，重复地解公共的子问题，此时虽然可用分治法，但一般用动态规划法较好。

分治法的基本步骤

分治法在每一层递归上都有三个步骤：

1.分解：将原问题分解为若干个规模较小，相互独立，与原问题形式相同的子问题；

2.解决：若子问题规模较小而容易被解决则直接解，否则递归地解各个子问题

3.合并：将各个子问题的解合并为原问题的解。

实例

求最大数

# 基本子算法（子问题规模小于等于 2 时）
def get_max(max_list):
    # print(max_list)
    # return max(max_list)  # 这里偷个懒！
    return max_list[0] if max_list[0] > max_list[1] else max_list[1]


# 分治法
def solve2(init_list):
    n = len(init_list)
    if n <= 1:
        return init_list[0]
    if n < 2:  # 若问题规模小于等于 2，解决
        return get_max(init_list)

    # 分解（子问题规模为 n/2）
    left_list, right_list = init_list[:n // 2], init_list[n // 2:]

    # 递归（树），分治
    left_max, right_max = solve2(left_list), solve2(right_list)

    # 合并
    return get_max([left_max, right_max])


if __name__ == "__main__":
    # 测试数据
    test_list = [12, 2, 23, 45, 67, 3, 2, 4, 45, 63, 24, 23]
    # 求最大值
    print(solve2(test_list))  # 67

查找

# 子问题算法（子问题规模为 1）
def is_in_list(init_list, el):
     return [False, True][init_list[0] == el]

# 分治法
def solve(init_list, el):
     n = len(init_list)
     if n == 1:  # 若问题规模等于 1，直接解决
          return is_in_list(init_list, el)

     # 分解（子问题规模为 n/2）
     left_list, right_list = init_list[:n // 2], init_list[n // 2:]

     # 递归（树），分治，合并
     res = solve(left_list, el) or solve(right_list, el)

     return res


if __name__ == "__main__":
     # # 测试数据
     # test_list = [12, 2, 23, 45, 67, 3, 2, 4, 45, 63, 24, 23]
     # # 查找
     # print(solve(test_list, 45))  # True
     # print(solve(test_list, 5))  # F
     print(is_in_list([1,2,3], 1))

找到第n小的数

假定经过一趟分划后，长度为n的原表被分成两个左右两个子表，其中，长度为p的左子表包括主元及其左边的元素，右子表包括主元右边的元素。那么：

若k=p，则主元即为第k小元素；
若k<p ，第k小元素必定在左子表中，需求解的子问题成为在左子表中求第k小元素；
若k>p，则第k小元素必定在右子表中，需求解的子问题成为在右子表中求第k-p小元素。

# 划分（基于主元 pivot），注意：非就地划分
def partition(seq):
    pi = seq[0]  # 挑选主元
    lo = [x for x in seq[1:] if x <= pi]  # 所有小的元素
    hi = [x for x in seq[1:] if x > pi]  # 所有大的元素
    return lo, pi, hi

# 查找第 k 小的元素
def select(seq, k):
    # 分解
    lo, pi, hi = partition(seq)
    print(lo, pi, hi)
    m = len(lo)
    if m == k- 1:
        return pi  # 解决！
    elif m < k:
        return select(hi, k - m - 1)  
    else:
        return select(lo, k)  

if __name__ == '__main__':
    seq = [3, 4, 1, 6, 3, 7, 9, 13, 93, 0, 100, 1, 2, 2, 3, 3, 2]
    print(select(seq, 0))
    print(select(seq, 1))

找到第n大的数

# 划分（基于主元 pivot），注意：非就地划分
def partition(seq):
     pi = seq[0]  # 挑选主元
     lo = [x for x in seq[1:] if x <= pi]  # 所有小的元素
     hi = [x for x in seq[1:] if x > pi]  # 所有大的元素
     return lo, pi, hi

# 查找第 k 小的元素
def select(seq, k):
     # 分解
     lo, pi, hi = partition(seq)
     m = len(hi)
     if m == k - 1:
          return pi  # 解决！
     elif m < k:
          return select(lo, k - m - 1)
     else:
         return select(hi, k) 
if __name__ == '__main__':
     seq = [3, 4, 1, 6, 3, 7, 9, 13, 93, 0, 100, 1, 2, 2, 3, 3, 2]
     print(select(seq, 1))
     print(select(seq, 2))

快速排序

li = [100, 2, 89, 98, 23, 76, 38, 85, 12, 9, 4]


def quick_sort2(li):
    if len(li) < 2:
        return li
    tmp = li[0]
    left_list = [x for x in li[1:] if x < tmp]
    right_list = [x for x in li[1:] if x > tmp]

    return quick_sort2(left_list) + [tmp] + quick_sort2(right_list)


li = quick_sort2(li)
print(li)