贪心算法

基本介绍

  1. 贪婪算法(贪心算法)是指在对问题进行求解时,在每一步选择中都采取最好或者最优(即最有利)的选择,从而希望能够导致结果是最好或者最优的算法
  2. 贪婪算法所得到的结果不一定是最优的结果(有时候会是最优解),但是都是相对近似(接近)最优解的结果

贪心算法最佳应用-集合覆盖

假设存在如下表的需要付费的广播台,以及广播台信号可以覆盖的地区。 如何选择最少的广播台,让所有的地区

都可以接收到信号。

广播台 覆盖地区
K1 “北京”, “上海”, “天津”
K2 “广州”, “北京”, “深圳”
K3 “成都”, “上海”, “杭州”
K4 “上海”, “天津”
K5 “杭州”, “大连”

思路分析

如何找出覆盖所有地区的广播台的集合呢,使用穷举法实现,列出每个可能的广播台的集合,这被称为幂集。假设总的有n个广播台,则广播台的组合总共有2ⁿ -1 个,假设每秒可以计算10个子集,则

广播台数目 子集总数 需要时间
5 32 3.2秒
10 1024 102.4秒
32 4294967296 13.6年
100 1.26x100³º 4x10²³年

使用贪心算法:目前并没有算法可以快速计算得到准备的值, 使用贪心算法,则可以得到非常接近的解,并且效率高。

选择策略上,因为需要覆盖全部地区的最小集合:

  1. 建立一个集合存放所有地区。
  2. 遍历所有的广播电台, 找到一个覆盖了最多未覆盖的地区的电台(此电台可能包含一些已覆盖的地区,但没有关系)。
  3. 将这个电台加入到一个集合中(比如ArrayList),把该电台覆盖的地区从存放地区的集合中删除。
  4. 重复第2步和第3步直到覆盖了全部的地区。

代码实现

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
package com.nanzx.greedy;

import java.util.ArrayList;
import java.util.HashMap;
import java.util.HashSet;

public class GreedyAlgorithm {

public static void main(String[] args) {
// 创建广播电台,放入到Map
HashMap<String, HashSet<String>> broadcasts = new HashMap<String, HashSet<String>>();
// 将各个电台放入到broadcasts
HashSet<String> hashSet1 = new HashSet<String>();
hashSet1.add("北京");
hashSet1.add("上海");
hashSet1.add("天津");

HashSet<String> hashSet2 = new HashSet<String>();
hashSet2.add("广州");
hashSet2.add("北京");
hashSet2.add("深圳");

HashSet<String> hashSet3 = new HashSet<String>();
hashSet3.add("成都");
hashSet3.add("上海");
hashSet3.add("杭州");

HashSet<String> hashSet4 = new HashSet<String>();
hashSet4.add("上海");
hashSet4.add("天津");

HashSet<String> hashSet5 = new HashSet<String>();
hashSet5.add("杭州");
hashSet5.add("大连");

// 加入到map
broadcasts.put("K1", hashSet1);
broadcasts.put("K2", hashSet2);
broadcasts.put("K3", hashSet3);
broadcasts.put("K4", hashSet4);
broadcasts.put("K5", hashSet5);

// allAreas 存放所有的地区
HashSet<String> allAreas = new HashSet<String>();
allAreas.add("北京");
allAreas.add("上海");
allAreas.add("天津");
allAreas.add("广州");
allAreas.add("深圳");
allAreas.add("成都");
allAreas.add("杭州");
allAreas.add("大连");

// 创建ArrayList, 存放选择的电台集合
ArrayList<String> selects = new ArrayList<String>();

// 临时集合,在遍历的过程中,存放遍历过程中的电台覆盖的地区和当前还没有覆盖的地区的交集
HashSet<String> tempSet = new HashSet<String>();
// 存放max对应的地区和当前还没有覆盖的地区的交集
HashSet<String> maxSet = new HashSet<String>();
String max = null;// 指向覆盖了最多未覆盖的地区的电台

while (allAreas.size() != 0) {
max = null;

for (String key : broadcasts.keySet()) {// 遍历电台
tempSet.clear();
maxSet.clear();

HashSet<String> areas = broadcasts.get(key);
tempSet.addAll(areas);
tempSet.retainAll(allAreas);// 此时tempSet存放的就是交集
if (max != null) {
maxSet.addAll(broadcasts.get(max));
maxSet.retainAll(allAreas);
}
if (tempSet.size() > 0 && (maxSet == null || tempSet.size() > maxSet.size())) {
max = key;
maxSet.addAll(broadcasts.get(max));
maxSet.retainAll(allAreas);
}
}
if (maxSet != null) {
selects.add(max);
allAreas.removeAll(maxSet);
}
}

System.out.println("得到的选择结果是" + selects);// [K1,K2,K3,K5]
}
}

注意事项

  • 贪婪算法所得到的结果不一定是最优的结果(有时候会是最优解),但是都是相对近似(接近)最优解的结果
  • 比如上题的算法选出的是K1, K2, K3, K5,符合覆盖了全部的地区
  • 但是我们发现 K2, K3, K4, K5 也可以覆盖全部地区,如果K2 的使用成本低于K1,那么我们上题的 K1, K2, K3, K5 虽然是满足条件,但是并不是最优的