假如你對數獨解法感興趣,你可能聽說過精確覆蓋問題。給定全集?X?
和?X?
的子集的集合?Y?
,存在一個 Y 的子集 Y*,使得 Y* 構成 X 的一種分割。
這兒有個Python寫的例子。
X = {1, 2, 3, 4, 5, 6, 7} Y = { 'A': [1, 4, 7], 'B': [1, 4], 'C': [4, 5, 7], 'D': [3, 5, 6], 'E': [2, 3, 6, 7], 'F': [2, 7]}
這個例子的唯一解是['B', 'D', 'F']。
精確覆蓋問題是NP完備(譯注:指沒有任何一個夠快的方法可以在合理的時間內,意即多項式時間 找到答案)。X算法是由大牛高德納發明并實現。他提出了一種高效的實現技術叫舞蹈鏈,使用雙向鏈表來表示該問題的矩陣。
然而,舞蹈鏈實現起來可能相當繁瑣,并且不易寫地正確。接下來就是展示Python奇跡的時刻了!有天我決定用Python來編寫X?
算法,并且我想出了一個有趣的舞蹈鏈變種。
算法
主要的思路是使用字典來代替雙向鏈表來表示矩陣。我們已經有了?Y
。從它那我們能快速的訪問每行的列元素?,F在我們還需要生成行的反向表,換句話說就是能從列中快速訪問行元素。為實現這個目的,我們把X轉換為字典。在上述的例子中,它應該寫為
X = { 1: {'A', 'B'}, 2: {'E', 'F'}, 3: {'D', 'E'}, 4: {'A', 'B', 'C'}, 5: {'C', 'D'}, 6: {'D', 'E'}, 7: {'A', 'C', 'E', 'F'}}
眼尖的讀者能注意到這跟Y的表示有輕微的不同。事實上,我們需要能快速刪除和添加行到每列,這就是為什么我們使用集合。另一方面,高德納沒有提到這點,實際上整個算法中所有行是保持不變的。
以下是算法的代碼。
def solve(X, Y, solution=[]): if not X: yield list(solution) else: c = min(X, key=lambda c: len(X[c])) for r in list(X[c]): solution.append(r) cols = select(X, Y, r) for s in solve(X, Y, solution): yield s deselect(X, Y, r, cols) solution.pop() def select(X, Y, r): cols = [] for j in Y[r]: for i in X[j]: for k in Y[i]: if k != j: X[k].remove(i) cols.append(X.pop(j)) return cols def deselect(X, Y, r, cols): for j in reversed(Y[r]): X[j] = cols.pop() for i in X[j]: for k in Y[i]: if k != j: X[k].add(i)
真的只有 30 行!
格式化輸入
在解決實際問題前,我們需要將輸入轉換為上面描述的格式??梢赃@樣簡單處理
X = {j: set(filter(lambda i: j in Y[i], Y)) for j in X}
但這樣太慢了。假如設 X 大小為 m,Y 的大小為 n,則迭代次數為 m*n。在這例子中的數獨格子大小為 N,那需要 N^5 次。我們有更好的辦法。
X = {j: set() for j in X} for i in Y: for j in Y[i]: X[j].add(i)
這還是 O(m*n) 的復雜度,但是是最壞情況。平均情況下它的性能會好很多,因為它不需要遍歷所有的空格位。在數獨的例子中,矩陣中每行恰好有 4 個條目,無論大小,因此它有N^3的復雜度。
優點
- 簡單:?不需要構造復雜的數據結構,所有用到的結構Python都有提供。
- 可讀性:?上述第一個例子是直接從Wikipedia上的范例直接轉錄下來的!
- 靈活性:?可以很簡單得擴展來解決數獨。
求解數獨
我們需要做的就是把數獨描述成精確覆蓋問題。這里有完整的數獨解法代碼,它能處理任意大小,3×3,5×5,即使是2×3,所有代碼少于100行,并包含doctest?。ǜ兄xWinfried Plappert 和 David Goodger的評論和建議)