老规矩,先来一个最基本的方案。
由于是找最小需要的投接次数,所以可以看作是一个图搜索问题的最短路径问题。
广度优先搜索。
12个人对应12个位置,可以表示为一个数组。
11个球可以标记为0,1,2, ... ,10。空的位置(即当前不持球的人)填入“-1”(可以认为是持有“空球”)(当然其实就用11表示“空球”也可以)。
因此初始状态就是:[0,1,2, ... ,10, -1],而目标状态则是[-1,1,2, ... ,10, 0]。
对于每个人(位置),允许向他投掷球的人(位置)是固定的,可以预先建立一张查找表,比如说:
0: (6,7); 1: (6,7,8); ...; 10: (3,4,5); 11: (4,5);
当然允许投掷的前提是当前这个人未持球(空的)。
这样,问题就转变成从状态出发[0,1,2, ... ,10, -1],在规定的投掷动作要求下到达目标状态[-1,1,2, ... ,10, 0]所需要的最少投掷次数(投掷可以看作是空球”-1”与投掷位置处现有的球的位置交换)。
算法流程如下:
# -*- coding: utf-8 -*-
"""
Created on Thu Oct 28 17:39:51 2021
@author: chenxy
"""
import sys
import time
import datetime
import math
# import random
from typing import List
from collections import deque
import itertools as it
import numpy as np
print(__doc__)
N = 12
start = np.arange(N)
start[-1] = -1 # Indicated that no ball in hand
target = np.arange(N)
target[0] = -1
target[-1] = 0
target = tuple(target)
throw_dict = dict()
throw_dict[0] = (6,7)
throw_dict[1] = (6,7,8)
throw_dict[2] = (7,8,9)
throw_dict[3] = (8,9,10)
throw_dict[4] = (9,10,11)
throw_dict[5] = (10,11)
throw_dict[6] = (0,1)
throw_dict[7] = (0,1,2)
throw_dict[8] = (1,2,3)
throw_dict[9] = (2,3,4)
throw_dict[10]= (3,4,5)
throw_dict[11]= (4,5)
q = deque() # Used as Queue for BFS
visited = set()
q.append((tuple(start),0))
visited.add(tuple(start))
tStart = time.perf_counter()
dbg_cnt = 0
while len(q) > 0:
cur,step = q.popleft()
dbg_cnt += 1
# if dbg_cnt%1000 == 0:
# print('cur={}, step={}'.format(cur,step))
# break
if tuple(cur) == target:
print('Reach the goal!, dbg_cnt = {}'.format(dbg_cnt))
break
c = np.array(cur)
empty = np.where(c==-1)[0][0] # Find where is the empty people
for k in throw_dict[empty]:
# print('empty ={}, throw_set = {}, k={}, cur={}'.format(empty, throw_dict[empty],k,cur))
nxt = c.copy()
nxt[empty] = cur[k]
nxt[k] = -1
if tuple(nxt) not in visited:
visited.add(tuple(nxt))
q.append((tuple(nxt),step+1))
tCost = time.perf_counter() - tStart
print('N={0}, steps = {1}, tCost = {2:6.3f}(sec)'.format(N,step,tCost))
运行结果:
Reach the goal!, dbg_cnt = 14105117
N=12, steps = 37, tCost = 232.754(sec)
一如既往,基本方案非常之慢。
以上代码中追加了个打印信息,关于总共探索了多少个状态节点得信息。从打印结果来看,总共探索了14105117(一千四百万)个状态节点,非常惊人!
有待考虑进一步的优化方案。