岳父大人拿来一张去年的报纸,说有一道很难做的益智题,让我看看,就是下图中的题目:
如果这是一道正常的益智题,岳父大人既然做不出来,我是肯定做不出来的。不过看过题目后,我觉得这个题目就是一个典型的编程作业。把编程作业当作益智题,显然是个恶作剧了。下面我简单介绍一下如何编程求解这道题目。
问题很简单:找一条从点(1)走到点(3)的路径,初始值2011经过沿途的计算后,在点(3)得到2012。可以转圈走,但不能走回头路。即从点A走到点B后,不能立刻从点B走回点A。
程序员解题的第一步就是从适合编程的角度重新描述问题。这道题虽然看上去只有3个点,但考虑到下一步可以走的路,在同一个点会有多个状态。例如:如果从(+7)走到点(2),下一步可以走(+7)以外的3条路;如果从(/2)走到点(2),下一步可以走(/2)以外的3条路。因此,我们可以区分出以下状态:
状态 | 说明 |
(1.0) | 从点(1)出发 |
(1.7) | 从(+7)到点(1) |
(1.2) | 从(/2)到点(1) |
(2.7) | 从(+7)到点(2) |
(2.2) | 从(/2)到点(2) |
(2.3) | 从(*3)到点(2) |
(2.5) | 从(-5)到点(2) |
(3.3) | 从(*3)到点(3) |
(3.5) | 从(-5)到点(3) |
在区分出所有状态后,我们就可以根据题目的约束条件画出状态的转移图:
在有了这张有向图后,我们就可以重新描述问题:从点(1.0)出发,遍历这张图的所有路径。在点(3.3)和(3.5)检查当前路径是否满足要求。满足则停止,不满足就接着走。有向图只是给出了路径的约束条件,我们要遍历的所有路径显然会构成了一棵树:
我们从上到下、从左到右遍历这棵树,找到符合条件的节点:这个节点的状态应该是(3.3)或(3.5),值是2012。如果这是一个编程作业,这个作业的题目应该是“树的按层次遍历”或者“树的广度优先搜索”。我写了一个小程序算了一下,我搜索了2千万个节点,只找到了一条符合条件的路径:
2011+7=2018 2018/2=1009 1009+7=1016 1016/2=508 508+7=515 515-5=510 510*3=1530 1530/2=765
765+7=772 772/2=386 386+7=393 393*3=1179 1179-5=1174 1174/2=587 587+7=594 594/2=297
297+7=304 304-5=299 299*3=897 897-5=892 892*3=2676 2676/2=1338 1338+7=1345 1345-5=1340
1340*3=4020 4020/2=2010 2010+7=2017 2017-5=2012
在搜索到这条路径时,程序已经遍历到路径树的第29层,访问到第165278个节点。显然这道题不适合用手工推导。
在编程实现时,我们首先做的是区分可以复用的部分和应用特定的部分。在这个问题中,可以复用的部分就是“树的按层次遍历”。应用特定部分就是这道题目的描述了。
实现“树的按层次遍历”的思路很简单。就是按层次构建树,在构建的同时完成遍历。每一层的节点可以用一个vector保存。如果我们不用回溯经过的路径,那就只要保存最后一层节点就可以了。这个问题需要回溯路径,所以我们需要保存每层节点。每个节点还要有一个指向parent的指针。这样在找到期望节点后,我们就可以从下向上回溯出经过的路径。回溯时将可以节点压栈,这样再取出后就是由上到下的顺序了。
与现实世界一样,我们在编程时总是面临各种选择。在节点类型上,我要选择是通过模板还是接口实现。我选择了传统的接口实现:即定义一个节点接口CNode给遍历算法CTreeLayeredTraverse使用。应用程序可以从节点接口派生自己的节点类,增加特定于应用的数据和逻辑。CNode和CTreeLayeredTraverse的声明如下:
class CNode {
public:
// 取节点的第一个子节点。如果没有子节点,返回NULL,否则返回指向子节点的指针
virtual CNode * GetFirstChild() const = 0;
// 取节点的下一个兄弟节点。如果没有下一个兄弟节点,返回false,否则返回true
virtual CNode * GetNextBrother() const = 0;
// 在创建节点后调用。如果返回false,就停止树的构建
virtual bool AfterCreateNode(const CTreeLayeredTraverse &tree) const = 0;
void SetParent(CNode *parent) {m_parent = parent;}
const CNode * GetParent() const {return m_parent;}
protected:
const CNode *m_parent;
};
typedef std::vector CLayer;
typedef std::vector CLayeredTree;
typedef std::stack CNodeStack;
// 在按层次创建树的同时实现树的按层次遍历,即从上到下,从左到右
class CTreeLayeredTraverse {
public:
CTreeLayeredTraverse(CNode *root);
~CTreeLayeredTraverse();
static unsigned int MaxNodeNum;
static unsigned int MaxLayerNum;
// 创建并遍历树。当以下情况之一发生时会停止创建:
// 1. 某一层的所有节点都没有子节点
// 2. AfterCreateNode返回false
// 3. 已创建节点数量超过MaxNodeNum
// 4. 已创建层数超过MaxLayerNum
void CreateAndTraverse();
// 通过栈返回从根节点到指定节点的路径
void GetPath(const CNode *pNode, CNodeStack &path) const;
private:
CLayeredTree m_tree;
unsigned int m_node_num; // 记录已创建节点数
bool AddNode(CLayer *pLayer, CNode * pNode, CNode * pParent); // helper函数
};
在使用vector和stack时,如果不用指针,在离开变量作用域时,模板库就会自动释放内存。但在这个问题里,因为CNode是虚类,模板库不知道对象的实际大小,无法分配内存,所以只能用指针。这样我们就需要在析构函数里自己释放对象。当节点数量很大时,这个析构函数相当耗时。如果是现实项目,这个地方还需要优化。
CTreeLayeredTraverse::~CTreeLayeredTraverse()
{
CLayeredTree::iterator layer_pos;
CLayer::iterator node_pos;
for (layer_pos = m_tree.begin(); layer_pos != m_tree.end(); ++layer_pos) {
for (node_pos = (*layer_pos)->begin(); node_pos != (*layer_pos)->end(); node_pos++) {
delete (*node_pos);
}
delete (*layer_pos);
}
}
构造函数创建树的第一层。第一层只有一个根节点:
CTreeLayeredTraverse::CTreeLayeredTraverse(CNode *root)
{
CLayer *pLayer = new CLayer;
root->SetParent(NULL);
pLayer->push_back(root);
m_tree.push_back(pLayer);
m_node_num = 1;
}
在实际编码时,我在写完CNode和CTreeLayeredTraverse的声明后,就开始写应用逻辑了,即所谓面向接口编程和测试驱动开发。尽早让程序可以编译、运行,就可以尽早发现早期设计的缺陷,避免返工。这里为了叙述方便,我先介绍CTreeLayeredTraverse的实现。CreateAndTraverse在按层次构建树的同时遍历树的节点。在实现上就是找到前一层中每个节点的子节点放到新层的vector中。
void CTreeLayeredTraverse::CreateAndTraverse()
{
CLayer::iterator node_pos;
CLayer *pLastLayer;
CLayer *pLayer;
while (1) {
pLastLayer = *(m_tree.end() - 1); // 前一层
pLayer = NULL;
// 找出前一层中每个node的所有子节点,并放入新的layer
for (node_pos = pLastLayer->begin(); node_pos != pLastLayer->end(); ++node_pos) {
CNode * pNode;
if (NULL == (pNode = (*node_pos)->GetFirstChild())) continue; // 这个节点没有子节点
if (NULL == pLayer) {
pLayer = new CLayer;
m_tree.push_back(pLayer);
}
if (!AddNode(pLayer, pNode, (*node_pos))) return;
while (1) {
if (NULL == (pNode = pNode->GetNextBrother())) break; // 没有下一个兄弟节点了
if (!AddNode(pLayer, pNode, (*node_pos))) return;
}
}
if (NULL == pLayer) {
break; // 没有下一层节点
}
else {
if (m_tree.size() >= MaxLayerNum) {
break;
}
}
}
}
AddNode是一个帮助函数。CNode的成员m_parent是由CTreeLayeredTraverse类更新的。应用代码只要负责维护自己增加的成员。
bool CTreeLayeredTraverse::AddNode(CLayer *pLayer, CNode * pNode, CNode * pParent)
{
bool ret;
pNode->SetParent(pParent);
pLayer->push_back(pNode);
m_node_num++;
ret = pNode->AfterCreateNode(*this);
if (m_node_num >= MaxNodeNum) {
return false;
}
return ret;
}
最后一个GetPath函数很简单,它演示了std::stack的压栈。后面的CPuzzle2012Node::ShowPath会演示std::stack的出栈。
void CTreeLayeredTraverse::GetPath(const CNode *pNode, CNodeStack &path) const
{
path.push(pNode);
while (NULL != (pNode = pNode->GetParent())) {
path.push(pNode);
}
}
简单说:应用部分就是把前面的问题描述翻译成代码。
首先是状态的定义:
enum CPuzzle2012State {
S10 = 0x001, // beginning
S17 = 0x002, // back to beginning from +7
S12 = 0x004, // back to beginning from /2
S27 = 0x008, // go to middle point from +7
S22 = 0x010, // go to middle point from /2
S23 = 0x020, // go to middle point from *3
S25 = 0x040, // go to middle point from -5
S33 = 0x080, // go to the end from *3
S35 = 0x100, // go to the end from -5
SINVALID
};
CPuzzle2012类接着翻译题目。
class CPuzzle2012 {
public:
static const int VINVALID;
static CPuzzle2012State GetFirstChildState(CPuzzle2012State state);
static CPuzzle2012State GetNextBrotherState(CPuzzle2012State parent, CPuzzle2012State prev);
static int GetValue(int old_value, int state);
static const char * GetExp(CPuzzle2012State state);
private:
static const unsigned int route_table[][2];
};
定义过状态后,还要描述状态间的可达关系。CPuzzle2012类通过GetFirstChildState和GetNextBrotherState提供了状态的遍历接口。这两个接口函数又是对实际路由数据route_table的封装。route_table就是前面有向图的数据表示。
// 每个元素第一个成员指定一个状态,第二个成员是该状态所有前向可达的状态
const unsigned int CPuzzle2012::route_table[][2] =
{
S10, S27|S22,
S17, S22,
S12, S27,
S27, S33|S35|S12,
S22, S33|S35|S17,
S23, S35|S12|S17,
S25, S33|S12|S17,
S33, S25,
S35, S23,
};
CPuzzle2012State CPuzzle2012::GetFirstChildState(CPuzzle2012State state)
{
int i, j;
int snum = sizeof(route_table)/sizeof(route_table[0]);
for (i = 0; i < snum; i++) {
if (route_table[i][0] != state) {
continue;
}
// 先找到指定状态
for (j = 0; j < snum; j++) {
// 找到指定状态的第一个子状态
if (route_table[i][1] & route_table[j][0]) {
return (CPuzzle2012State)route_table[j][0];
}
}
}
// 没有子状态
return SINVALID;
}
CPuzzle2012State CPuzzle2012::GetNextBrotherState(CPuzzle2012State parent, CPuzzle2012State prev)
{
int i, j;
bool prev_found;
int snum = sizeof(route_table)/sizeof(route_table[0]);
for (i = 0; i < snum; i++) {
if (route_table[i][0] != parent) {
continue;
}
// 先找到父状态
// 然后在父状态的子状态中找前一个子状态
prev_found = false;
for (j = 0; j < snum; j++) {
if (route_table[i][1] & route_table[j][0]) {
if (route_table[j][0] == prev) {
prev_found = true;
continue;
}
// 前一个子状态后的下一个子状态
if (prev_found) {
return (CPuzzle2012State)route_table[j][0];
}
}
}
}
// 没有下一个兄弟状态
return SINVALID;
}
除了状态外,树的每个节点还有一个随路径变化的当前值。因为前面定义的状态同时描述了刚经过的路径,所以GetValue函数可以根据状态计算当前值。
const int CPuzzle2012::VINVALID = -1;
int CPuzzle2012::GetValue(int old_value, int state)
{
switch (state) {
case S17:
case S27:
old_value += 7;
break;
case S12:
case S22:
// 如果不能被2整除,下面就不可能再算出整数了。可以忽略这个节点。
if ((old_value % 2) != 0) {
return VINVALID;
}
old_value /= 2;
break;
case S23:
case S33:
old_value *= 3;
break;
case S25:
case S35:
old_value -= 5;
break;
default:
return VINVALID;
}
return old_value;
}
最后一个GetExp函数返回算式的字符串表示。
const char * CPuzzle2012::GetExp(CPuzzle2012State state)
{
switch (state) {
case S17:
case S27:
return "+7";
case S12:
case S22:
return "/2";
case S23:
case S33:
return "*3";
case S25:
case S35:
return "-5";
break;
default:
return "";
}
}
为了使用CTreeLayeredTraverse,我定义了CNode的派生类CPuzzle2012Node:
class CPuzzle2012Node : public CNode {
public:
CPuzzle2012Node(CPuzzle2012State state, int value) : m_state(state), m_value(value) {};
virtual CNode * GetFirstChild() const;
virtual CNode * GetNextBrother() const;
virtual bool AfterCreateNode(const CTreeLayeredTraverse &tree) const;
private:
CPuzzle2012State m_state; // current state
int m_value; // current value
void ShowPath(const CTreeLayeredTraverse &tree) const;
};
CPuzzle2012Node定义了应用需要的数据成员m_state和m_value。另外实现了CNode类要求的接口:
CNode * CPuzzle2012Node::GetFirstChild() const
{
CPuzzle2012State state = CPuzzle2012::GetFirstChildState(m_state);
if (state == SINVALID) {
return NULL;
}
int value = CPuzzle2012::GetValue(m_value, state);
// 如果刚才的状态无效,就要找下一个子状态
while (value == CPuzzle2012::VINVALID) {
state = CPuzzle2012::GetNextBrotherState(m_state, state);
if (state == SINVALID) {
return NULL;
}
value = CPuzzle2012::GetValue(m_value, state);
}
return new CPuzzle2012Node(state, value);
}
CNode * CPuzzle2012Node::GetNextBrother() const
{
const CPuzzle2012Node * parent = dynamic_cast(m_parent);
if (!parent) {
return NULL;
}
CPuzzle2012State state = CPuzzle2012::GetNextBrotherState(parent->m_state, m_state);
if (state == SINVALID) {
return NULL;
}
int value = CPuzzle2012::GetValue(parent->m_value, state);
// 如果刚才的状态无效,就要找下一个子状态
while (value == CPuzzle2012::VINVALID) {
state = CPuzzle2012::GetNextBrotherState(parent->m_state, state);
if (state == SINVALID) {
return NULL;
}
value = CPuzzle2012::GetValue(parent->m_value, state);
}
return new CPuzzle2012Node(state, value);
}
bool CPuzzle2012Node::AfterCreateNode(const CTreeLayeredTraverse &tree) const
{
if ((m_state == S33) || (m_state == S35)) {
if (m_value == 2012) {
ShowPath(tree);
return false;
}
}
return true;
}
AfterCreateNode判断终止条件是否满足。在找到期望路径后,调用帮助函数ShowPath打印路径。将CTreeLayeredTraverse::GetPath压栈的节点出栈、打印一下就可以了。
void CPuzzle2012Node::ShowPath(const CTreeLayeredTraverse &tree) const
{
CNodeStack path;
tree.GetPath(this, path);
const CPuzzle2012Node *pNode;
const CPuzzle2012Node *pParent;
while (!path.empty()) {
pNode = dynamic_cast(path.top());
if (NULL != (pParent = dynamic_cast(pNode->m_parent))) {
printf("%d%s=%d ", pParent->m_value, CPuzzle2012::GetExp(pNode->m_state), pNode->m_value);
}
path.pop();
}
printf("\n");
}
面向对象编程的主要工作是类的定义。类定义对所涉及问题的客观实体进行高度抽象,得到与具体问题相符合的类的层次结构和操作。主函数只是对类定义的调用,通常是很简单的:
int main()
{
CTreeLayeredTraverse tree(new CPuzzle2012Node(S10, 2011));
tree.CreateAndTraverse();
return 0;
}
将一个编程作业作为一道数学益智题,显然是一个无聊的恶作剧。程序员可以通过编程解题,只是因为这是一道编程题,并不说明程序员这个职业有任何特殊之处。事实上,在现实世界中,有太多问题是无法通过编程解决的,而大多数程序员都必须具备各个领域的专业知识。编程是一种手工技能,在对这种技能熟悉到一定程度后,进一步的提高通常是在编程之外了。
本文源代码可以从这里下载。