用遗传算法在游戏开发中的应用疯狂代码！

直都想用遗传算法(GeneticAlgorithms)实现足球游戏

人工智能

但

实现

个足球游戏

对战平台太过于繁琐而没有动手

直到在

ProgrammingGameAIbyExample

书中看到

个SimpleSoccer

demo(以下简称demo)

实现了

个red-blue两队进行机器和机器对抗

简单足球游戏

在读过它

源码的后

我决定在demo上进行 2次开发——为它加入遗传算法

实验遗传算法在实时战略游戏(RTS)性质

体育游戏中

威力

demo

架构非常好

采用了状态机来实现游戏流程

并分开计算游戏决策

因此加入遗传算法非常容易

只要在原来

状态机中增加

两个状态即可

red-blue两个队伍相互对抗

每队有 5位球员

其中

位是守门员

这个demo

足球规则是简化

除了只有 5个球员外

没有手球也没有越位等规则

甚至连边界球都没有——球碰到边界就反弹回球场

简化

规则有利于我们简化实验

过程

不必把很多精力花费在过于复杂

规则上

$\"\"$
图

在demo

实现中

球场被分割为18块大小相等

区域(见图

)

每

个球员都

个属于自己

区域(称为HomeRegion)

如图

中blue队

10号在自己

HomeRegion(Region5)中处于Wait状态(球员

状态的

)

当

个球员不处于进攻状态(Attacking)、助攻(SupportAttacker)、逐球(ChaseBall)、运球(Dribble)、踢球(KickBall)及返回(ReturnToHomeRegion)时

他就进入Wait状态——等待球队发出

下

个行动指令

显然

就像人类进行足球比赛时需要排兵布阵

样

demo中球员站在哪个位置也相当重要

能否组织起有效

进攻或者防守

决定原因的

就是在合适

位置有没有球员可以快速有效地执行命令

在书中自带

demo中

球员

站位都是固定

因此难以组织有效

进攻和防守

在某

时间段内容易形成

边倒

局势

使用遗传算法来对球员

站位进行决策分析

可以找出对当前局势就有利

位置编排方案

从而使得球队和球队的间

对抗趋于激烈、策略更加有效、攻守都更精彩

遗传算法概述
遗传算法

它在解决许多生产、生活中

问题上

卓越性能而经久不衰

随着计算机

计算能力日益增强和玩家对游戏中

人工智能

强烈需求

目前在单机游戏中已经开始应用遗传算法、人工神经网络等现代优化计算思路方法来增强游戏中

人工智能

并且形成了趋势

可见以后为加强机器

对抗性能

遗传算法、人工神经网络等都会越来越多地应用到游戏中

遗传算法是模拟自然界中

生物对自然界

适应而不断进化这

客观事实

算法

为了解决某

个问题

在遗传算法中

我们虚拟

个物种(即解

表现形式或者称为解

编码)

并将其放到“自然环境”中天下繁殖、进化

根据优胜劣汰、适者生存

自然法则

繁衍若干代的后

种群中

佼佼者将非常适应“自然环境”

这个佼佼者就是我们求得

解了

有关生物学和遗传算法的间

概念

对应关系可以用表

形式来表示:
生物遗传概念

遗传算法中作用

适者生存

在算法停止时

最优目标值

解有最大

可能性被留住

个体

解

染色体

解

编码( 2进制形式或者十进制形式

串即向量

或者

串)

基因

解中每

分量

特征(如各分量

值)

适应性

适应

返回值

群体

选定

组解(其中解

个数为群体

规模)

种群

根据适应

选取

组解

交配

通过交配原则产生

组新解

过程

变异

编码

某

分量发生变化

过程

[Page]

表

遗传算法

流程图如图 2所示:

$\"\"$

图 2
遗传算法运行时

先生成

群体(通常是随机产生

定数量

个体

这个数量就是群体

大小)；然后让群体繁殖下

代

繁殖

方式有交叉、复制和变异；经过繁殖后群体

数量增加

然后使用评估模块对每

个个体进行评估；如果群体中最佳个体已经足够优秀

那就跳出循环

返回最佳个体；否则判断是否已经繁殖了预定

代数

如果是就返回最佳个体

如果不是则淘汰

部分劣质个体并进入下

轮繁殖循环直至结束

在遗传算法

实现中

最重要

主要有 3点:

是染色体

编码

即

个新物种如何样来表示它

通常染色体是问题

个可能解

特定格式

表示

通常以 2进制或者十进制

方式编码； 2是为染色体实现交叉、复制、变异等算子； 3是估值模块

编写

下面以这 3点为中心

谈谈demo中

遗传算法实现

染色体编码
染色体编码

方式有很多种

常见

是 2进制思路方法和十制字方式

也有

串方式

如著名

旅行商问题(TSP)里

假设有20个城市以[0…19]编码

那么[7

8…19

4]这个包含20个元素

序列A就可以看作是

个染色体

每

个元素Aj(0<=j<20)就是染色体

个基因

这个染色体可以解码为从编号为7

城市出发

到达城市6、城市9等等

最后到达城市4完成20个城市

遍历

显然

这个序列是TSP

个可能解

因此染色体就是问题

可能解

表示方式

回到我们

足球游戏中来

我们期望获得某

队

球员

合适站位

那么如果我们把 4个球员以[0…3]编号(

守门员不应离开禁区所以不必考虑他

位置)

那序列B[14

6]就是

个站位方案

表示0号球员站在ID为14

Region中

1号球员站在ID为11

Region中

等

序列B叫做

个可能解

序列B

编码方式即是我们染色体

编码方式——十进制编码方式

个序列

依照这个规则

我们编写代码如下:
typedefunsigned

Genetype;

Chromosome{
private:
std::vector<Genetype>m_Geneme;

m_iScore;
public:
Chromosome

;
~Chromosome

{};
conststd::vector<Genetype>&GetGeneme

const{

m_Geneme;}
voidSetScore(

iScore){m_iScore=iScore;}
friendvoidIntercross(constChromosome&p1,constChromosome&p2,
Chromosome&c1,Chromosome&c2); [Page]
friendvoidAgamogenesis(constChromosome&p,Chromosome&c);
friendvoidMutant(constChromosome&p,Chromosome&c);
friend

GT;
};

GT{
public:
inlinebooloperator

(constChromosome*c1,constChromosome*c2)const{

c1->m_iScore>c2->m_iScore;
}

};
类Chromosome是染色体封装

它

成员变量m_Geneme是

个基因序列

用std::vector容器来保存；成员变量m_iScore是这个染色体对“自然环境”

适应值

由评估模块评定

友元类GT实现了两个Chromosome

大小比较；还定义了 3个友元

分别实现交叉、复制及变异 3个遗传算子

详见下节

遗传算子
交叉、复制和变异 3个遗传算子是遗传算法能够找到最优解

途径

这 3个遗传算子模拟了自然界

物种交配和生殖

方式

为产生新

可行解提供了有效手段(见表

)

遗传算子声明为染色体类Chromosome

友元

是为了方便操作它

私有变量

实现如下:
voidIntercross(constChromosome&p1,constChromosome&p2,
Chromosome&c1,Chromosome&c2){
unsigned

IntercrossPo

=RangeRandom<unsigned

>(0,GeneLen);
unsigned

i=0;
for(;i<IntercrossPo

;

i){
c1.m_Geneme[i]=p1.m_Geneme[i];
c2.m_Geneme[i]=p2.m_Geneme[i];
}
for(;i<GeneLen;

i){
c1.m_Geneme[i]=p2.m_Geneme[i];
c2.m_Geneme[i]=p1.m_Geneme[i]; [Page]
}
}
voidAgamogenesis(constChromosome&p,Chromosome&c){
c.m_Geneme=p.m_Geneme;
}
voidMutant(constChromosome&p,Chromosome&c){
unsigned

MutantPo

=RangeRandom<unsigned

>(0,GeneLen);
GenetypeNewGene=RangeRandom<Genetype>(0,18);
c.m_Geneme=p.m_Geneme;
c.m_Geneme[MutantPo

]=NewGene;
}
Intercross

Agamogenesis和Mutant 3个

分别对应交叉、复制和变异 3个遗传算子

Intercross

传入两个Chromosome

例子

随机选择

点进行交叉

组成两个新

染色体用作返回值

Agamogenesis

传入

个Chromosome例子

个相同

染色体

以保证优势

种群可以壮大

从而使得遗传算法可以在有限

运行时间内收敛

Mutant

传入

个Chromosome例子

随机选择

个元素(分量)赋以

个随机

RegionID

返回这

改变后

染色体

变异可以使得遗传算法跳出局部最优

趋近全局最优

3个遗传算子

操作结果如表 2所示:

遗传算子

输入

染色体

输出

染色体

Intercross

[17,9,4,3]

[16,13,7,9]

[17,9,7,9]

[16,13,4,3]

假定元素2为交叉点

Agamogenesis

[17,9,4,3]

[17,9,4,3]

Mutant

[17,9,4,3]

[17,9,7,3]

假定元素2为变异点

表 2

估值模块
通俗

点说

估值模块就是阎罗王

个体淘汰和否就得看估值模块

脸色了

估值模块判定每

个染色体对“自然环境”

适应度:如前文有关TSP

染色体

它

估值

就返回遍历20个城市要走过

路程

总长度

总长度越短

染色体适应度越高

反的则越低

在足球游戏中

估值模块就没有这么简单了

个染色体就是

个站位组合

这个组合

优劣是和当前局势有很大关系

如球

位置、对方球员

站位、已方球员

站位和控球权等有关

综合以上各种原因

编写如下估值模块:

Environment::Evaluate(conststd::vector<Genetype>&candidate){

iValue=0;
for(unsigned

i=0;i<GeneLen;

i){
//减去移动需要

损耗
iValue-=DistOfTwoRgn(candidate[i],m_CurrGeneme[i])*m_pPrm->CrossCostPerRgn; [Page]
//有利于防守？
iValue

GetDefendValue(candidate[i],m_OppGeneme);
//有利于进攻？
iValue

GetAttackValue(candidate[i],m_OppGeneme);
//有利于抢球或者保球？

(m_iTeamColor

m_iControllingTeam
&&m_iBallRgnIdx

candidate[i])
iValue

m_pPrm->PlyrKeepBallValue;

(m_iTeamColor!=m_iControllingTeam
&&m_iBallRgnIdx

candidate[i])
iValue

m_pPrm->PlyrChaseBallValue;
}

iValue;
}

Environment::GetDefendValue(const

iPlyrIdx,conststd::vector<Genetype>&OppGeneme){

iValue=0;

OppInMyGround=0;
std::vector<Genetype>::const_iteratorci=OppGeneme.begin

;
for(;ci!=OppGeneme.end

;

ci){

(IsInMyGround(*ci))

OppInMyGround;
} [Page]

(OppInMyGround>1){

(IsInMyGround(

_cast<unsigned

>(iPlyrIdx)))

iValue

m_pPrm->DefendValuePerPlyr;

iValue

m_pPrm->DefendValuePerPlyr*0.5;
}

{
iValue

m_pPrm->DefendValuePerPlyr*0.8;
}

(m_iControllingTeam

m_iTeamColor)
iValue*=1.2;

iValue*=0.8;

iValue;
}

Environment::GetAttackValue(const

iPlyrIdx,conststd::vector<Genetype>&OppGeneme){

iValue=0;

OppNoInMyGround=0;
std::vector<Genetype>::const_iteratorci=OppGeneme.begin

;
for(;ci!=OppGeneme.end

;

ci){

(!IsInMyGround(*ci))

OppNoInMyGround;
}

(OppNoInMyGround>2){

(IsInMyGround(

_cast<unsigned

>(iPlyrIdx)))
iValue

m_pPrm->AttackValuePerPlyr*0.5; [Page]

iValue

m_pPrm->AttackValuePerPlyr;
}

(m_iControllingTeam

m_iTeamColor)
iValue*=1.2;

iValue*=0.8;

iValue;
}
Evaluate

主要从以下几方面来对染色体进行评估:
·从当前位置到目

位置所要经过

路径

代价
·是否有利于进攻或者防守
·是否有利于持球或者抢球
其中计算是否有利于进攻或者防守是通过计算两个球队间球员

位置来判断

:对方

球员在已方半场时如果已方球员

目

位置也在已方半场就有利于防守；对方

球员在已方半场时如果已方球员

目

位置在对方半场则有利于进攻

通过这

简单

估值模块

可以使得遗传算法在淘汰劣质个体时有法可依

从而能够收敛得到较优解

通过精细化估值模块考虑更多原因(如对方球队可能采取

策略等)可使遗传算法

收敛速度加快

在真实

游戏项目中必定会使用精细化

估值模块

架构
确定了遗传算法

编码方式、实现了 3个遗传算子和估值模块的后

这个遗传算法基本上就完成了

但我们还没有看到它是如何

化种群、如何繁殖和如何淘汰劣质个体

这时候有必要了解

下遗传算法

架构

在demo中

我们设计

遗传算法

架构如图 3:

Environment
Population
Chromosome
Gene

$\"\"$
图 3
Environment是自然环境

模拟

它实现了估值

、繁殖迭代

控制和环境

化和销毁等功能

最重要

是它包含了

种成员变量——Population

例子

每

个Environment还有

个算法参数包装类ParamLoader

例子指针m_pPrm用以存取配置文件

每

个球队拥有

个Environment例子

专门用以计算适合本队

球员位置编排

简化

Environment

声明如下:

Environment{
private:
ParamLoader*m_pPrm;
Populationm_Population;
private:

Evaluate(conststd::vector<Genetype>&candidate);

GetDefendValue(const

iPlyrIdx,conststd::vector<Genetype>&OppGeneme);

GetAttackValue(const

iPlyrIdx,conststd::vector<Genetype>&OppGeneme); [Page]
boolIsInMyGround(unsigned

iRgnIdx)
doubleDistOfTwoRgn(unsigned

iRgnIdx1,unsigned

iRgnIdx2)
public:
conststd::vector<Genetype>GetBestGeneme

;
};
当

GetBestGnenme

时

遗传算法便开始运行

GetBestGeneme

控制繁殖迭代

次数

并挑选最优

染色体个体

它

实现如下:
conststd::vector<Genetype>Environment::GetBestGeneme

{
for(unsigned

i=0;i<m_pPrm->GAGeneration;

i){
m_Population.NexGeneration

;
unsigned

uiPopulationSize=m_Population.GetPopulationSize

;
for(unsigned

i=0;i<uiPopulationSize;

i){

score=Evaluate(m_Population.GetGenemeByID(i));
m_Population.SetScoreByID(i,score);
}
m_Population.KeepColonySize(m_pPrm->ColonySize);
}

m_Population.GetBestGeneme

;
}
Population是物种群体

抽象

它实现

个最重要

就是NextGeneration

Environment通过

这个

让群体执行繁殖任务；另

个重要

就是KeepColonySize

这个

淘汰掉劣质

个体

让竞争力较强

个体进入下

轮繁殖

简化

Population声明如下:

Population
{
private:
std::vector<Chromosome*>m_Colony;
unsigned

m_iColonySize;
doublem_dIntercrossRate,
m_dAgamogenesisRate, [Page]
m_dMutantRate;
std::vector<Genetype>m_BestGeneme;
public:
voidInitial(unsigned

iColonySize,
doubledIntercrossRate,
doubledAgamogenesisRate,
doubledMutantRate);
voidRelease

;
voidNexGeneration

;
voidKeepColonySize(unsigned

size=100)
private:
voidIntercross

;
voidAgamogenesis

;
voidMutant

;
};
Population用std::vector容器保存物种

所有个体(m_iColonySize个Chromosome

例子)

m_dIntercrossRate、m_dAgamogenesisRate和m_dMutantRate 3个变量分别是交叉率、复制率和变异率

其中染色体交叉是自然界中生物繁殖

最常见方式

可以保证优秀

基因可以遗传到下

代或者有很大

机会使得部分优秀基因和另

部分优秀基因结合为

个非常优秀

染色体

因此交叉率比较高

般取值在0.1～0.5的间；复制率即是无性繁殖

机率

无性繁殖在自然界中是普遍存在

正常现象(如植物中

落地生根和动物中

蚯蚓)

无性繁殖可以确保优秀

个体有

定

机会壮大自己

种群

般复制率取值在0.03～0.1的间；变异在自然界中是发生机率极小

事件

而且变异多是恶性

所以变异率

取值范围在0.005～0.05的间

但变异可以让遗传算法跳出局部最优

因而是必须

个操作算子

m_iColonySize是种群

大小

种群越大

找到解

机会越大

但花费

时间也相对比较多

般设为可以接受

固定值

也可以编写和问题难度相关

来决定

本实验使用m_iColonySize=100

固定值方式

Population另外还有

个关键

NextGeneration

是实现种群进行

代繁殖操作

它

实现如下:
voidPopulation::NexGeneration

{
Intercross

;
Agamogenesis

;
Mutant

;
}
很简单地

了Intercross

、Agamogenesis

和Mutant

3个成员

下面以Intercross

实现为例看看这 3个

是如何实现繁殖操作

: [Page]
voidPopulation::Intercross

{
unsigned

iIntercrossTimes=

_cast<unsigned

>(
m_Colony.size

*m_dIntercrossRate);
for(unsigned

i=0;i<iIntercrossTimes;

i){
unsigned

iChromoIdx1=RangeRandom<unsigned

>(0,m_Colony.size

);
unsigned

iChromoIdx2=RangeRandom<unsigned

>(0,m_Colony.size

);

(iChromoIdx1

iChromoIdx2){

iChromoIdx2;
iChromoIdx2=(iChromoIdx2+1)%m_Colony.size

;
}
Chromosome*Chromo1=

Chromosome;
Chromosome*Chromo2=

Chromosome;
::Intercross(*m_Colony[iChromoIdx1],*m_Colony[iChromoIdx2],
*Chromo1,*Chromo2);
m_Colony.push_back(Chromo1);
m_Colony.push_back(Chromo2);
} [Page]
}
交叉操作先根据交叉率计算出要进行多少次交叉繁殖

然后在执行每

次交叉繁殖时随机选择两个染色体

前文

Intercross算子实施交叉

并将新产生

两个新染色体加入到群体中

复制和变异都是相似

因篇幅所限就不在这里赘述了

详见源码

实验结果
遗传算法是有效但费时

个算法

为了保证游戏运行流畅

我们不可能在每

次刷新

时候都执行

次遗传算法

因此隔多久执行

次遗传算法和控制遗传算法

遗传代数是很重要

demo中是在控球权发生改变时执行遗传算法为red-blue两个球队计算新

站位方案

同时为了游戏能比较流畅

遗传代数控制在20左右

实验证明遗传算法对足球

决策有非常好

效果

主要表现为:1、使用遗传算法后

球员

站位比较到位

跑动积极

比较少进入Wait状态

结果就是当进攻或者防守

时候很容易在周边发现支持者可以轻易将球传出

这使得看起来球员的间

配合非常有默契

攻守两方都能打出更好

组合战术

增加了可观赏性

简单来说

就是加了遗传算法的后

踢

球越来越像人踢

2、遗传算法加强了球队

对抗能力

未增加遗传算法

时候

运行本游戏20分钟总进球数在20~30

在增加遗传算法后

20分钟

总进球数减少到10~20个

主要原因是球员

站位更加合理

能根据当前

局势变换站位

这非常有效地抵抗了进攻

单刀入球也大大减少了

同时

在变换站位时球员

跑动积极

能够很好地增加

抢球和断球事件

发生

增强了两队

竞争

遗传算法不仅可以用在球员

站位策略上

也可以用在确定传球路线、寻找最佳射门角度和障碍回避等多个方面

在未来肯定会应用更多游戏中去

欢迎大家

齐学习、探讨

Tags:

用遗传算法在游戏开发中的应用

延伸阅读

最新评论

发表评论

赞助商广告

随机更新

热门标注

最近更新

最新标注