翻译引擎:一个实用的3-D游戏引擎实现思路方法(翻译) 疯狂代码！

3D游戏引擎实用

执行思路方法
(APracticalImplementationofa3-DGameEngine)

摘要:
制作

个3-D游戏引擎并不是

件很简单

任务

现在

游戏玩家常常要求在游戏中有着高性能和高质量

输出

在这篇文章中

我们向大家展示了多种实时渲染

算法如何用来在

个实际

3-D游戏引擎中提高性能

我们探究了

个通用

3-D游戏引擎

结构并且讨论了在3-D游戏引擎中

视景图像

任务

我们将从软件Software工程

角度来研究视景图像

我们将向你展示

种面向对象

和可以方便

通过区别渲染引擎来设计

视景图像

接下来

我们解释了在我们

3-D游戏引擎中用来提高引擎性能

算法

我们在视景图像和物体几何层面上对我们

3-D游戏引擎进行了优化

我们提出

算法在静态和动态

场景中表现

都是相当

好

最后

我们用多处理器在视景图像方面用并行处理

方式来建立个3-D游戏引擎方面作了

下简单

展望

、介绍:

在过去

十年里面

计算机游戏行业经历了巨大

增长

黄金时期

在过去

几年里

随着3-D加速硬件设备

飞快

进步

游戏制造行业都将焦点集中在用创新

思想来生产交互式

3-D游戏

3-D游戏引擎是驱动这些游戏

核心技术

简单

来讲

个3-D擎获得游戏中

3-D物体

几何数据并将这些数据展示在显示设备上

典型

显示设备就是显示器

这个过程就是我们通常所知

渲染

3-D物体

几何数据通常通过

系列

顶点来定义

物体

具体特性(象漫射

颜色

镜面反射以及发射出

颜色等)

纹理图

纹理匹配以及

些常用

向量

所有

这些数据在3-D游戏引擎处理途径中经历区别

阶段来决定着这些3-D物体

最终显示

效果

图1

个完整

3-D引擎

处理过程

高层

视景图像给用户

种直觉

方式来模拟

个场景

优化

场景保证了场景对于渲染

高效率

高层视景图像规定了在游戏中

物体的间

关系

它对于游戏开发者来讲也是在游戏中操纵这些物体

个应用

接口(API)

在

个场景被渲染的前

视景图像必须为了渲染而被优化

这种优化处理就是典型

将高层视景图像转变成(编译成)优化

视景图像

这种被优化

视景图像就是用了

种非常适用于渲染

数据结构

这就要求开发者去详细

确定每个物体

“线索”:比如这个物体是静止

还是移动

物体

结构是否随着时间

变化而变化等等

视景物体剔除就是将观察者不能看到

物体丢弃掉

处理过程

尽管细节层次控制可以将相对于观察着者比较远

些无关紧要

物体给删除掉

所有这些思想

背后就是减少渲染那些你看不见

东西以及减少远端物体几何数据

为了是将送往最终渲染管线

数据减到最少

这些将会明显

提高渲染性能

这些就是

个3-D游戏引擎为了提高它

性能而所要完成

主要任务

后续

任务

诸如灯光

视角转换

裁减

投影变换以及光栅化

都是渲染引擎为了完成渲染流程所需要承担

任务

渲染引擎

就是经常提及

立即模式渲染引擎

往往都可以被3-D加速硬件支持

两种主要

适用于PC机

渲染引擎就是微软

Direct3D和SiliconGraphics公司

OpenGL

在这种渲染引擎上开发游戏往往是枯燥和耗费时间

这些引擎所给

接口都是些

性

和面向硬件

在接下来

部分

我们将在集中在建立3-D游戏引擎

3个主要

模块:(1)为我们

3-D引擎建立高层场景图像；(2)为了建立优化

场景图像

算法；(3)如何丢弃不在观察者视野范围内

物体

并且适当

控制细节层次控制物体

2.在3-D引擎中

设计问题
视景图像设计由于它直接牵扯到整个3-D引擎

性能所以显得非常重要

它定义了

种让

员来模拟视景

方式

个好

视景图像设计应该允许

员将更多

视景(诸如物体和它们

排列)包含在视景中

并且想到用最好

方式来展现它们

并且可以忽略掉渲染管线

复杂

控制

员将通过视景图像

API来设计3-D引擎

视景图像设计
在视景图像设计中

第

个问题就是要考虑物体

表现

就像我们上面提到

样

象Direct3D和OpenGl这样

立即模式

渲染引擎均倾向于拥有自己

面向图形硬件

渲染

功能

很显然

这种面向渲染

设计并不适合于完成我们

视景图像

设计

目标

个面向对象

视景图像设计明显

是

种比较好

模式

在这种模式中允许

员在视景中用对象

概念来设计3-D游戏

我们将所有

游戏对象都当作视景中

3-D对象来对待

Strauss和Carey已经介绍了完全面向对象

视景图像框架

这个框架

基本

思想就是将3-D视景描述为物体

图像

这种图像成为节点

有很多种类型

节点并且每

个节点都有区别

相关属性

比如说

圆柱形状

节点包含两个参数:半径和高度

但是球状物体仅仅包含

个参数

那就是半径

有

些特定

节点可以包含属于它们

子节点

些参数

例如

在图2中

描绘了

个汽车

部分

视景图像

节点组命名为“Body”

它拥有4个子节点来组成汽车

车身

纹理节点包含了定义汽车车身纹理图像

参数

这些参数同样会被命名为“门”

组节点继承

这些节点用来组成汽车车身

车门

因此

汽车车门将会拥有和车身

样

纹理

通过应用这种方式

我们不仅可以增加资源

可重复利用度

而且也是简单

模拟场景

方式

尤其当我们处理

些视景物体

相对位置时

这种方式显得更有效

变换节点用来描述在父节点下

对象

位置和方向

变换

这些都是相对于父节点

变换

为了得到这些节点

绝对变换(相对于整个场景

变换)

当前

这些节点将和它们

父节点

变换相结合(通过矩阵相乘)起来

这样就可以很轻松和简单

个对象相对和父节点

位置和方向了

这种模型就是通常我们所说

等级场景模型并且是骨骼动画

基础

这种模型通常用来在游戏中

动画

运动部分

2.2可移植

视景图形
为了保证我们

游戏能满足尽可能多

玩家

要求

我们必须保证我们

3-D游戏引擎可以在区别

平台和区别

操作系统上运行

因此可移植性是我们设计视景图形

另外

个问题

个视景图形必须能够在各种目标平台上运行渲染引擎

而且游戏

代码还不能做任何

改动

个可移植

视景图形必须设计成为不依赖于特殊

渲染引擎才能运行

D鰈lnerandHinrichs已经讨论了

些实用

思路方法来归纳区别渲染引擎

特性

并且提议

种可以支持这些系统

通用

视景图形结构

他们确信通过应用

种通用

视景图形

大多数

实时渲染设备都能被整合为单

不会被凌驾于或是受到

些特殊

渲染引擎

视景图形表示思路方法

可移植性通过分离

渲染对象和渲染引擎来共同完成

图3就是

个用来证明这种观点简化了

原始

视景图形结构

和前面我们讨论

StraussandCarey

工作相类似

个渲染对象就是在视景图形中

个节点

多个渲染对象在视景中组织起来就形成了

个完整

视景

D鰈lnerandHinrichs将渲染对象扩展到包括不被任何渲染

支持

2-D和3-D几何对象

除了它们

几何描述；属性包括外观属性(颜色

材质

纹理)

变换属性(方向和位置)

以及光照属性(区别

光源)

这些都是要渲染

细节

在渲染

过程中

渲染引擎将会研究和解释视景图形

内容

计算每个被渲染对象

属性并且将它们转换为和目标渲染引擎相匹配

算法

因此

渲染引擎是唯

能包含细化

个可移植渲染系统

代码

地方

这些渲染引擎

特殊

算法在整个执行过程中被称为句柄

即每个属性

特例

在渲染

时候渲染引擎将会

这些句柄

思路方法

特殊

渲染引擎可以提供优化

引擎执行思路方法用来扩展底层渲染引擎

特殊

功能

在

张大

图片、

些视景图形被描述为可以满足特定规范标准

参数化

视景

个视景结构紧紧能为给定

渲染引擎而计算

它

内容可以被区别

渲染引擎解释为区别

目

3.在3-D引擎中

优化技术
在这

章中

优化专门

是指用来加速我们3-D引擎

渲染速度

加速技术

优化技术获得视景图形中

对象

并且构建

种特别有利于渲染

数据结构来存储物体

几何数据

这个过程就是通常所说

视景图形编辑

个完整

优化视景图形应该能够提供对于感光输出结果

SudarskyandGotsman定义了

个在每

祯

运行时间为O(n+f(N))

条件下

感光输出算法

在这里N是在场景里所有对象

n是所有

可见物体

而且f(N)远远小于N

举个简单

例子

也就是说

个光敏感输出算法

运行时间和可见物体

数量成线性正比关系

而不是和场景中

所有物体成正比

目前共有两种技术能达到这个目

在物体

几何层次

细节层次控制试图在越远

物体上渲染

越少

数据(也就是物体包含越少

数据)

然而

越靠近观察者

物体越会清晰

呈现它们

完整特性

反的越远

物体看起来越粗糙

很多精细

细节数据被移除掉了

在场景结构层次

可见性删除技术可以避免渲染观察着看不见

部分

这些物体在渲染的前就被丢弃掉了以便于不把这些数据送到渲染硬件中去

可见性删除技术可以更深层次

分成背面剔除法

视锥体剔除法和遮挡剔除法

简单

讲

背面剔除法就是将背对于观察者

物体

表面被丢弃；视锥体剔除法就是将观察者视角外

物体忽略掉；遮挡剔除法就是试图将从观察者视线内

被其他物体完全遮挡

物体丢弃掉(如图4)

图4(a)视锥体剔除法将观察者视线外

物体丢弃掉

(b)遮挡剔除法将被其他物体挡住

物体丢弃掉

3.1场景结构优化

为了实现在可见性剔除算法

光敏感输出

它们不能简单

重复计算整个场景中

物体并且决定哪

个是可见

我们应用

种特定

数据结构来将场景中

物体分组

这样

话

用

个简单

查询

算法就可以

下子决定是接受还是丢弃

组物体

我们还可以建议使用分等级

数据结构来根据物体

位置来将场景中

物体归成几个区域

通过这种方式

如果

个特定

区域被发现是相对于观察者来讲是不可见

或是隐藏

那么大部分

物体将不会被渲染

为了得到这些分级

数据结构场景必须要被预处理

假设这个预处理是非常耗费时间

那么它必须在

化阶段被完成

我们应用混合式 8叉树作为空间数据结构来存储3-D引擎中

物体

我们选择 8叉树

主要原因是基于我们回顾其他

优化技术

我们优化

场景结构

可适应性可以扩展到区别

算法

8叉树模型用

个立方体顺着 3个纬度来

次性

划分空间物体

在每

个阶段

用 8个相等

立方体沿着 3个轴面上均匀

划分整个场景(xz,xy和yz面)

图5证明在2维视角上验证了这个过程

图5

个 2维版本

8叉树

4方块

构建

每个面上再递归

划分为 4个相等

小

相等

4方块

直到里面

物体为空或是

整个物体

这样就可以创建

个每个节点都包含有 8个字节点

树

通过划分每个物体都会和它所嵌套子节点

相应

立方体相关联

如果

个物体恰好被

个面所划分(图5

c),那么这个物体就可以用几种思路方法来处理

种思路方法就是根据和划分面

关系来划分物体

根据物体在他

子节点

所关联

立方体

空间尺度来关联部分物体

分裂算法有点复杂并且这种思路方法同时也会增加场景中物体

数量

另外

种思路方法就是将原始

物体既可以和它

父节点相关联也可以和它

装入

子节点相关联

当立方体为空时

或是

整个物体都包含在立方体时就停止向下划分(图5

当算法结束时

实际

物体都会包含在 8叉树

叶节点内

每个叶节点会包含少于或是等于指定

物体

数量

3.2物体

可见性剔除

视锥体剔除法是通过执行观察者视角和装入最大立方体

系列物体

交集测试来运行

如果测试失败则将这些物体在最初

阶段裁减掉

否则进行和最小

立方体进行

次最终

测试

8叉树不仅可以很好

应用在静态

场景

同时它也可以方便

应用于动态

场景中

遮挡剔除法算法可以紧接着应用于丢弃掉其他

大部分不在观察者视线内

物体

尤其对于场景内物体密度比较大

情况更加有效

张提出了

种比较新颖

应用分级

空间图形遮挡地图

遮挡剔除算法

这个算法有两部分测试组成:

个在Z轴方向上

维度深度测试和两维度

空间图形

交迭测试来共同决定

个物体是否被遮挡住

对于两维度

交迭测试

个遮挡表示就是被渲染

系列潜在

很好

遮光板而构建

这个遮挡在场景结构完成时就被确定了

张还建议

些大

或比较靠近观察者

物体当作比较好

遮光板

这些遮光板被渲染成没有纹理

灯光和开启Z-buffering

块在黑背景下

块白颜色

脱离屏幕

图形缓冲

这些操作允许将

些列小

遮光板拼成

块大

遮光板

这个被渲染过

图像就是最高分辨率

遮挡地图

这个方案是基于分级

遮挡地图

这个层级是通过从最高分辨率向下到最小分辨率

层层递归取样形成

象图6所示

图形硬件可以用缩小倍率

过滤

双线性插补

纹理映射来加速这个过程

图6a接近建立

个遮挡图

遮光板
(b)在区别级别

分层次

遮挡图
交集测试是通过测试物体是否投影在屏幕空间

范围内

这

点和分层次

遮挡图形

同尺寸

像素对应于相同尺度

边框内

尺寸是不

样

如果边框内所有

元素和映射

交集为不透明(全白)

那么这个算法就认为这个物体是被遮挡

然而

这个算法会递归

检查比它低

层次

不透明

像素

这个算法独特

点是比较接近可见性剔除

也就是忽略掉对那些仅通过小洞或是透过遮光物体才能见到

物体

渲染

对于这点

在遮挡映射里像素并不完全等同于全部透明

而是相对于

个透明

阈值(灰度)

这个值越小那么这个算法就越接近于剔除

场景内物体会由于被忽略渲染而导致部分可见

张已经得出了

个计算在层次中

区别等级

阈值

公式

这个特征就好像是增加剔除率

当场景不需要物体被看见事可以通过

些遮挡物

些小

和

些不是特别清醒

图来代替这个物体

维度

Z-depth是用来检查

个物体是否在遮挡物体

后面

张提议用深度估计缓冲来将屏幕分成

系列

小

矩形区域

对于每个区域

所有

遮挡物体

视线内

最远

顶点

z-value被加入缓冲

深度估计缓冲在每

帧祯都需要建立

在渲染是

如果

个物体

所占

体积

最近

顶点

Z-value要比这个物体所能覆盖

区域

所存储

Z-value都大

话

这个物体才会通过深度测试

为了使

个物体被遮挡

这个物体必须同时能通过用分级

遮挡映射

交集测试和用深度估计缓冲

深度测试才行

3.3动态物体

优化
为了处理 8叉树内

动态物体

最直接

思路方法就是每次当物体运动是

就在 8叉树内把它删除掉

接下来通过插入它

新位置

这并不是最佳

处理思路方法

这样会使我们陷入到频繁修改 8叉树

结构

举个例子来说

删除 8叉树

节点有时会合并刚刚分开

节点

就像图7所示

另外

它还经常需要

个很长

路径来寻找物体

相对于根节点

插入

新节点

为了避免

删除和建立节点而频繁更新 8叉树

Sudarsky建议仅更新那些具有最少共同祖先

子树

物体

新老位置

(图8)对于

个 8叉树很深

大场景

这种思路方法会很明显

减少更新 8叉树

时间

LCA要比根节点更加接近叶节点

为了避免对每个动态物体

每

帧都要更新 8叉树

结构

Sudarsky用了

个懒惰计算技术

即我们在

个物体是绝对需要

的前不计算任何事情

这就需要

个和每个动态物体相关联

临时

边界体(TBV)

这个TBV是

个保证在某些特定时间内能包含

个动态物体

边界体

这段时间就是指TBV

有效时间

失效其就是这个时间

最后时刻

现在比较流行

TBV

构建思路方法往往基于

些物体运动和行为

前期知识

举个例子

sweep曲面可以用作TBV

物体上

边界；如果最大

速度和加速度已知

话

球形也是可以用

应用这种技术

动态物体

TBV可以用在上述视锥体剔除法

交集测试中

在下列情况下

个运动

物体可以被认为是个隐藏

或是不可见

:(1)它

TBV是可见

也就意味着物体本身可能是可见

；(2)它

TBV过期了,意味着这个TBV不再保证包含

个物体了

个优先队列用来存储所有

TBV

过期

数据

为了得到更适宜

性能

我们所关心

有效期必须被关闭

个适当

算法在大多数环境下都能很好

应对这种情况

如果

个物体在确实被看见的前它

TBV就过期了

也就意味着它

有效期太短并且在下

个TBV中将赋予它更长

有效期

相比的下

如果

个TBV在它过期的前就被看见了

那么在下

个TBV中将赋予它更短

有效期

图8)当动态物体被更新是 8叉树

节点经常被删掉和建立

(a)最初有两个物体

8叉树
(b)

个动态物体从 8叉树内被删除
(c)动态物体又被重新插入到新

位置

3.4物体

几何优化
场景物体

几何数据可以通过试图产生代表从区别观察者

距离

物体

区别层次细节(LOD)进

步

优化

这种情况

背后

原因是我们不需要展现所有

完整

物体

数据

物体距离我们比较远并且在图形上看起来很小

我们只需要展现那些距离观察者比较近

物体

完整数据

这些物体

精细

数据都可以被展现出来

这样就可以明显

减少物体

数据

我们只需要发送那些最需要物体到渲染引擎里去

图9证明了

个Stanford兔子在LOD控制下在两个相对于观察者区别

距离下

显示情况

图9(a)最高细节

原始

兔子模型(35947个顶点

69451个 3角形)
(b)相对于观察者比较远

距离情况下同样

减少了LOD

兔子模型
(c)

个扩大(b)

版本

展示给我们

个粗糟

兔子模型(359个顶点

508个 3角形)
通过简化物体

LOD控制是

种为了提高我们3-D引擎性能

必须

技术

LOD两个比较出名

简化技术是分数倍采样和聚类思路方法

分数被采样是在分类

基础上减少顶点、边或是 3角形

那些对于整个显示贡献比较少

顶点将被标注为候选顶点

当

个最不重要

顶点被刈除后

剩下

漏洞将被补上

这个过程

直到达到预期

目

后才会结束

在聚类思路方法中

组高权重

顶点将被预决定了

靠近这些顶点

周围

些顶点将被聚类

只有那些权重高

顶点被送到渲染引擎中去

这些顶点都关联着网格

形成

这种思路方法非常快但是这种简化

思路方法

质量比较差

简化算法

保真度可以通过在简化过程中瞄准那些小

共面

网格来得以提高

为了得到这些网格

可以用长度

面积

体积

角度等

来测量每个顶点

其他临近

顶点

当这些共面

顶点被刈除或是被大

3角形代替

多边形

数量减少了

但是物体

形状仍和原来物体相差不多

这样原来

物体将被尽可能多

保留下来

4.将来3-D游戏引擎

上面我们讨论

所有

算法都是串行

都是设计运行在

个处理器

计算机上

尽管今天主流

游戏者都在用这种配置

多处理器

计算机是未来工业

种趋势

现在在多处理器上

3-D引擎算法方面作了很多

研究工作

RohlfandHelman解释了3-D引擎

区别构件的间如何用区别

并行散发进行优化

他们研究

3-D引擎用多处理技术来划分多个处理器的间

工作

并且用管道来管理数据

他们同时也证明了处理器如何同步在区别环境下它们的间

操作

Igehy介绍了

个感兴趣

方向将OpenGL

接口扩展到并行处理上

他

扩展允许多个绘图设备同时来画

张图

最初所包括

同步化是允许并行横行

个明确

有序

场景

在

个24处理器

系统上应用这个

接口

运行证明了它

有效性

5.整理总结
我们已经介绍了

些主要

方面来执行

个实际

3-D游戏引擎

这个引擎

设计是轻便

和有效

它允许游戏

有效

构建和控制场景对象

我们也强调了很多3-D引擎应用

优化技术

光敏感输出是我们在3-D引擎中所用算法

必要部分

在场景和物体层面为了将对静态和动态物体

渲染性能提高到最大优化是必须要做

最后

简单讨论了

些额外

用来提高并行处理

3-D引擎性能

源码

\" border=0>相关档案:

\" border=0>sf_200692422043.pdf (247842

Tags: 实用翻译教程

翻译引擎:一个实用的3-D游戏引擎实现思路方法(翻译)

延伸阅读

最新评论

发表评论

赞助商广告

随机更新

热门标注

最近更新

最新标注