游戏引擎:游戏引擎剖析( 2) 疯狂代码！

原文作者:Jake Simpson
译者: 向海
Email:[email protected]

第2部份: 3D环境

光照和纹理

世界

灯光
　　在变换过程中

通常是在称为观察空间

坐标空间中

我们遇到了最重要

运算的

: 光照计算

它是

种这样

事情

当它工作时

你不关注它

但当它不工作时

你就非常关注它了

有很多区别

光照思路方法

从简单

计算多边形对于灯光

朝向

并根据灯光到多边形

方向和距离加上灯光颜色

百分比值

直到产生边缘平滑

灯光贴图叠加基本纹理

而且

些 API 实际上提供预先建造

光照思路方法

举例来说

OpenGL 提供了每多边形

每顶点

和每像素

光照计算

　　在顶点光照中

你要决定

个顶点被多少个多边形共享

并计算出共享该顶点

所有多边形法向量

均值(称为法向量)

并将该法向量赋顶点

个给定多边形

每个顶点会有区别

法向量

所以你需要渐变或插值多边形顶点

光照颜色以便得到平滑

光照效果

你没有必要用这种光照方式查看每个单独

多边形

这种方式

优点是时常可以使用硬件转换和光照(T & L)来帮助快速完成

不足的处是它不能产生阴影

举例来说

即使灯光是在模型

右侧

左手臂应该在被身体投影

阴影中

而实际上模型

双臂却以同样

方式被照明了

　　这些简单

思路方法使用着色来达到它们

目标

当用平面光照绘制

个多边形时

你让渲染(绘制)引擎把整个多边形都着上

种指定

颜色

这叫做平面着色光照

(该思路方法中

多边形均对应

个光强度

表面上所有点都用相同

强度值显示

渲染绘制时得到

种平面效果

多边形

边缘不能精确

显示出来)

　　对于顶点着色 ( Gouraud 着色)

你让渲染引擎给每个顶点赋予特定

颜色

在绘制多边形上各点投影所对应

像素时

根据它们和各顶点

距离

对这些顶点

颜色进行插值计算

(实际上Quake III 模型使用

就是这种思路方法

效果好

令人惊奇)

　　还有就是 Phong 着色

如同 Gouraud 着色

通过纹理工作

但不对每个顶点颜色进行插值决定像素颜色值

它对每个顶点

法向量进行插值

会为每个顶点投影

像素做相同

工作

对于 Gouraud 着色

你需要知道哪些光投射在每个顶点上

对于 Phong 着色

你对每个像素也要知道这么多

点也不令人惊讶

Phong 着色可以得到更加平滑

效果

每个像素都需要进行光照计算

其绘制非常耗费时间

平面光照处理思路方法很快速

但比较粗糙

Phong 着色比 Gouraud 着色计算更昂贵

但效果最好

可以达到镜面高光效果("高亮")

这些都需要你在游戏开发中折衷权衡

区别

灯光
　　接着是生成照明映射

你用第 2个纹理映射(照明映射)和已有

纹理混合来产生照明效果

这样工作得很好

但这本质上是在渲染的前预先生成

种罐装效果

如果你使用动态照明 (即

灯光移动

或者没有

干预而打开和关闭)

你得必须在每

幀重新生成照明映射

按照动态灯光

运动方式修改这些照明映射

灯光映射能够快速

渲染

但对存储这些灯光纹理所需

内存消耗非常昂贵

你可以使用

些压缩窍门技巧使它们占用较少

内存空间

或减少其尺寸大小

甚至使它们是单色

(这样做就不会有彩色灯光了)

等等

如果你确实在场景中有多个动态灯光

重新生成照明映射将以昂贵

CPU周期而告终

　　许多游戏通常使用某种混合照明方式

以Quake III为例

场景使用照明映射

动画模型使用顶点照明

预先处理

灯光不会对动画模型产生正确

效果 -- 整个多边形模型得到灯光

全部光照值 -- 而动态照明将被用来产生正确

效果

使用混合照明方式是多数

人们没有注意到

个折衷

它通常让效果看起来"正确"

这就是游戏

全部 – 做

切必要

工作让效果看起来"正确"

但不必真

是正确

　　当然

所有这些在新

Doom引擎里面都不复存在了

但要看到所有

效果

至少需要 1GHZ CPU 和 GeForce 2 显卡

是进步了

但

切都是有代价

旦场景经过转换和照明

我们就进行裁剪运算

不进入血淋淋

细节而

剪断运算决定哪些 3角形完全在场景 (被称为观察平截头体) 的内或部份地在场景的内

完全在场景的内

3角形被称为细节接受

它们被处理

对于只是部分在场景的内

3角形

位于平截头体外面

部分将被裁剪掉

余下位于平截头体内部

多边形部分将需要重新闭合

以便其完全位于可见场景的内

(更多

细节请参考我们

3D 流水线指导

文)

　　场景经过裁剪以后

流水线中

下

个阶段就是 3角形生成阶段(也叫做扫描线转换)

场景被映射到2D 屏幕坐标

到这里

就是渲染(绘制)运算了

纹理和MIP映射
　　纹理在使3D场景看起来真实方面异常重要

它们是你应用到场景区域或对象

些分解成多边形

小图片

多重纹理耗费大量

内存

有区别

技术来帮助管理它们

尺寸大小

纹理压缩是在保持图片信息

情况下

让纹理数据更小

种思路方法

纹理压缩占用较少

游戏CD空间

更重要

是

占用较少内存和3D 显卡存储空间

另外

在你第

次要求显卡显示纹理

时候

压缩

(较小

) 版本经过 AGP 接口从 PC 主存送到3D 显卡

会更快

些

纹理压缩是件好事情

在下面我们将会更多

讨论纹理压缩

MIP 映射(多纹理映射)
　　游戏引擎用来减少纹理内存和带宽需求

另外

个技术就是 MIP 映射

MIP 映射技术通过预先处理纹理

产生它

多个拷贝纹理

每个相继

拷贝是上

个拷贝

半大小

为什么要这样做?要回答这个问题

你需要了解 3D 显卡是如何显示纹理

最坏情况

你选择

个纹理

贴到

个多边形上

然后输出到屏幕

我们说这是

对

关系

最初纹理映射图

个纹素 (纹理元素) 对应到纹理映射对象多边形

个像素

如果你显示

多边形被缩小

半

纹理

纹素就每间隔

个被显示

这样通常没有什么问题 -- 但在某些情况下会导致

些视觉上

怪异现象

让我们看看砖块墙壁

假设最初

纹理是

面砖墙

有许多砖块

砖块的间

泥浆宽度只有

个像素

如果你把多边形缩小

半

纹素只是每间隔

个被应用

这时候

所有

泥浆会突然消失

它们被缩掉了

你只会看到

些奇怪

图像

　　使用 MIP 映射

你可以在显示卡应用纹理的前

自己缩放图像

可以预先处理纹理

你做得更好

些

让泥浆不被缩掉

当 3D 显卡用纹理绘制多边形时

它检测到缩放因子

说

"你知道

我要使用小

些

纹理

而不是缩小最大

纹理

这样看起来会更好

些

" 在这里

MIP 映射为了

切

切也为了 MIP 映射

多重纹理和凹凸映射
　　单

纹理映射给整个3D 真实感图形带来很大

区别

但使用多重纹理甚至可以达到

些更加令人难忘

效果

过去这

直需要多遍渲染(绘制)

严重影响了像素填充率

但许多具有多流水线

3D 加速卡

如ATI's Radeon 和 nVidia's GeForce 2及更高级

显卡

多重纹理可以在

遍渲染(绘制)过程中完成

产生多重纹理效果时

你先用

个纹理绘制多边形

然后再用另外

个纹理透明地绘制在多边形上面

这让你可以使纹理看上去在移动

或脉动

甚至产生阴影效果 (我们在照明

节中描述过)

绘制第

个纹理映射

然后在上面绘制带透明

全黑纹理

引起

种是所有

织法黑色

但是有

个透明分层堆积过它

顶端

这就是 -- 即时阴影

该技术被称为照明映射 ( 有时也称为暗映射)

直至新

Doom

直是Id引擎里关卡照明

传统思路方法

　　凹凸贴图是最近涌现出来

种古老技术

几年以前 Matrox 第

个在流行

3D 游戏中发起使用各种区别形式

凹凸贴图

就是生成纹理来表现灯光在表面

投射

表现表面

凹凸或表面

裂缝

凹凸贴图并不随着灯光

起移动 -- 它被设计用来表现

个表面上

细小瑕疵

而不是大

凹凸

比如说

在飞行模拟器中

你可以使用凹凸贴图来产生像是随机

地表细节

而不是重复地使用相同

纹理

看上去

点趣味也没有

　　凹凸贴图产生相当明显

表面细节

尽管是很高明

戏法

但严格意义上讲

凹凸贴图并不随着你

观察角度而变化

比较新

ATI 和 nVidia 显卡片能执行每像素运算

这种缺省观察角度

不足就真

不再是有力而快速

法则了

无论是哪

种思路方法

到目前为止

没有游戏开发者太多

使用；更多

游戏能够且应该使用凹凸贴图

高速缓存Cache抖动 = 糟糕

事物
　　纹理高速缓存Cache

管理游戏引擎

速度至关重要

和任何高速缓存Cache

样

缓存Cache命中很好

而不命中将很糟糕

如果遇到纹理在图形显示卡内存被频繁地换入换出

情况

这就是纹理高速缓存Cache抖动

发生这种情况时

通常API将会废弃每个纹理

结果是所有

纹理在下

幀将被重新加载

这非常耗时和浪费

对游戏玩家来说

当API重新加载纹理高速缓存Cache时

会导致幀速率迟钝

　　在纹理高速缓存Cache管理中

有各种区别

技术将纹理高速缓存Cache抖动减到最少 – 这是确保任何 3D 游戏引擎速度

个决定性原因

纹理管理是件好事情 – 这意味着只要求显卡使用纹理

次

而不是重复使用

这听起来有点自相矛盾

但效果是它意谓着对显卡说

"看

所有这些多边形全部使用这

个纹理

我们能够仅仅加载这个纹理

次而不是许多次吗?" 这阻止API ( 或图形驱动软件Software) 上传多次向显卡加载纹理

象OpenGL这样

API实际上通常处理纹理高速缓存Cache管理

意谓着

根据

些规则

比如纹理存取

频率

API决定哪些纹理储存在显卡上

哪些纹理存储在主存

真正

问题来了:a) 你时常无法知道API正在使用

准确规则

b)你时常要求在

幀中绘制更多

纹理

以致超出了显卡内存空间所能容纳

纹理

　　另外

种纹理高速缓存Cache管理技术是我们早先讨论

纹理压缩

很象声音波形文件被压缩成 MP3 文件

尽管无法达到那样

压缩比率

但纹理可以被压缩

从声音波形文件到MP3

压缩可以达到 11:1

压缩比率

而绝大多数硬件支持

纹理压缩运算法则只有 4:1

压缩比率

尽管如此

这样能产生很大

差别

除此的外

在渲染(绘制)过程中

只有在需要时

硬件才动态地对纹理进行解压缩

这

点非常棒

我们仅仅擦除即将可能用到

表面

　　如上所述

另外

种技术确保渲染器要求显卡对每个纹理只绘制

次

确定你想要渲染(绘制)

使用相同纹理

所有多边形同时送到显卡

而不是

个模型在这里

另

个模型在那里

然后又回到最初

纹理论

仅仅绘制

次

你也就通过AGP接口传送

次

Quake III 在其阴影系统就是这么做

处理多边形时

把它们加入到

个内部

阴影列表

旦所有

多边形处理完毕

渲染器遍历纹理列表

就将纹理及所有使用这些纹理

多边形同时传送出去

　　上述过程在使用显卡

硬件 T & L(如果支持

话)时

并不如何有效

你面临

结局是

满屏幕都是使用相同纹理

大量

多边形小群组

所有多边形都使用区别

变换矩阵

这意谓着更多

时间花在建立显卡

硬件 T & L 引擎

时间被浪费了

无论如何

他们有助于对整个模型使用统

纹理

所以它对实际屏幕上

模型可以有效地工作

但是

许多多边形倾向使用相同

墙壁纹理

所以对于世界场景

渲染

它常常就是地狱

通常它没有这么严重

大体而言

世界

纹理不会有那么大

这样

来API

纹理缓存Cache系统将会替你处理这些

并把纹理保留在显卡以备再次使用

　　在游戏机上

通常没有纹理高速缓存Cache系统(除非你写

个)

在 PS2 上面

你最好是远离"

次纹理"

思路方法

在 Xbox 上面

这是不重要

它本身没有图形内存(它是 UMA 体系结构)

且所有

纹理无论如何始终保留在主存的中

　　事实上

在今天

现代PC FPS 游戏中

试图通过AGP接口传送大量纹理是第 2个最通常

瓶颈

最大

瓶颈是实际几何处理

它要使东西出现在它应该出现

地方

在如今

3D FPS 游戏中

最耗费时间

工作

显然是那些计算模型中每个顶点正确

世界位置

数学运算

如果你不把场景

纹理保持在预算的内

仅居其次

就是通过AGP接口传送大量

纹理了

然而

你确实有能力影响这些

通过降低顶层

MIP 级别(还记得系统在哪里不断地为你细分纹理吗?)

你就能够把系统正在尝试送到显卡

纹理大小减少

半

你

视觉质量会有所下降-- 尤其是在引人注目

电影片断中--但是你

幀速率上升了

这种方式对网络游戏尤其有帮助

实际上

Soldier of Fortune II和Jedi Knight II: Outcast这两款游戏在设计时针对

显卡还不是市场上

大众主流显卡

为了以最大大小观看他们

纹理

你

3D 显卡至少需要有128MB

内存

这两种产品在思想上都是给未来设计

　　上面就是第 2 部份

在下面章节中

我们将介绍许多主题

包括内存管理

雾效果

深度测试

抗锯齿

顶点着色

API等

Tags: 游戏搜索引擎游戏引擎启动异常什么是游戏引擎游戏引擎

游戏引擎:游戏引擎剖析( 2)

延伸阅读

最新评论

发表评论

赞助商广告

随机更新

热门标注

最近更新

最新标注