游戏引擎:游戏引擎剖析( 3) 疯狂代码！

原文作者:Jake Simpson
译者: 向海
Email:[email protected]

第3部份: 内存使用

特效和API

有关内存使用

研究
　　让我们想

想

在今天实际上是如何使用3D 显卡内存

以及在将来又会如何使用

如今绝大多数3D显卡处理32位像素颜色

8位红色

8位蓝色

8 位绿色

和 8 位透明度

这些组合

红

蓝和绿256个色度

可以组成 16

7 百万种颜色-- 那是你我可以在

个监视器上看见

所有颜色

　　那么

游戏设计大师John Carmack 为什么要求 64 位颜色分辨率呢? 如果我们看不出区别

又有什么意义呢? 意义是: 比如说

有十几个灯光照射模型上

点

颜色颜色各不相同

我们取模型

最初颜色

然后计算

个灯光

照射

模型颜色值将改变

然后我们计算另外

个灯光

模型颜色值进

步改变

这里

问题是

颜色值只有8位

在计算了4个灯光的后

8位

颜色值将不足以给我们最后

颜色较好

分辨率和表现

分辨率

不足是由量化误差导致

本质原因是由于位数不足引起

舍入误差

　　你能很快地用尽位数

而且同样地

所有

颜色被清掉

每颜色16 或 32 位

你有

个更高分辨率

因此你能够反复着色以适当地表现最后

颜色

这样

颜色深度很快就能消耗大量

存储空间

我们也应提到整个显卡内存和纹理内存

这里所要说

是

每个3D 显卡实际只有有限

内存

而这些内存要存储前端和后端缓冲区

Z 缓冲区

还有所有

令人惊奇

纹理

最初

Voodoo1 显卡只有2MB显存

后来 Riva TNT提高到16MB显存

然后 GeForce 和 ATI Rage有32MB显存

现在

些 GeForce 2 到 4

显卡和 Radeons 带有 64MB 到128MB

显存

这为什么重要? 好吧

让我们看

些数字…

　　比如你想让你

游戏看起来最好

所以你想要让它以32位屏幕

1280x1024分辨率和32位 Z- 缓冲跑起来

好

屏幕上每个像素4个字节

外加每个像素4字节

Z-缓冲

都是每像素32位

我们有1280x1024 个像素 – 也就是 1

310

720个像素

基于前端缓冲区和Z-缓冲区

字节数

这个数字乘以8

是 10

485

760字节

包括

个后端缓冲区

这样是 1280x1024x12

也就是 15

728

640 字节

或 15MB

在

个 16MB 显存

显卡上

就只给我们剩下1MB 来存储所有

纹理

现在如果最初

纹理是真32 位或 4字节宽

那么我们每幀能在显卡上存储 1MB/4字节每像素 = 262

144个像素

这大约是4 个 256x256

纹理页面

　　很清楚

上述例子表明

旧

16MB 显卡没有现代游戏表现其绚丽画面所需要

足够内存

很明显

在它绘制画面

时候

我们每幀都必须重新把纹理装载到显卡

实际上

设计AGP总线

目

就是完成这个任务

不过

AGP 还是要比 3D 掀卡

幀缓冲区慢

所以你会受到性能上

些损失

很明显

如果纹理由32位降低到16位

你就能够通过AGP以较低

分辨率传送两倍数量

纹理

如果你

游戏以每个像素比较低

色彩分辨率跑

那么就可以有更多

显示内存用来保存常用

纹理 (称为高速缓存Cache纹理)

但实际上你永远不可能预知使用者将如何设置他们

系统

如果他们有

个在高分辨率和颜色深度跑

显卡

那么他们将会更可能那样设定他们

显卡

雾
　　我们现在开始讲雾,它是某种视觉上

效果

如今绝大多数

引擎都能处理雾

雾非常方便地让远处

世界淡出视野

所以当模型和场景地理越过观察体后平面进入视觉范围内时

你就不会看见它们突然从远处跳出来了

也有

种称为体雾

技术

这种雾不是随物体离照相机

距离而定,它实际上是

个你能看见

真实对象

并且可以穿越它

从另外

侧出去 -- 当你在穿越对象

时候

视觉上雾

可见程度随着变化

想象

下穿过云团 -- 这是体雾

个完美例子

体雾

些好

实现例子是Quake III

些关卡中

红色雾

或新

Rogue Squadron II 的 Lucas Arts

GameCube 版本

其中有

些是我曾经见过

最好

云--大约和你能看见

样真实

　　在我们讨论雾化

时候,可能是简短介绍

下 Alpha 测试和纹理Alpha混合

好时机

当渲染器往屏幕上画

个特定像素时

假定它已经通过 Z- 缓冲测试 (在下面定义)

我们可能最后做

些Alpha测试

我们可能发现为了显示像素后面

某些东西

像素需要透明绘制

这意味着我们必须取得像素

已有值

和我们新

像素值进行混和

并把混合结果

像素值放回原处

这称为读-修改-写操作,远比正常

像素写操作费时

　　你可以用区别类型

混合

这些区别

效果被称为混合模式

直接Alpha混合只是把背景像素

些百分比值加到新像素

相反百分比值上面

还有加法混合

将旧像素

些百分比,和特定数量(而不是百分比)

新像素相加

这样效果会更加鲜明

(Kyle's Lightsaber在 Jedi Knight II 中

效果)

　　每当厂商提供新

显卡时

我们可以得到硬件支持

更新更复杂

混合模式

从而制作出更多更眩目

效果

GF3+4和最近

Radeon显卡提供

像素操作

已经到了极限

模板阴影和深度测试
　　用模板产生阴影效果

事情就变得复杂而昂贵了

这里不讨论太多细节(可以写成

篇单独

文章了)

其思想是

从光源视角绘制模型视图

然后用这个把多边形纹理形状产生或投射到受影响

物体表面

　　实际上你是在视野中投射将会“落”在其他多边形上面

光体

最后你得到看似真实

光照

甚至带有视角在里面

要动态创建纹理

并对同

场景进行多遍绘制

所以这很昂贵

　　你能用众多区别思路方法产生阴影

情形时常是这样

来

渲染质量和产生效果所需要

渲染工作成比例

有所谓

硬阴影或软阴影的分

而后者较好

它们更加准确地模仿阴影通常在真实世界

行为

通常有

些被游戏开发者偏爱

“足够好”

思路方法

如要更多

了解阴影

请参考 Dave Salvator

3D 流水线

文

深度测试
　　现在我们开始讨论深度测试

深度测试丢弃隐藏

像素

过度绘制开始起作用

过度绘制非常简单 – 在

幀中

你数次绘制

个像素位置

它以3D场景中Z(深度)方向上存在

元素数量为基础

也被称为深度复杂度

如果你常常太多

过度绘制

-- 举例来说, 符咒

眩目视觉特效

就象Heretic II

能让你

幀速率变得很糟糕

当屏幕上

些人们彼此施放符咒时

Heretic II设计

些最初效果造成

情形是

他们在

幀中对屏幕上每个相同

像素画了40次! 不用说

这必须调整

尤其是软件Software渲染器

除了将游戏降低到象是滑雪表演外

它根本不能处理这样

负荷

深度测试是

种用来决定在相同

像素位置上哪些对象在其它对象前面

技术

这样我们就能够避免绘制那些隐藏

对象

　　看着场景并想想你所看不见

换句话说

是什么在其他场景对象前面,或者隐藏了其他场景对象? 是深度测试作出

这个决定

　　我将进

步解释深度深度如何帮助提高幀速率

想像

个很琐细

场景

大量

多边形 (或像素)位于彼此

后面

在渲染器获得他们的间没有

个快速

思路方法丢弃他们

对非Alpha混合

多边形分类排序( 在Z- 方向上)

首先渲染离你最近

那些多边形

优先使用距离最近

像素填充屏幕

所以当你要渲染它们后面

像素(由Z或者深度测试决定)时

这些像素很快被丢弃

从而避免了混合步骤并节省了时间

如果你从后到前绘制

所有隐藏

对象将被完全绘制

然后又被其他对象完全重写覆盖

场景越复杂

这种情况就越糟糕

所以深度测试是个好东西

抗锯齿
　　让我们快速

看

下抗锯齿

当渲染单个多边形时

3D 显卡仔细检查已经渲染

并对新

多边形

边缘进行柔化

这样你就不会得到明显可见

锯齿形

像素边缘

两种技术思路方法的

通常被用来处理

第

种思路方法是单个多边形层次

需要你从视野后面到前面渲染多边形

这样每个多边形都能和它后面

进行适当

混合

如果不按序进行渲染

最后你会看见各种奇怪

效果

在第 2种思路方法中

使用比实际显示更大

分辩率来渲染整幅幀画面

然后在你缩小图像时

尖锐

锯齿形边缘就混合消失了

这第 2种思路方法

结果不错

但

显卡需要渲染比实际结果幀更多

像素

所以需要大量

内存资源和很高

内存带宽

　　多数新

显卡能很好地处理这些

但仍然有多种抗锯齿模式可以供你选择

因此你可以在性能和质量的间作出折衷

对於当今流行

各种区别抗锯齿技术

更详细讨论请参见Dave Salvator

3D 流水线

文

顶点和像素着色
　　在结束讨论渲染技术的前

我们快速

说

下顶点和像素着色

最近它们正引起很多关注

顶点着色是

种直接使用显卡硬件特征

方式

不使用API

举例来说

如果显卡支持硬件 T & L

你可以用DirectX或OpenGL编程

并希望你

顶点通过 T & L 单元 (

这完全由驱动

处理

所以没有办法确信)

或者你直接利用显卡硬件使用顶点着色

它们允许你根据显卡自身特征进行特别编码

你自己特殊

编码使用T & L 引擎

以及为了发挥你

最大优势

显卡必须提供

其他别

特征

事实上

现在nVidia 和ATI 在他们大量

显卡上都提供了这个特征

　　不幸

是

显卡的间表示顶点着色

思路方法并不

致

你不能象使用DirectX或者OpenGL 那样

为顶点着色编写

次代码就可以在任何显卡上运行

这可是个坏消息

然而

你直接和显卡硬件交流

它为快速渲染顶点着色可能生成

效果提供最大

承诺

( 如同创造很不错

特效 -- 你能够使用顶点着色以API没有提供

方式影响事物)

事实上

顶点着色正在真

将3D 图形显示卡带回到游戏机

编码方式

直接存取硬件

最大限度利用系统

必须知识

而不是依靠API来为你做

切

对

些

员来说

会对这种编码方式感到吃惊

但这是进步代价

　　进

步阐述

顶点着色是

些在顶点被送到显卡渲染的前计算和运行顶点效果

或者例程

你可以在主CPU上面用软件Software来做这些事情

或者使用显卡上

顶点着色

为动画模型变换网格是顶点

主选

　　像素着色是那些你写

例程

当绘制纹理时

这些例程就逐个像素被执行

你有效地用这些新

例程推翻了显卡硬件正常情况做

混合模式运算

这允许你做

些很不错

像素效果

比如

使远处

纹理模糊

添加炮火烟雾, 产生水中

反射效果等

旦 ATI 和 nVidia 能实际上就像素着色版本达成

致( DX9's 新

高级阴影语言将会帮助促进这

目标), 我

点不惊讶DirectX 和OpenGL采用Glide

方式-- 有帮助开始, 但最终不是把任何显卡发挥到极限

最好思路方法

我认为我会有兴趣观望将来

最后(In Closing...)
　　最终

渲染器是游戏

员最受评判

地方

在这个行业

视觉上

华丽非常重要

因此它为知道你正在做

买单

对于渲染器

员

最坏

原因的

就是3D 显卡工业界变化

速度

天

你正在尝试使透明图像正确地工作；第 2天 nVidia 正在做顶点着色编程

展示

而且发展非常快

大致上

4年以前为那个时代

3D 显卡写

代码现在已经过时了

需要全部重写

甚至John Carmack 这样描述过

他知道 4年以前为充分发挥那个时期显卡

性能所写

不错

代码

如今很平凡 -- 因此他产生了为每个新

id项目完全重写渲染器

欲望

Epic

Tim Sweeney赞同 -- 这里是去年他给我

评论:

　　我们已经足足花费了9个月时间来更换所有

渲染代码

最初

Unreal 被设计为软件Software渲染和后来扩展为硬件渲染

下

代引擎被设计为 GeForce 及更好

图形显示卡

且多边形吞吐量是Unreal Tournament

100倍

　　这需要全部替换渲染器

很幸运

该引擎模块化程度足够好

我们可以保持引擎

其余部分—编辑器

物理学

人工智能

网络--不改动

尽管我们

直在以许多方式改进这些部分

　　搭配长篇文章

短篇报导(Sidebar):API -- 祝福和诅咒
　　那么什么是API? 它是应用

编程接口,将不

致

后端用

致

前端呈现出来

举例来说

很大程度上每种3D显示卡

3D实现方式都有所差别

然而

他们全部都呈现

个

致

前端给最终使用者或者

员

所以他们知道他们为X 3D显示卡写

代码将会在Y 3D显示卡上面有相同

结果

好吧

不管怎样理论上是那样

大约在 3年以前这可能是相当真实

陈述

但自那以后

在nVidia 公司

引领下

3D显卡行业

事情发生了变化

　　如今在PC领域

除非你正计划建造自己

软件Software光栅引擎

使用CPU来绘制你所有

精灵

多边形和粒子 -- 而且人们仍然在这样做

跟Unreal

样

Age of Empires II: Age of Kings有

个优秀

软件Software渲染器 – 否则你将使用两种可能

图形API

OpenGL或者 DirectX 的

OpenGL是

种真正

跨平台API (使用这种API写

软件Software可以在Linux

Windows和MacOS上运行

)

而且有多年

历史了

为人所熟知

但也开始慢慢地显示出它

古老

大约在 4年以前

定义OpenGL驱动特征集

直是所有显示卡厂商工作

方向

　　然而

旦在目标达成以后

没有预先制定特征工作方向

路线图

这时候

所有

显卡开发商开始在特征集上分道扬镳

使用OpenGL扩展

　　3dfx 创造了T- 缓冲

nVidia 努力寻求硬件变换和光照计算

Matrox努力获取凹凸贴图

等等

我以前说过

句话

"过去几年以来

3D显示卡领域

事情发生了变化

"委婉地介绍说明了这

切

　　无论如何

另

个可以选择

API是 DirectX

这受Microsoft公司控制

且在PC 和 Xbox 上被完美地支持

由于明显

原因

DirectX 没有Apple或者 Linux 版本

Microsoft控制着 DirectX

大体上它容易更好地集成在Windows里面

　　OpenGL和DirectX的间

基本差别是前者由‘社区’拥有

而后者由Microsoft拥有

如果你想要 DirectX 为你

3D 显示卡支持

个新

特征

那么你需要游说微软

希望采纳你

愿望

并等待新

DirectX发行版本

对于OpenGL

由于显示卡制造商为3D显示卡提供驱动

你能够通过OpenGL扩展立即获得显示卡

新特征

这是好

但作为游戏开发者

当你为游戏编码

时候

你不能指望它们很普遍

它们可能让你

游戏速度提升50%

但你不能要求别人有

块GeForce 3 来跑你

游戏

好吧

你可以这么做

但如果你想来年还在这个行业

话

这是个相当愚蠢

主意

　　这是对这个问题极大

简单化

对我所有描述

也有各种例外情况

但这里

般

思想是很确实

对于DirectX

在任何既定时间你容易确切地知道你能从显示卡获得

特征

如果

个特征不能获得

DirectX 将会用软件Software模拟它(也不总是

件好事情

这样有时侯非常

慢

但那是另外

回事)

对于OpenGL

你可以更加贴近显示卡

特征,但代价是不能确定将会获得

准确特征

Tags: 游戏搜索引擎游戏引擎启动异常什么是游戏引擎游戏引擎

游戏引擎:游戏引擎剖析( 3)

延伸阅读

最新评论

发表评论

赞助商广告

随机更新

热门标注

最近更新

最新标注