大型网站架构:大型网站WebSite架构演变和知识体系疯狂代码！

　　的前也有

些介绍大型网站WebSite架构演变

文章

例如LiveJournal

、ebay

都是非常值得参考

不过感觉他们讲

是每次演变

结果

而没有很详细

讲为什么需要做这样

演变

再加上近来感觉有不少同学都很难明白为什么

个网站WebSite需要那么复杂

技术

于是有了写这篇文章

想法

在这篇文章中将阐述

个普通

网站WebSite发展成大型网站WebSite过程中

种较为典型

架构演变历程和所需掌握

知识体系

希望能给想从事互联网行业

同学

点初步

概念

文中

不对的处也请各位多给点建议

让本文真正起到抛砖引玉

效果

　　架构演变第

步:物理分离webserver和数据库

　　最开始

由于某些想法

于是在互联网上搭建了

个网站WebSite

这个时候甚至有可能主机都是租借

但由于这篇文章我们只关注架构

演变历程

因此就假设这个时候已经是托管了

台主机

并且有

定

带宽了

这个时候由于网站WebSite具备了

定

特色

吸引了部分人访问

逐渐你发现系统

压力越来越高

响应速度越来越慢

而这个时候比较明显

是数据库和应用互相影响

应用出问题了

数据库也很容易出现问题

而数据库出问题

时候

应用也容易出问题

于是进入了第

步演变阶段:将应用和数据库从物理上分离

变成了两台机器

这个时候技术上没有什么新

要求

但你发现确实起到效果了

系统又恢复到以前

响应速度了

并且支撑住了更高

流量

并且不会

数据库和应用形成互相

影响

　　看看这

步完成后系统

图示:

　　这

步涉及到了这些知识体系:

　　这

步架构演变对技术上

知识体系基本没有要求

　　架构演变第 2步:增加页面缓存Cache

　　好景不长

随着访问

人越来越多

你发现响应速度又开始变慢了

查找原因

发现是访问数据库

操作太多

导致数据连接竞争激烈

所以响应变慢

但数据库连接又不能开太多

否则数据库机器压力会很高

因此考虑采用缓存Cache机制来减少数据库连接资源

竞争和对数据库读

压力

这个时候首先也许会选择采用squid 等类似

机制来将系统中相对静态

页面(例如

两天才会有更新

页面)进行缓存Cache(当然

也可以采用将页面静态化

方案)

这样

上可以不做修改

就能够很好

减少对webserver

压力以及减少数据库连接资源

竞争

于是开始采用squid来做相对静态

页面

缓存Cache

　　看看这

步完成后系统

图示:

　　这

步涉及到了这些知识体系:

　　前端页面缓存Cache技术

例如squid

如想用好

话还得深入掌握下squid

实现方式以及缓存Cache

失效算法等

　　架构演变第 3步:增加页面片段缓存Cache

　　增加了squid做缓存Cache后

整体系统

速度确实是提升了

webserver

压力也开始下降了

但随着访问量

增加

发现系统又开始变

有些慢了

在尝到了squid的类

动态缓存Cache带来

好处后

开始想能不能让现在那些动态页面里相对静态

部分也缓存Cache起来呢

因此考虑采用类似ESI的类

页面片段缓存Cache策略

于是开始采用ESI来做动态页面中相对静态

片段部分

缓存Cache

　　看看这

步完成后系统

图示:

　　这

步涉及到了这些知识体系:

　　页面片段缓存Cache技术

例如ESI等

想用好

话同样需要掌握ESI

实现方式等；

　　架构演变第 4步:数据缓存Cache

　　在采用ESI的类

技术再次提高了系统

缓存Cache效果后

系统

压力确实进

步降低了

但同样

随着访问量

增加

系统还是开始变慢

经过查找

可能会发现系统中存在

些重复获取数据信息

地方

像获取用户信息等

这个时候开始考虑是不是可以将这些数据信息也缓存Cache起来呢

于是将这些数据缓存Cache到本地内存

改变完毕后

完全符合预期

系统

响应速度又恢复了

数据库

压力也再度降低了不少

　　看看这

步完成后系统

图示:

　　这

步涉及到了这些知识体系:

　　缓存Cache技术

包括像Map数据结构、缓存Cache算法、所选用

框架本身

实现机制等

　　架构演变第 5步: 增加webserver

　　好景不长

发现随着系统访问量

再度增加

webserver机器

压力在高峰期会上升到比较高

这个时候开始考虑增加

台webserver

这也是为了同时解决可用性

问题

避免单台

webserver down机

话就没法使用了

在做了这些考虑后

决定增加

台webserver

增加

台webserver时

会碰到

些问题

典型

有:

　　1、如何让访问分配到这两台机器上

这个时候通常会考虑

方案是Apache自带

负载均衡方案

或LVS这类

软件Software负载均衡方案；

　　2、如何保持状态信息

同步

例如用户session等

这个时候会考虑

方案有写入数据库、写入存储、cookie或同步session信息等机制等；

　　3、如何保持数据缓存Cache信息

同步

例如的前缓存Cache

用户数据等

这个时候通常会考虑

机制有缓存Cache同步或分布式缓存Cache；

　　4、如何让上传文件这些类似

功能继续正常

这个时候通常会考虑

机制是使用共享文件系统或存储等；

　　在解决了这些问题后

终于是把webserver增加为了两台

系统终于是又恢复到了以往

速度

　　看看这

步完成后系统

图示:

　　这

步涉及到了这些知识体系:

　　负载均衡技术(包括但不限于硬件负载均衡、软件Software负载均衡、负载算法、linux转发协议、所选用

技术

实现细节等)、主备技术(包括但不限于ARP欺骗、linux heart-beat等)、状态信息或缓存Cache同步技术(包括但不限于Cookie技术、UDP协议、状态信息广播、所选用

缓存Cache同步技术

实现细节等)、共享文件技术(包括但不限于NFS等)、存储技术(包括但不限于存储设备等)

　　架构演变第 6步:分库

　　享受了

段时间

系统访问量高速增长

幸福后

发现系统又开始变慢了

这次又是什么状况呢

经过查找

发现数据库写入、更新

这些操作

部分数据库连接

资源竞争非常激烈

导致了系统变慢

这下如何办呢

此时可选

方案有数据库集群和分库策略

集群方面像有些数据库支持

并不是很好

因此分库会成为比较普遍

策略

分库也就意味着要对原有

进行修改

通修改实现分库后

不错

目标达到了

系统恢复甚至速度比以前还快了

　　看看这

步完成后系统

图示:

　　这

步涉及到了这些知识体系:

　　这

步更多

是需要从业务上做合理

划分

以实现分库

具体技术细节上没有其他

要求；

　　但同时随着数据量

增大和分库

进行

在数据库

设计、调优以及维护上需要做

更好

因此对这些方面

技术还是提出了很高

要求

　　架构演变第 7步:分表、DAL和分布式缓存Cache

　　随着系统

不断运行

数据量开始大幅度增长

这个时候发现分库后查询仍然会有些慢

于是按照分库

思想开始做分表

工作

当然

这不可避免

会需要对

进行

些修改

也许在这个时候就会发现应用自己要关心分库分表

规则等

还是有些复杂

于是萌生能否增加

个通用

框架来实现分库分表

数据访问

这个在ebay

架构中对应

就是DAL

这个演变

过程相对而言需要花费较长

时间

当然

也有可能这个通用

框架会等到分表做完后才开始做

同时

在这个阶段可能会发现的前

缓存Cache同步方案出现问题

数据量太大

导致现在不太可能将缓存Cache存在本地

然后同步

方式

需要采用分布式缓存Cache方案了

于是

又是

通考察和折磨

终于是将大量

数据缓存Cache转移到分布式缓存Cache上了

　　看看这

步完成后系统

图示:

　　这

步涉及到了这些知识体系:

　　分表更多

同样是业务上

划分

技术上涉及到

会有动态hash算法、consistent hash算法等；

　　DAL涉及到比较多

复杂技术

例如数据库连接

管理(超时、异常)、数据库操作

控制(超时、异常)、分库分表规则

封装等；

　　架构演变第 8步:增加更多

webserver

　　在做完分库分表这些工作后

数据库上

压力已经降到比较低了

又开始过着每天看着访问量暴增

幸福生活了

突然有

天

发现系统

访问又开始有变慢

趋势了

这个时候首先查看数据库

压力

切正常

的后查看webserver

发现apache阻塞了很多

请求

而应用服务器对每个请求也是比较快

看来是请求数太高导致需要排队等待

响应速度变慢

这还好办

般来说

这个时候也会有些钱了

于是添加

些webserver服务器

在这个添加 webserver服务器

过程

有可能会出现几种挑战:

　　1、Apache

软负载或LVS软负载等无法承担巨大

web访问量(请求连接数、网络流量等)

调度了

这个时候如果经费允许

话

会采取

方案是购买硬件负载

例如F5、Netsclar、Athelon的类

如经费不允许

话

会采取

方案是将应用从逻辑上做

定

分类

然后分散到区别

软负载集群中；

　　2、原有

些状态信息同步、文件共享等方案可能会出现瓶颈

需要进行改进

也许这个时候会根据情况编写符合网站WebSite业务需求

分布式文件系统等；

　　在做完这些工作后

开始进入

个看似完美

无限伸缩

时代

当网站WebSite流量增加时

应对

解决方案就是不断

添加webserver

　　看看这

步完成后系统

图示:

　　这

步涉及到了这些知识体系:

　　到了这

步

随着机器数

不断增长、数据量

不断增长和对系统可用性

要求越来越高

这个时候要求对所采用

技术都要有更为深入

理解

并需要根据网站WebSite

需求来做更加定制性质

产品

　　架构演变第 9步:数据读写分离和廉价存储方案

　　突然有

天

发现这个完美

时代也要结束了

数据库

噩梦又

次出现在眼前了

由于添加

webserver太多了

导致数据库连接

资源还是不够用

而这个时候又已经分库分表了

开始分析数据库

压力状况

可能会发现数据库

读写比很高

这个时候通常会想到数据读写分离

方案

当然

这个方案要实现并不容易

另外

可能会发现

些数据存储在数据库上有些浪费

或者说过于占用数据库资源

因此在这个阶段可能会形成

架构演变是实现数据读写分离

同时编写

些更为廉价

存储方案

例如BigTable这种

　　看看这

步完成后系统

图示:

　　这

步涉及到了这些知识体系:

　　数据读写分离要求对数据库

复制、standby等策略有深入

掌握和理解

同时会要求具备自行实现

技术；

　　廉价存储方案要求对OS

文件存储有深入

掌握和理解

同时要求对采用

语言在文件这块

实现有深入

掌握

　　架构演变第十步:进入大型分布式应用时代和廉价服务器群梦想时代

　　经过上面这个漫长而痛苦

过程

终于是再度迎来了完美

时代

不断

增加webserver就可以支撑越来越高

访问量了

对于大型网站WebSite而言

人气

重要毋庸置疑

随着人气

越来越高

各种各样

功能需求也开始爆发性

增长

这个时候突然发现

原来部署在webserver上

那个web应用已经非常庞大了

当多个团队(Team)都开始对其进行改动时

可真是相当

不方便

复用性也相当糟糕

基本是每个团队(Team)都做了或多或少重复

事情

而且部署和维护也是相当

麻烦

庞大

应用包在N台机器上复制、启动都需要耗费不少

时间

出问题

时候也不是很好查

另外

个更糟糕

状况是很有可能会出现某个应用上

bug就导致了全站都不可用

还有其他

像调优不好操作(

机器上部署

应用什么都要做

根本就无法进行针对性

调优)等原因

根据这样

分析

开始痛下决心

将系统根据职责进行拆分

于是

个大型

分布式应用就诞生了

通常

这个步骤需要耗费相当长

时间

会碰到很多

挑战:

　　1、拆成分布式后需要提供

个高性能、稳定

通信框架

并且需要支持多种区别

通信和远程

方式；

　　2、将

个庞大

应用拆分需要耗费很长

时间

需要进行业务

整理和系统依赖关系

控制等；

　　3、如何运维(依赖管理、运行状况管理、

追踪、调优、监控和报警等)好这个庞大

分布式应用

　　经过这

步

差不多系统

架构进入相对稳定

阶段

同时也能开始采用大量

廉价机器来支撑着巨大

访问量和数据量

结合这套架构以及这么多次演变过程吸取

经验来采用其他各种各样

思路方法来支撑着越来越高

访问量

　　看看这

步完成后系统

图示:

　　这

步涉及到了这些知识体系:

　　这

步涉及

知识体系非常

多

要求对通信、远程

、消息机制等有深入

理解和掌握

要求

都是从理论、硬件级、操作系统级以及所采用

语言

实现都有清楚

理解

　　运维这块涉及

知识体系也非常

多

多数情况下需要掌握分布式并行计算、报表、监控技术以及规则策略等等

　　说起来确实不如何费力

整个网站WebSite架构

经典演变过程都和上面比较

类似

当然

每步采取

方案

演变

步骤有可能有区别

另外

由于网站WebSite

业务区别

会有区别

专业技术

需求

这篇blog更多

是从架构

角度来讲解演变

过程

当然

其中还有很多

技术也未在此提及

像数据库集群、数据挖掘、搜索等

但在真实

演变过程中还会借助像提升硬件配置、网络环境、改造操作系统、CDN镜像等来支撑更大

流量

因此在真实

发展过程中还会有很多

区别

另外

个大型网站WebSite要做到

远远不仅仅上面这些

还有像安全、运维、运营、服务、存储等

要做好

个大型

网站WebSite真

很不容易

写这篇文章更多

是希望能够引出更多大型网站WebSite架构演变

介绍

Tags: 大型应用系统架构 soa体系架构 com体系架构大型网站架构

大型网站架构:大型网站WebSite架构演变和知识体系

延伸阅读

最新评论

发表评论

赞助商广告

随机更新

热门标注

最近更新

最新标注