Stack Overflow网站:30台服务器支撑日均1.7亿PV ?
原作者
Jeff Atwood
Joel Spolsky
译者简介
严睿
工程师、开源粉、深度阅读爱好者。目前就职于中盈优创,负责运营商网络管理项目技术管理,致力于高可用架构改进、DevOps团队建设。
架构概述
Stack Overflow 是一个著名的程序相关的技术问答社区,由Jeff Atwood 和 Joel Spolsky 这两个非常著名的 Blogger 在 2008 年创建,他们也是本文的原作者。
Stack Overflow目前全球排名第56名,日均PV为1.7亿(根据alexa.cn在2016年6月5日的数据)。其架构既有商业外包服务,也大量采用开源软件,可以全景式展现当代主流架构的风貌,Stack Overflow 可以分解为八个切面:
互联网
负载均衡
web层
服务层
缓存
推送
搜索
数据库
其架构图如下所示:
架构原则
Stack Overflow 架构中最重要的一个原则就是:
Everything is redundant
即 一切都有冗余
两个数据中心:纽约和科罗拉多,冗余且持续备份。
其它所有关键组件都尽可能贯彻冗余原则。
物理架构
4 台 Microsoft SQL Server 服务器(其中 2 台使用了新的硬件)
11 台 IIS Web 服务器(新的硬件)
2 台 Redis 服务器(新的硬件)
3 台标签引擎服务器(其中 2 台使用了新的硬件)
3 台 Elasticsearch 服务器(同上)
4 台 HAProxy 负载均衡服务器(添加了 2 台,用于支持 CloudFlare)
2 台网络设备(Nexus 5596 核心 + 2232TM Fabric Extender,升级到 10Gbps 带宽)
2 台 Fortinet 800C 防火墙(取代了 Cisco 5525-X ASAs)
2 台 Cisco ASR-1001 路由器(取代了 Cisco 3945 路由器)
2 台 Cisco ASR-1001-x 路由器
逻辑架构
The Internets 互联网
DNS服务:外包CloudFlare + 自建DNS
其实外包DNS服务应该已经可以满足服务,不过出于保险起见,还是有一套自建的DNS Server。
看来trust issues 中外一致啊。
Load Balancers 负载均衡
HAProxy 1.5.15 on CentOS 7
支持TLS (SSL)流量。
可关注HAProxy 1.7,它即将支持HTTP/2。
引入开源架构之后,就必须持续关注、跟进社区的发展动态。
吃着碗里的,看着锅里的,永远不能停。
Web Tier Web层
IIS 8.5, ASP.Net MVC 5.2.3, and .Net 4.6.1
Service Tier 服务层
IIS, ASP.Net MVC 5.2.3, .Net 4.6.1, and HTTP.SYS
Cache缓存
Redis
L1级别:HTTP 缓存
L2级别:L1级别缓存失败之后,通过Redis获取数据
L1&L2都无法命中的情况下,会从数据库查询,并更新到缓存和Redis。
缓存更新:基于发布/订阅模型,利用这个机制来清除其他服务上的 L1 缓存,用来保持 web 服务器上的缓存一致性。
另外Redis实例的 CPU都很低,不到2%,这点很惊人。
Push推送
开源库:NetGrain
使用 websocket 向用户推送实时的更新内容,比如顶部栏中的通知、投票数、新导航数、新的答案和评论。在高峰时刻,大约有 50 万个并发的 websocket 连接,这可是一大堆浏览器。
一个有趣的事实:其中一些浏览器已经打开超过 18 个月了。Someone should go check if those developers are still alive!!
问题:临时端口、负载均衡上的文件句柄耗尽,都是非常有趣的问题,我们稍后会提到它们。
Search搜索
Elasticsearch集群,每个ES集群都有3个Node
为什么不用Solr?
我们需要在整个网络中进行搜索(同时有多个索引),在我们进行决策的时候 Solr 还不支持这种场景。
还没有使用 2.x 版本的原因,是因为2.x版本中类型(types)有了很大的变化,这意味着想要升级的话我们得重新索引所有内容。
没有足够的时间来制定需求变更和迁移的计划。
Database数据库
SQLServer
Our usage of SQL is pretty simple. Simple is fast.
数据库中只有一个存储过程,而且我打算把这个最后残留的存储过程也干掉,换成代码。
监控系统
Opserver:轻量级监控系统,基于 asp.net MVC 框架,可监控:
Servers
SQL clusters/instances
Redis
Elastic search
exception logs
haproxy
欢迎加入本站公开兴趣群
软件开发技术群
兴趣范围包括:Java,C/C++,Python,PHP,Ruby,shell等各种语言开发经验交流,各种框架使用,外包项目机会,学习、培训、跳槽等交流
QQ群:26931708
Hadoop源代码研究群
兴趣范围包括:Hadoop源代码解读,改进,优化,分布式系统场景定制,与Hadoop有关的各种开源项目,总之就是玩转Hadoop
QQ群:288410967