网络游戏的服务器维护都是在做些什么?

知乎日报 林路翔 137℃ 评论

网络游戏的服务器维护都是在做些什么?

图片:魔兽世界

网游类似魔兽世界的服务器维护都是在干嘛?

林路翔,全职程序员,喜欢围棋

来,我作为前网易游戏从业人员来说说真正服务器维护时候在做什么。

服务器维护分成两种,紧急维护和日常维护。

紧急维护一般就是硬件故障或者严重 Bug。这个时候是各个团队最紧张的时候。每个团队都忙个不停。

  1. 运营团队会发布公告,安慰玩家,统计损失,编写故障报告,评定故障等级等等
  2. 策划团队可能会考虑 Bug 的影响程度,决定要不要回档,或者赔偿什么,赔偿会不会影响经济系统等等。
  3. 程序团队最重要的是缩小 Bug 的影响,比如热更新屏蔽玩法,然后解决 Bug。有时候硬件故障会导致整个服务器某些结点负载不均衡,或者万一数据库服务器挂了就得赶紧切数据库。
  4. QC 团队会继续测试一下,包括改好的版本,QC 老大一般有一票否决权决定某个版本是不是放
  5. SA 团队会有人值班紧跟,如果硬件问题就联系 IT 去换啊之类的。

日常维护就流程化多了

  1. 运营团队会提前放出更新内容,做好新玩法预热
  2. 策划会最后在内服上跑一跑玩法看看有没有问题,然后等着正式开服以后去论坛看玩家反应
  3. 程序一般就是更新代码,部署到服务器内部测试,如果架构有改动,就和 SA 配合一起跑脚本改架构。同时,另一拨人会跑一堆脚本,包括和计费的对账脚本,导数据的脚本,更新各种榜单的脚本,预热数据库和 cache 的脚本等等。每个人也会对自己的模块再测试一遍,然后会盯着各种警报
  4. QC 团队也会在服务器上面把本周新玩法和主流程再测试一遍。
  5. 其他支持团队就是日常配合工作。

另外看到很多答案都说重启服务器,其实我想说,我们真的很少重启服务器的。每次重启代价都很大。除非硬件更新或者特殊情况是不会重启服务器的。

  1. 其实一般意义上讲服务器重启可以理解为两种,一种是硬件重启,一种是服务器进程重启。硬件重启比较少,服务器进程重启基本上是必须的。
  2. 很多人问为什么硬件重启代价很大。感觉大家的回答。我直接把评论补充上来。
@曦和风
如果是自动启动的程序的话没有问题,但是服务器很多系统配置和软件设置都要开机后重新折腾,同时,还要和其他的服务器通信,恢复到启动前的状态,或者从其他服务器同步信息,正确处理关机期间的各种操作,事情多,任务重,出错概率大,都不愿意重启吧。

还有人提问为什么维护了这么长时间。我想说,请去客服专区或者论坛发帖,会有一大波运营人员过来安抚你的。

还有人抱怨一个礼拜维护两次这种。我想说 EVE 这种神作是每天早上维护一次呢。维护也是为了大家能更好地游戏啊。(吐槽一下谁让 EVE 用的是 Windows 服务器呢。)

转载请注明:微图摘 » 网络游戏的服务器维护都是在做些什么?

喜欢 (0)or分享 (0)
发表我的评论