梦殇国际

标题: 携程解释瘫痪原因:员工错误操作 删除服务器执行代码 [打印本页]

作者: 阿星    时间: 2015-5-29 14:06
标题: 携程解释瘫痪原因:员工错误操作 删除服务器执行代码
携程目测要承担民事责任
昨日上午11:09,携程官方网站及APP大面积瘫痪,无法正常使用。直到昨日晚间23:29,携程官方网站及APP恢复正常。对此,携程向凤凰科技发来声明,称经技术排查,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。

携程在声明中说,携程后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个Web Service组成,而每个应用子系统和每个Web Service之间都存在着相互调用的依赖关系。发生事件后,携程的技术人员除了需要恢复生产服务器上的执行代码以外,还需要做的是恢复并确保每个应用子系统以及每个Web Service的功能正常,同时确保应用子系统与Web Service间的调用关系得以正常执行。因此才花费了十二个多小时才恢复正常。
携程称,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损。
对于该员工后续如何处理,携程方面暂未表态。
以下为携程的简要原因说明:
1、事件发生原因
经携程技术排查,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。
2、为什么恢复时间那么长
一般来说,类似携程这样的大型网站承载着繁多业务,其后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个Web Service组成,而每个应用子系统和每个Web Service之间都存在着相互调用的依赖关系。
发生事件后,携程的技术人员除了需要恢复生产服务器上的执行代码以外,还需要做的是恢复并确保每个应用子系统以及每个Web Service的功能正常,同时确保应用子系统与Web Service间的调用关系得以正常执行。
这种验证性的操作需要携程的工程师及运维人员通力合作,尽快恢复生产代码并通过反复地、持续性地调试以确保应用子系统与Web Service功能的正常运行。
携程再次保证,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损,请用户放心并继续使用携程网站及App。
3、如何杜绝此类事件的再次发生?
携程在系统上做了改进,规范并杜绝技术人员错误删除生产服务器上代码的操作。


作者: smoke    时间: 2015-5-29 14:12
不是说是员工报复么

作者: 阿星    时间: 2015-5-29 14:56
smoke 发表于 2015-5-29 14:12
不是说是员工报复么

不知道,损失了七千万

作者: 喷冥    时间: 2015-5-29 17:58
c语言太重要

作者: smokes    时间: 2015-5-29 18:00
携程也不靠谱了?

作者: 阿星    时间: 2015-5-29 18:19
smokes 发表于 2015-5-29 18:00
携程也不靠谱了?

谁知道呢

作者: smokes    时间: 2015-5-29 18:35
阿星 发表于 2015-5-29 18:19
谁知道呢

看来都不靠谱了

作者: smoke    时间: 2015-5-29 21:27
阿星 发表于 2015-5-29 14:56
不知道,损失了七千万

够猛的

作者: 青青子衿。    时间: 2015-5-30 09:48
是他干的
(, 下载次数: 1)

作者: 阿星    时间: 2015-5-30 10:00
异次元杀阵 发表于 2015-5-30 09:48
是他干的

不一定

作者: duo嘟嘟    时间: 2015-5-30 11:08
哈哈。

作者: 逗逗    时间: 2015-6-14 09:32
那个员工是不是卧底????





欢迎光临 梦殇国际 (https://714.hk/) Powered by Discuz! X3.4