编辑:[db:作者] 时间:2024-08-24 23:11:15
这次宕机持续近12个小时,算是滴滴近年来瘫痪韶光最长的一次故障。
滴滴2023年第三季度财报显示,单季度中国出行业务总交易额为725亿元,日均单量达到3130万单。据此,有媒体估计将会让滴滴丢失过千万的订单量和超4亿的交易额。
而除了滴滴外,阿里云在不到10天的韶光里也涌现了两次故障。
第一次是11月12日下午5点多,阿里云涌现非常,随之“淘宝又崩了”“闲鱼崩了”“阿里云盘崩了”“钉钉崩了”等话题相继登上微博热搜。
缘故原由是2023年11月12日17:44起,阿里云产品掌握台访问及API调用涌现涌现利用非常,阿里云工程师正在紧急参与排查。当天晚上7点20旁边规复正常。
第二次便是昨天,阿里云再次涌现故障,不到两个小时后得到修复。
阿里云声明称11月27日09:16起,阿里云监控创造北京、上海、杭州、深圳、青岛 、喷鼻香港以及美东、美西地域的数据库产品(RDS、PolarDB、Redis等)的掌握台和OpenAPI访问涌现非常,实例运行不受影响。经由工程师紧急处理,访问非常问题已于当日10:58规复。
而事实上,阿里云在近几年曾涌现多次事件。从2018年至2022年的5年韶光里,阿里云曾有3次大事件。
2022年12月18日,阿里云爆发喷鼻香港Region可用区C大规模做事中断事宜,导致多个喷鼻香港及澳门站点受到影响。当时阿里云坦言:“这对很多客户的业务产生重大影响,也是阿里云运营十多年来持续韶光最长的一次大规模故障。”
后来,阿里云发布了事宜解释,公告显示,冷机系统故障规复韶光过长、现场处置不及时导致触发消防喷淋、客户在喷鼻香港地域新购ECS等管控操作失落败、故障信息发布不足及时透明是导致这次宕机韶光长、规模大的四大主要缘故原由。
下面我们再来盘点下近几年来影响较大的宕机事宜。
先看看国际宕机事宜:
Facebook史上最严重宕机长达7小时,市值蒸发数百亿
2021年10月5日,Facebook、Messenger、Instagram和WhatsApp等Facebook旗下运用均涌现故障。
据理解,这次宕机长达7个小时,刷新了 Facebook 自 2008 年以来的最长宕机时长。
这次宕机影响到环球数十个国家和地区用户,Facebook险些所有的产品都受到波及,乃至内网都无法利用。Facebook拥有几十亿用户,影响范围不可想象。
宕机期间,大量用户涌向了Twitter、Telegram等其他运用,又进一步导致这些运用程序的做事器崩溃。
后来Facebook对宕机缘故原由进行相识释。
声明中称:“据我们工程团队的理解,折衷数据中央之间网络流量的主干路由器的配置变革导致了通信中断,由此对我们数据中央的通信办法产生了连带影响,使我们的做事陷入停顿。”
当日Facebook股价盘中暴跌6%,市值减少数百亿美元,扎克伯格个人财富一日蒸发逾60亿美元。
当时有媒体宣布,专家估计Facebook、Instagram、WhatsApp环球做事中断一小时就将给环球经济造成1.6亿美元的丢失。
ChatGPT和API做事涌现严重停机 CEO公开报歉
根据网络状况监测网站Downdector的数据显示,大概从11月8日北京韶光周三晚22点旁边开始,涌现大量网友报告OpenAI的ChatGPT和API(供应给开拓者搭建第三方做事的运用程序接口)全都无法利用。全体故障的韶光大致持续了100分钟。
OpenAI也将这次的事宜定义为“严重停机”(Major Outage)。公司在北京韶光11月8日21点54分宣告做事涌现问题。终极在当天23点33分,OpenAI确认已履行修复方法,做事开始逐渐规复。
为此,OpenAI CEO山姆奥特曼在X(原推特)上揭橥公开报歉称,本周发布的新功能碰着远超预期的利用量。公司原操持在周一为所有订阅者启用GPT做事,但目前还无法实现。奥特曼进一步表示,由于负载缘故原由,短期内可能还会涌现做事不稳定的情形。
苹果公司也多次宕机
作为环球最受瞩目的科技公司,苹果也有过宕机事宜。
在去年苹果曾多次涌现宕机事件,一月份有1次,3月份有2次,8月份还有一次。
2022年1月26日,苹果iCloud做事遭遇大范围宕机,受影响严重的地区有纽约、芝加哥、洛杉矶。
同年3月23日,苹果再次涌现做事器宕机。来到8月份,苹果的一些iCloud做事发生了中断。
2023年5月11日,苹果环球做事经历了55分钟的大规模宕机,导致许多用户的 Apple ID / iCloud 账户溘然登出,无法登录。宕机的缘故原由是数据中央的严重故障,导致苹果公司的多项做事无法正常运行,包括 iCloud、App Store、iTunes 等。
谷歌曾一年就4次宕机
谷歌也常常发生宕机事宜。
2022年8月8日,美国爱荷华州康瑟尔布拉夫斯的谷歌数据中央发生电力事件,导致3名电工严重烧伤。
据媒体宣布,3名电工在数据中央大楼附近的变电站事情时,溘然发生了电弧闪光,事件造玉成球40多个国家/地区的至少1338台做事器中断做事,谷歌搜索遭遇环球性宕机。
此外,在2020年谷歌就发生了4次宕机事宜。
特斯拉环球性宕机
2020年9月,特斯拉系统遭环球性宕机。
从美东韶光9月23日11点开始,特斯拉车主便无法通过手机App连接到汽车上。同样的问题也发生在特斯拉的能源产品上,特斯拉太阳能和Powerwall储能电池用户无法监控他们的系统。
有用户在宕机追踪网站Down Detetor上表示,特斯拉App在iPhone上显示已经“冻结”,卸载、重新下载了后App则显示“涌现缺点”。受到影响的车主大部分来自美国,英国、德国、俄罗斯等欧洲国家的车主也报告了类似的问题,一些中国车主也反响了特斯拉App手机钥匙断开连接的问题。
有网友在推特求救称,自己在一个沙漠的超级充电桩,但被锁在Model 3车外了,特斯拉App无法连接到车上,已经拨打紧急道路接济电话快两小时了。
这并非特斯拉第一次涌现全部系的宕机。早在2018年4月21日,从下午开始一贯到越日早上,浩瀚特斯拉车主经历了永劫光的App宕机。当时,特斯拉承认涌现了问题并表示当日晚间已经修复,但许多车主在越日早上仍在经历同样的问题。而2017年3月7日,特斯拉的APP和API停机险些长达24小时。
云打算巨子OVH数据中央大火导致360万个网站下线
2021年3月份,欧洲云打算巨子OVH位于法国斯特拉斯堡的数据中央发生严重失火,该区域统共有 4 个数据中央,个中一个数据中央被完备烧毁。大火6个小时才被息灭。
据理解,这次多达360万个网站下线。
受到这次大火影响的客户包括欧洲航天局的数据与信息访问做事ONDA项目,此项目卖力为用户托管地理空间数据并在云端构建运用程序。Rust旗下的游戏事情室Facepunch Studios证明,有25台做事器被烧毁,他们的数据已在这场大火中全部丢失。纵然数据中央重新上线后,也无法规复任何数据。
美国民航系统瘫痪
数百架次航班取消2023年1月11日,美国民航系统于当地韶光周三早间瘫痪,导致当日9时全美所有航班禁飞,超过4000架次海内国际航班耽误,据 FlightAware 数据显示,截至美东韶光8时50分,全美约698架次航班取消。
这次故障可能源于翱翔任务关照系统的一个文件破坏,而在紧急情形下利用的备份系统也创造了破坏文件,美国联邦航空管理局被迫重启系统,导致航班大面积耽误或取消。
再来看看海内宕机事宜:
唯品会宕机12小时
丢失超亿元今年3月29日,“唯品会崩了”登上热搜,由于崩溃韶光太长,影响了很多消费者无法正常下单,唯品会官方对此回应称,因系统短时故障,主站“加购”等功能或涌现非常。
6月5日,唯品会发布“关于329机房宕机故障处理公告”,公告称,3月29日(00:14-12:01)南沙IDC冷冻系统故障,导致机房设备温度快速升高宕机,造成线上商城停滞做事。这次事件影响韶光持续12个小时,导致唯品会古迹丢失超亿元,影响客户达800万,唯品会将这次故障剖断为P0级故障。
公告指出,唯品会决定对这次事宜严明处理,对应部门的直接管理者承担这次事件任务,根本平台部卖力人予以撤职做相应处理。
招商证券三个月崩2次
2022年3月和5月,招商证券涌现了2次系统崩溃情形。
3月14日早间开盘后,陆续有网友在社交平台反响招商证券交易系统涌现系统故障,包括无法成交、无法撤回等。随后,“招商证券崩了”登上微博热搜。
5月16日,有大量投资者再次反响招商证券系统崩溃,电脑和手机都无法登录。
事实上除了招商证券,今年3月份,东方财富证券交易软件在一个交易日内涌现“两连崩”。
语雀宕机7小时影响数千万用户
2023年10月23日,蚂蚁集团旗下的在线文档编辑与协同工具语雀发生做事器故障。从故障发生到完备规复正常,语雀全体宕机韶光将近8小时。
语雀方面表示,10月23日下午,做事语雀的数据存储运维团队在进行升级操作时,由于新的运维升级工具bug,导致华东地区生产环境存储做事器被误下线。
百度宕机系运营商DNS问题
2018年11月9日,百度网站疑似崩溃,移动端和网页端均无法打开。对此百度方面回应称,系运营商DNS问题,影响北京联通部分用户。
据理解,本次事件紧张涵盖北京地区的联通用户。详细表现为无法打开百度移动端和网页端。目前,百度方面称,已与运营商方面联动,目前已经定位并正在加紧修复该问题。
宕机缘故原由都有啥?
做事器宕机的缘故原由五花八门,常见缘故原由有:
硬件故障:做事器的硬件组件(如电源、内存、硬盘、主板等)涌现故障,导致系统无法正常事情。
软件问题:操作系统、运用程序或驱动程序涌现缺点、崩溃或冲突,导致系统不稳定乃至宕机。
资源耗尽:CPU、内存、磁盘空间或网络带宽等资源耗尽,使做事器无法连续运行。
网络问题:网络故障、网络攻击(如DDoS攻击)或网络设备问题导致做事器无法正常访问或通信。
电力问题:电源不稳定、电压颠簸、电力供应中断等问题导致做事器关机或宕机。
安全问题:恶意攻击、病毒、恶意软件或黑客入侵导致做事器宕机或无法正常事情。
操作缺点:误操作、配置缺点或不当的系统管理操作可能导致做事器不稳定或宕机。
数据库问题:数据库故障、去世锁、数据破坏等问题可能影响运用程序和做事器的正常运行。
温度问题:过高的温度可能导致做事器硬件破坏或系统关机,尤其是在散热不良的情形下。
文中提到的例子中,很多都有涉及。比如ChatGPT便是范例的做事器负载过大;美国民航系统是文件破坏,不得不重启系统;还有唯品会是运行环境的冷却系统故障,高温导致机房宕机。
除了以上缘故原由,我们还能把稳到失火等危险也是做事器面临的主要磨练。
当然做事器宕机是个繁芜的问题,可能受到多重成分的影响,背后的缘故原由也比我们想象的繁芜。
有人认为最近频繁的宕机或许和职员优化有关,得出人才缺失落的结论。这种说法看似有点道理,但实则没有有力依据。
对一个成熟公司来说,边缘业务可能由于人才流失落受到较大影响,而核心业务根本不会。
你说是不是呢?
本站所发布的文字与图片素材为非商业目的改编或整理,版权归原作者所有,如侵权或涉及违法,请联系我们删除,如需转载请保留原文地址:http://www.baanla.com/lz/zxsj/21140.html
下一篇:返回列表
Copyright 2005-20203 www.baidu.com 版权所有 | 琼ICP备2023011765号-4 | 统计代码
声明:本站所有内容均只可用于学习参考,信息与图片素材来源于互联网,如内容侵权与违规,请与本站联系,将在三个工作日内处理,联系邮箱:123456789@qq.com