当前位置:首页 > 热水器 > 文章正文

揭秘10亿+高并发应用若何实现高效稳定的开拓和运维

编辑:[db:作者] 时间:2024-08-25 06:27:15

本期直播主题是《构筑云原生时期的运用稳定性_DTT_直播_云社区_华为云》,华为云aPaaS DTSE技能布道师韫欣,与开拓者们互换了云原生时期的运用寻衅、趋势,跟大家分享了华为云运用平台AppStage的实践履历和精良案例,并展望了智能运维的未来。

揭秘10亿+高并发应用若何实现高效稳定的开拓和运维

云原生时期的运用寻衅和趋势

在飞速发展的数字时期,云原生已经成为了许多企业的首选,它不仅供应了灵巧性和可扩展性,还为运用程序的稳定性带来了全新的技能革命。
企业运用上云经历了三个阶段:

• 第一阶段,运用以“设备”为中央,工程师们看到的是一台台物理做事器,软件是支配在做事器上的进程,硬件和软件相对割裂。

• 第二阶段,以资源为中央,形成了云化的资源池,大幅提升了资源的利用率和利用效率。

• 第三阶段,是从以“资源“为中央走向以“运用” 为中央的云原生阶段,与第二阶段比较,紧张差异在于运用的设计和支配办法。
云原生运用是指利用微做事架构对运用进行解耦拆分,并以容器形式支配,更加灵巧和可扩展,能够更好地发挥公有云的上风,以应对业务的不愿定性,带来更高的开拓、运维和运营效率。

在这个转变过程中,也会面临一系列的寻衅。

• 第一个寻衅是云原生时期的技能繁芜度比较高,工具非常的碎片化,比如做事的编排与调度、容器化、安全合规等各方面的工具。
云原生运用设计、开拓、运维过程中,对开拓和运维职员的技能哀求高,无形中增加了企业的开拓本钱,降落了开拓效率。

• 第二个寻衅是大量事情花费在工程能力构建上,开拓职员真正的业务代码开拓事情只占20%旁边,隐形本钱非常高。
首先,每个运用构建都要考虑可靠性、可用性、安全、韧性、多云支配等一系列能力,存在重复造轮子的问题,造成了大量事情摧残浪费蹂躏。
其次,国家、行业、企业对安全可信、技能规范等有诸多哀求,缺少统一的平台来支撑落地,每个开拓职员对规范的解读不同,实现办法也会有差异,大幅降落了效率。
以华为的履历,如果这些问题得以办理,30%以上的隐形事情是可以被节省的。

• 第三个寻衅是云原生时期,掩护一个繁芜且快速变革的系统,会面临一系列的问题,比如碎片化的运维工具、版本的迅速迭代、人工效率低且不足规范等,随着业务链路加倍繁芜,问题跟踪和定位会越来越困难,业务数据量的增长也会导致数据库管理的问题变得尤为突出。

这一系列的运维问题须要未雨绸缪、提前方案,急迫须要云原生的运维尽快完成数智化转型。

华为云运用平台AppStage实践履历

针对以上寻衅,华为对内部云原生运用履历总结提炼后,打造了华为云运用平台AppStage产品,为客户供应了一站式智能运维平台,不仅避免了不同厂商和三方的浩瀚运维工具拼凑的问题,并且环绕无人值守变更、故障全生命周期管理、业务稳定性管理等三大站点可靠性工程 (SRE)的事情内容,来构建自动化和智能化能力,在提高运维效率的同时,也提升了做事质量、优化了运用可靠性。

自动化无人值守变更:帮助企业提升运维效率,减少人为缺点

1. 核心理念便是根本举动步伐即代码,将资源、配置、环境、状态等进行声明化定义,避免传统变更理解的差异,可确保任何环境、任何地点实行结果的同等性。
在变更自动化的评审、实行和验证过程中,实现全流程的自动化。

2. 通过一系列的变更灰度评估以及中断回滚等保险方法,确保变更过程和结果的安全可信。

3. 支配和变更的过程完备不须要人工干预,减少了职员误操作的可能,保障了变更质量。

通过这些优化,10分钟就能完成一个做事的全新支配,省去了大量的人工韶光。
华为内部统计,在变更事情中,故障率减少了40%,支配效率提升了30%。

监控与故障管理:全栈可不雅观测性和故障全生命周期管理,降落了业务从故障发生到规复的韶光,提升云原生运用整体做事质量

1. 通过对端、管、云全链路可不雅观测能力,打通数据孤岛,将这些数据有机关联起来。

2. 通过智能化的运维底座,将资源、配置、事宜、可不雅观测数据建模管理,合营AIOps智能算法,驱动根因诊断和非常检测等运维的高阶智能化运用。

3. 通过定期业务巡检、监控告警、故障演习训练等活动,做到故障全生命周期管理,实现1分钟AI非常检测和故障创造,5分钟故障根因诊断定界定位,并基于预编排的故障规复模板和微做事管理体系,实现核心业务场景10分钟故障快速规复。

可用性与连续性管理:通过混沌工程演习训练,实现确定性规复,助力可用性达到99.99%

1. 按IaaS-PaaS-SaaS分解可靠性哀求,形成运用稳定性指标体系,对运用可用性进行度量与管理。

2. 构建混沌工程演习训练平台,供应了50多种故障演习训练场景,80多种故障注入的方法,来充分验证业务和运用可靠性。

3. 通过故障演习训练创造问题,主动提升生产环境的稳定性,做到问题的提前预防和创造。

数据库管理:WiseDBA供应可信数据库管理方案,快速诊断数据库疑难问题

1. 支持RDS、GaussDB for MySQL、GaussDB for Cassandra等多个数据库引擎的管理。

2. 可对纳管数据库进行IT化巡检和管理,针对数据库慢查询进行分级管理,建立风险评估体系。

3. 支持DBDesigner、SQL审核等正向设计,从开拓阶段减少风险问题。

4. 供应数据查询、数据隐私白名单管理等能力。

FinOps:本钱管理确保运用稳定的条件下,帮助企业降本增效

随着业务的快速发展,企业在华为云上的各种资源花费也相应增长,须要对各种资源的利用情形进行有效管理,管控本钱。

1. 运用平台AppStage资源管理系统可构建资源台账,供应本钱可视化能力,清晰展示预算、资源用量和基于预测的趋势剖析。

2. 识别本钱摧残浪费蹂躏和非常增长的资源类型,并进行非常实时提醒。

3. 对资源进行智能检测,为业务定期天生资源利用报告,推举资源优化方案,同时给出本钱收益剖析,支撑本钱优化目标,提升资源利用率。

华为云运用平台AppStage案例分享

• 案例一:守护终端云环球数亿用户的全场景聪慧生活体验

运用平台AppStage支撑了华为终端云做事11亿+华为用户和50+运用的托管和运维,助力环球业务可用性连续多年达到99.99%,持续保持优质、安全的用户体验,助力华为终端云做事生动用户长期保持稳健增长。

• 案例二:XX公司基于运用平台重构软件生产能力,成为工业软件研发领域的领头羊

XX公司通过运用平台AppStage实现运维的统一入口、统一工具、统一数据,形成高效智能的运维体系,全面提升了软件工程协作效率,降落开拓职员门槛,助力版本发布效率提升30%,问题定位时长降落45%,运维协作效率提升15%,掩护总本钱降落10%。

未来展望运维大模型开启未来运维新时期

运维大模型:利用大措辞模型的自然措辞理解能力、推理方案能力和任务实行能力,从五个方面对一站式智能运维赋能

• 构建运维助手:帮助工程师解答日常运维事情各种问题,提升效率

• 助力巡检监控:自动实行巡检任务,实时监控指标,及时创造非常

• 帮助问题管理:自动探索剖析日志,给出根因诊断,匹配应急方案

• 供应变更方案:剖析变更哀求,分解任务,编写脚本,帮忙测试实行

• 开拓运维报表:自动剖析运维数据,天生运维报表,支持自然措辞互动调度

知识图谱与数字机器人领悟,推动运维智能化持续发展

运维知识图谱:通过将业务数据剖析提炼、抽取领悟,加工成运维知识图谱,并沉淀算法能力,以支撑非常检测和根因诊断等高阶运维活动。

智能运维数字机器人:利用智能运维数字机器人(RPA)准确匹配规复方案,并通过调用工具(API)做故障自愈和应急。

关注#华为云开拓者同盟# 点击下方,第一韶光理解华为云新鲜技能~

华为云博客_大数据博客_AI博客_云打算博客_开拓者中央-华为云

本站所发布的文字与图片素材为非商业目的改编或整理,版权归原作者所有,如侵权或涉及违法,请联系我们删除,如需转载请保留原文地址:http://www.baanla.com/rsq/156479.html

XML地图 | 自定链接

Copyright 2005-20203 www.baidu.com 版权所有 | 琼ICP备2023011765号-4 | 统计代码

声明:本站所有内容均只可用于学习参考,信息与图片素材来源于互联网,如内容侵权与违规,请与本站联系,将在三个工作日内处理,联系邮箱:123456789@qq.com