首页 > 企业站 > 企业站_企业观> 正文

公有云巨头机房突然故障!中小企业如何在运维领域避坑?

九月 责任编辑:liuxiaohui0705 发布于:2022-12-23 11:51 PConline原创

  去年,Meta发生近7个小时的全球性宕机事件,十几亿用户无法登陆Facebook、Instagram和WhatsApp;被逼无奈的Meta高管只能在Twitter上发布消息澄清事件。而此次事故也导致股价重挫,市值蒸发60亿美元。

  事后调查发现,导致事故的原因是一名运维人员错误的撤销了数据中心BGP连接的IP地址前缀,导致内外部服务域名均无法解析,公司内部通讯也大受影响,无法收发邮件。

  而就在本文撰写过程中,在公有云市场占据统治地位的某云服务提供商的香港节点的云主机、云数据库服务爆出无法访问故障,导致多家澳门重要企业和机构的业务发生宕机;故障持续时间约8小时。就目前爆出的消息来看,故障原因系机房制冷设备故障所导致。

  这些事故看起来都事出有因;但深究起来,我们不禁会问,为何一名普通工程师能随意更改如此关键的业务参数?备用制冷设备和冗余制冷量为何没有帮机房撑过设备抢修期?其他保障机制和危机预案为何没能在第一时间生效?应急团队为何花了如此长时间才修复了故障……

  显然,运维并不是一条指令或一套工作流程,而是一个涉及诸多方面的完整体系。而在业务大量数字化的今天,运维水平的高低甚至直接关系到业务的成败。

运维:理想很丰满、现实很骨感

  数字化的办公空间、以虚拟机或容器为基础构建的业务体系、以数字方式开展的各类业务……甚至连楼宇管理、安防和生产流水线都在通过IoT、传感器、数字终端等技术生成数字孪生,进而实现数字化的管理和运营。在这一背景下,企业需要越来越庞大的基础架构来驱动生产经营和管理。因此,基础架构的运维能力也就成为支持企业数字化转型的必要能力之一。

  然而在越来越高的ICT软硬件采购压力之下,留给运维的资源往往非常有限。在人员数量和素质都多重受限的情况下,多数运维团队仅能做到保证各类设备的正常运行。更甚者,在很多危及业务安全或体系发展的深层问题上,只具备基础运维能力的团队并没有能力进行应对或做出改进。

  另一方面,对于优化软硬件的运行效率、为数字化转型献计献策等进阶需求而言,这些能力往往需要建构在大量高级别人才和相当长的匹配、磨合、试错周期之上。而这并不是所有企业都负担得起、等得起的。

解读运营痛点,探寻路在何方

  那么是否存在成本可控且能快速解决企业多层次运维需求的方法?要回答这一问题,首先要知道企业的运维痛在何处。

  细看企业遇到的运维痛点,多数都是存储性能优化、备份策略优化、网络优化、服务器资源优化等问题。这些痛点虽然解决起来相对困难,但处理好之后却能在相当长的时间周期内为企业带来实际收益;并且,只要企业的业务架构不发生变化,这些问题也很难再次出现。

  显然,为了解决这些较少复现的“一次性”问题而花费巨大精力去构建全功能、高水平的运维团队是很低效的投资行为;而以外购服务的方式聘请专家协助解决就成了相当明智的选择。当然,在这些涉及到业务、基础架构等敏感内容的领域,企业当然也应该看重服务提供商的资质、经验和商誉。

  有了对病因的分析和理解,对症下药便不是难事。

全能力巡检团队,随时任君调度

  作为经久不衰且广受赞誉的国际ICT解决方案提供商,戴尔不仅能够为企业提供计算、存储、网络、云计算、安全等相关的软硬件解决方案,更在这些领域拥有强大的技术积累和部署实施经验;对解决运维层面的各类挑战也驾轻就熟。而以此为基础,戴尔也能够为中国客户提供巡检、存储专家驻场、Cyber Recovery数据避风港等众多专业服务,帮助企业解决多层次的运维需求。

  01、资深大咖,提供专业化服务

  戴尔巡检服务派驻的专家均经过长时间的培训,对Dell EMC及各大主流厂商硬件产品的使用、排障及调优方法均有丰富经验。在全球最大的IT技能考试培训机构Pearson VUE的调查排名中,戴尔巡检服务团队排名前十。而更重要的是,所有派驻专家的履历和全部服务过程均有完备记录可查,能够随时进行复盘和溯源,保证服务质量与服务过程可靠。

  02、种类齐全,横扫各类ICT问题

  戴尔巡检服务能够基于企业当前的基础架构现状和业务需求,为企业提供数据存储优化、数据保护方法及策略制定、服务器和网络调优、融合基础架构使用指导等众多企业在过渡到新技术时所需的调优服务。目前,巡检服务支持超过25个品牌的PC、服务器、存储、网络等设备,且保证认证工程师能够提供全程的1对1服务,既能确保客户体验前后一致,也能降低沟通成本。

  同时,戴尔巡检服务也能提供面向多云架构、数据中心现代化、云原生应用体系构建、应用程序优化、数字化工作空间建设等方面的解决方案及转型建议,成为企业在数字时代快速前行的优秀向导。

  而在巡检服务之外,戴尔还为客户准备了存储驻场服务和Cyber Recovery数据避风港服务。前者能够针对性的解决客户经常遇到的存储设备配置及调优问题,帮助客户用对、用好各类存储功能;而后者则能通过专业咨询,帮助企业客户评估目前的网络攻击风险及业务和技术层面的漏洞短板,并提供针对性的分析报告,继而帮助企业建立数据备份及恢复策略。

  03、降本增效,赢战数字时代

  经过众多客户的实地验证,戴尔巡检服务能将企业基础架构中的技术利用率提升47%、技术性提升50%、平均每月减少23起各类ICT相关的故障和风险事件、让员工的工作和业务效率提升45%。而这些收益更是在运维服务交付成本降低40%、技术过渡周期平均减少9周的前提下实现的。

  存储专家驻场服务则能以业务需求为导向,因地制宜的解决各类存储问题,让海量存储设备发挥更高效能。

  而Cyber Recovery数据避风港服务则能帮助企业客户快速提升业务的合规性与安全性,让企业获得业务发展的底线保障。

好的服务,掷地有声

  当然,千行百业的运维各有侧重,不同企业的所遭遇的运维难题更是不一而足。但对于专业能力傍身的戴尔巡检服务团队来说,问题总能迎刃而解。

  在江苏某传媒公司,客户遇到的问题是新购置的9台工作站在CentOS 6.7系统内无法识别硬盘;而新项目的交付期临近,客户急需要高水平的工程师定位故障、迅速排障。好在,客户购买了戴尔巡检服务内的Prosupport服务。

  了解到情况之后,戴尔迅速安排了工程师了解详情,并将问题转交给L2和L3级后台工程师和相关的研发团队。经过仔细复盘和研究,戴尔发现问题源自CPU平台的兼容性,而非工作站本身故障;而在换用最新版处理器后问题便能解决。

  从接到问题到发现解决方案并帮助客户完成修复,戴尔巡检服务Prosupport只用了2天半。如此快捷的响应速度和对软硬件复杂问题的处理能力更让客户感到惊艳。

  而在购买了Prosupport Plus白金服务的厦门某科技公司中,戴尔资深工程师在定期巡检服务中发现,客户服务器中的光纤HBA卡在最近几周的日志文件中有3次链路报警记录。发现这一情况的工程师迅速联系客户,进行了上门服务,最终确认光纤HBA卡存在故障并进行了更换;而安装这块光纤HBA的服务器则运行着公司的ERP和OA等系统。

  显然,此次主动运维免除了一次即将发生的企业核心业务故障,而客户对戴尔巡检服务工程师的主动服务精神和认真细致的态度也给予了高度赞扬。

早买早享受,现买有折扣

  数字时代,基础架构的作用和价值早已无需多言;而将基础架构运维做好,企业不仅能获得强健的业务系统,更能以轻盈的身姿拥抱数字化转型。对于已经拥有戴尔巡检服务的客户来说,运维早已不再是痛点,而是业务创新的启点。而对于还未体验戴尔巡检服务的客户来说,此刻就是绝佳时机。

  目前,戴尔年终采购季正在进行中,以包括巡检、存储专家驻场、Cyber Recovery数据避风港等在内的众多服务优惠等你来领:

  此外,戴尔还提供了海量的满赠活动,至高可得价值2,768元坞站。

  扫码联系戴尔真人客服,获得1v1专属服务,为您的企业保驾护航

九月

网友评论

聚超值•精选

相关推荐 手机 笔记本 影像 硬件 家居 商用 企业 出行 未来
二维码 回到顶部