互联网终于不是“怕挤易爆品”了

ACM比赛整理

共 5215字,需浏览 11分钟

 ·

2022-08-25 04:01

题图 | 视觉中国

 

今日,年轻人们已经很难想象过去的互联网“宕机”的窘迫。

 

2010-2016年,由于智能手机和移动互联网的快速普及,中国互联网行业曾陷入了一波被“挤兑”的风潮。

 

比如早年的“双11”,一旦跨越零点,整个淘宝都会出现明显的卡顿,甚至是进不去购物车、无法结算。

 

2011年上线的铁路线上购票平台12306,同样是大家挤破头的重点目标,每逢节假日、寒暑假,12306就屡屡宕机,以至于当时的官方都建议旅客们“绕道”打电话买票。

 

10多年时间眨眼过去,“宕机”成了稀客。

 

“双11”的销售额在13年间,已经翻了10000倍,峰值订单量更是从最初的400笔/秒,增长到了超过58.3万笔/秒,换算过来增长了近1500倍,大幅的交易量增长,对应的是愈发平稳的使用体验,连卡都不卡,更别提宕机了。

 

12306也一改往日模样,将访问流量切到阿里云后,肩负着全年峰值近40亿次旅客的购票任务,通过稳定且高效的服务,有效支撑了中国铁路系统高铁化的进程,也由此拉动了许多地区的经济发展。

 

有人说,00后这代人是幸福的,他们是互联网的原住民,出行有高德地图、12306,叫外卖有饿了么,看资讯有微博、头条,看视频有B站、抖音,不出门办事有“浙里办”等政务app。

 


体验顺滑的互联网,就像即插即用的电力、拧开水龙头就流出的自来水一样,正在成为生活司空见惯的一部分。这些生活中最常见的应用背后,都是云计算在支撑。不知不觉,我们的衣食住行都被云计算给“包圆”了。

 

归其根本,互联网行业这些年的持续发展,离不开“负重前行”的阿里云们。也正是云计算这把不断壮大的“薪火”,让互联网持续发出了耀目的“火焰”。

 

起于“吝啬”的云计算

 

2001年,全球互联网投机泡沫破裂,市场中无脑支持互联网企业烧钱扩张的态度,发生了180度转向。

 

互联网企业在狂奔30年后,终于撞上了一个现实问题:面对不断扩张的业务规模和激烈的行业竞争,如何降低成本?

 

亚马逊面临的挑战尤其突出:线上销售业务的季节性极强,大多数日子的业务流量都比较平均,可到了“黑色星期五”(美国版双11)等传统购物高峰期,流量就要多上十几倍。

 

这造成了一个尴尬的局面,如果按照峰值购买服务器,平常就只能“吃灰”;如果不多储备服务器,流量一上来又得宕机。

 

当然,故事的结局已经尽人皆知,亚马逊第一个搞出了云计算。形象点说,就是把服务器资源变成了一块随意揉捏的“橡皮泥”,业务需要多少,就“扯”下来多少。

 

放到具体业务上,一旦需求陡增,就从整个云计算的资源池里抽调更多来支撑,在需求回归正常之后,再把抽调的资源还回去。因此,企业只需要支付一小段时间的资源占用成本。

 

这种按需索取,灵活调控的操作方式,从根本上解决了互联网高速发展背后的成本问题,让整个行业在过去的20年里获得了巨大的发展。

 

但站在今天回看,第一代云计算“打补丁”的意味非常明显。在整体硬件架构基本不变的基础上,亚马逊确实实现了硬件资源的“虚拟分割”,效率不高但“凑活”能用;硬件的使用率有提升,但闲置率还是很高。

 

接下来几年里,行业不断将这套“分割大法”从硬件层向软件层拓展,于是乎就出现了初期云计算的3种产品类型:基础架构即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaS)

 

粗略看起来,SaaS似乎已经是“化整为零,高效利用”打法的尽头,毕竟在这种模式下,从网络到应用(例如不同APP都能实现的语音识别)已经全部由云厂商直接提供,但浪费依旧严重。

 

以电商为例,在引入云计算之前基础设施建设的标准是“能够承受峰值”,实际的硬件利用率不过10%左右。而通过云计算早期打补丁式的发展,资源得到了较粗颗粒度的化整为零、重新利用,硬件利用率逐步提升至15-20%,变相节约了40-50%的成本。

 

这样的成绩从成本角度看,已经非常惊人,但实际利用率上仍不算高。核心问题出在“分解+重新利用”的整个过程,初期云计算的现实基础和“刀法”不支持细致的分解,自然也无法在组合步骤获得更大幅度的提升。

 

既然修修补补不好用,那不如从头来过?

 

完整为云计算重构的思路应运而生,并被形象地称为“云原生”,为云而原生。

 

云原生的时代

 

从技术的视角看,云原生是对云计算的又一次自我颠覆。除了将原来各个层级的组件被再次打散、重组,形成更高效的解决方案,还加入了基础设施容器化(统一基础设施架构、提升运转效率)、DevOps等近几年云计算行业新浮现的理念和解决方案。

 

在实际应用中,表现为客户全方位用起来“更顺手”,在硬件利用率上再次跃升,理想状态下可提升至40-50%,比起不使用云计算成本有了400-500%的提升。

 

云原生的效果固然明显,但也给云厂商提出了更高要求:


一来重构过程中的很多技术,实际上在过去也有所应用,厂商必须有能力修改、重造;


二来重构需要大量的人力物力和时间,厂商必须有“重来”的决心。

 

说白了,没有金刚钻,揽不了这瓷器活。

 

 

不过,今年一季度,国际权威咨询机构Forrester刚刚发布了全球公有云容器服务的能力报告,在其"领导者"象限中,就出现了中国云计算龙头阿里云的身影。值得一提的是,这也是中国云计算厂商首次进入该象限。

 

Forrester在其报告中,对阿里云在容器服务上的表现给予了高度的评价:

 

“阿里云在服务网格支持、容器和 VM 运行时支持、容器镜像支持、安全特性和策略、成本管理、混合云支持、边缘计算支持、容器存储和网络等方面具有强大的能力;相关客户还称赞其在日志记录和监控方面有出色的可观察性、高效地管理集群生命周期,与多款服务无缝集成;在微服务开发支持、DevOps 自动化等垂直领域具有深厚的能力。尤其适合瞄准中国和亚太市场的全球企业或布局海外业务的本地公司,来获得沉淀于先进实践经验的全面云原生数字化转型能力。”

 

之所以阿里云能够比AWS、微软等国外巨头取得更好成绩的关键,在于阿里云自身对于云计算技术研发的坚持,在过去近15年的发展历程中,阿里云几乎每年都在持续输出全新自研成果。

 


还是以云原生为例,早在2018年阿里云刚实现部分核心电商业务“双11”上云,就已经定下了集团规模化上云的远大目标。紧接着通过三年的努力,才将核心交易系统云原生化,并且在各个业务部门推进上云方案设计和验证,最终才在2021年彻底实现首个全面云上运行的“双11”。

 

截至目前,阿里巴巴的所有业务已经全部迁上阿里云,整体运行效率较之前再次获得大幅提升:研发效率提升了20%、CPU资源利用率提升30%、在线业务容器可达百万规模。

 

有了阿里云自身全面上云,全面云原生化的榜样在,越来越多的阿里云客户也加入了第二次云计算变革。

 

“高质量上云”浪潮

 

对于阿里云的客户而言,云最直接的价值莫过于降本增效,具体来说,云原生技术有四个维度的优势:快速部署、业务稳定、节省资源、开发高效,这些往往综合体现。

 

大家所熟知的微博,面对的挑战就和亚马逊类似,也是少数时间需要远超平时的基础资源,但难度水平要高上许多。不仅如此,热点还不像“购物节”可以提前准备,会有多“爆”也不容易预估,因此云计算的弹性调用难度提升了数个量级。

 

阿里云和微博合作,建立了高效的云原生方案,“弹性裸金属+容器”的解决方案不仅能弹性伸缩,热点应对更加高效便捷,峰值日弹性可达数十万核CPU,可以帮助微博轻松地支撑其突发流量并保障业务稳定性。

 

同样受益于阿里云云原生技术的,还有年轻人最爱的B站。作为国内主流的视频平台,B站对于可靠性,性能,跨地域数据同步等有极强的要求,同样是传统数据库架构无法满足的存在。阿里云随之给出了“应用型负载均衡ALB+数据库tair”的云原生解决方案。

 

前者的高性能及弹性能力,满足了B站广告业务每秒上百万请求的处理调度,同时搭配DNS实现多地域间的流量调度。后者具备极高的高可用及扩展性能力,跨地域数据自动同步,秒级延迟,多地域之间就近读写,降低架构复杂度和管理成本。简单来说,B站云计算架构上的升级,实现了自身广告业务的效果提升,还完全不会干扰到用户的实际使用体验。

 

同样是广告业务,在近几年中国企业的出海浪潮中,专注于提供移动广告技术服务的汇量科技取得了亮眼的成长,它的云计算供应商同样是阿里云。汇量科技的业务遍布全球,服务超过200个国家和地区的客户,日均能够完成2000亿次广告请求和全球20亿DAU(日活跃用户数量)

 

庞大的需求自然对应高耸的成本,汇量科技2017年联合阿里云推出了大型弹性集群管理平台SpotMax,将阿里云整合后碎片化的全球云资源使用效率进一步提高,实现了云原生资源利用效率上的进一步提升。通过这一创新,汇量科技的单位广告请求成本降低了65%,最高为企业节省了90%的用云成本。

 

在商业之外,阿里云还赋能了更多社会公益。

 


今年6月,网易瑶台携手青海省玉树藏族自治州称多县政协,举办了一场公益摄影展,在线上三维举行,不仅有明确的展厅间隔,还有横纵交错的展墙。其最大的亮点是用户可以操控虚拟人物,跟朋友一起逛展、聊天,交流对作品的理解和感悟,几乎完整还原了线下的艺术展览。

 

为了让用户便捷地体验如此未来感的虚拟活动,网易瑶台提供了一种通过浏览器快速参与活动的方式,让性能普通的便携设备也能享受精美的活动场景,而这意味着需要将场景放到云端进行渲染,并将结果进行实时传输。在这其中,阿里云提供了基础的云原生云计算能力,如云服务器ECS、专有网络、弹性 IP、云监控、访问控制等。

 

与此同时,阿里云的全球大规模部署帮助瑶台实现了就近接入、更低的网络延迟和更好的沉浸体验;按量方式的开通部署,能够提供充足的弹性GPU供应,来支持各类活动突发状况;阿里云的渲染能力与 AI 性能,也能让用户享受到优质的视觉体验。

 


面对云计算行业越来越虚实结合的发展趋势,阿里云也在持续推进自身的技术支撑能力,目前已经拥有了虚拟演唱会等 3D 实时互动空间(彼真科技)、家居渲染(红星美凯龙设计云)等标杆用户。

 

写在最后

 

在与虎嗅的访谈中,阿里巴巴集团副总裁、阿里云智能互联网与新金融事业部总裁刘伟光强调:“即将为互联网行业带来二次腾飞的“高质量上云”趋势,将围绕四大核心价值点展开:扩展弹性边界、加速全球布局、探索业务创新、助力资源效能提升。”

 

刘伟光补充道:“我们有理由相信,云计算是互联网企业增效降本的必经之路。”

 


在“高质量上云”趋势中,云原生显然是最关键手段之一,刘伟光也着重强调了它的作用:

 

“云原生技术将越来越易用,互联网企业只需关心架构之上的敏捷开发与业务创新,底层资源都可以交给云计算公司来考虑。这在根本上加速了IT领域一次大规模的社会化分工,并将改变创新驱动力的底层逻辑。”

 

下定决心继续推动云计算发展的阿里云,并没有因行业内领先的技术地位和大量客户的认可而满足。相反,他们选择了“油门踩到底”。

 

在今年6月举办的2022年阿里云峰会上,阿里云将今年最重要的策略定位为“Back to Basic”,聚焦核心技术,继续做深基础。

 

以这次峰会上发布的全新云数据中心专用处理器CIPU(Cloud Infrastructure Processing Units)为例,就能够帮助CPU分摊部分计算、存储、网络、虚拟化、硬件加速需求,同时还能接入阿里云的飞天云操作系统,实现上百万台服务器的管控,并且让算力虚拟化损耗降到0。

 

凭借过往在云计算整体架构上的自研投入,阿里云目前在在全球云计算的市场和技术水平中都获得了领先地位,在权威机构 Gartner 发布的年度报告里,阿里云在计算、存储、网络等几个大项中都获得了全球最高分。其中,在网络技术上,阿里云被权威机构 AMiner 评为全球十大最具影响力的网络研究机构。


如此出色的行业评价,离不开阿里云从创立至今一直都坚持的技术创新,后者也是云计算能够不断带来变革的关键。只要坚持技术创新的决心和力度不动摇,阿里云必然能够持续在云计算这个行业中不断成长,同时帮助全球400多万付费用户获取价值。

 

互利网行业已经饮得云计算技术红利的“头啖汤",其它行业还会远吗?


特别策划

浏览 19
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报