阿里云李忠仁:CDN业务升级与创新

共 5232字,需浏览 11分钟

 ·

2021-06-10 16:37

2021年6月9日,亚太内容分发大会暨CDN峰会在北京举行,阿里云智能边缘云高级技术专家李忠仁受邀参加边缘加速论坛,分享了阿里云基于边缘云节点打造新一代CDN产品能力、技术架构及创新实践,助力企业提升效率、优化经营,推动更多新兴行业场景的创新发展。

李忠仁介绍,阿里云CDN起源于淘宝CDN,自2009年开始便伴随双11逐步成长,为流量巨大的电商网站提供加速支持,在全球建立了上百个优质节点和带宽资源,起初在电商领域得到了很多的应用和实践。2011年,CDN作为互联网流量分发基础设施,逐步从服务淘宝电商,扩展到全面服务阿里集团生态,在应用场景上外延。2014年,阿里云CDN正式宣布对外商业化,将服务能力开放给全球企业及创业者使用。2015年,阿里云CDN与电商携手迈进全站HTTPS时代,并不断进行自研调度系统的迭代升级以应对指数增长的流量冲击。
伴随着每年双十一以及移动互联网、视频的普及,CDN的流量呈现指数级增长。2017年,阿里云CDN开启全球化战略,并陆续发布SDCN、DCDN等产品,产品矩阵全面升级。2018年初,由Gartner发布的全球CDN服务市场指南《Market Guide for CDN Services》中,阿里云凭借全球服务能力和产品技术优势定为Global(全球级)服务商。
近几年,阿里云CDN围绕“智能化”和“可计算”不断进行产品技术深耕,在边缘Serverless、多维Workload负载均衡、科学决策、各类边缘应用场景服务上持续打磨。与此同时,阿里云CDN凭借更高效率的产品服务与优质的服务体验赢得客户信赖,在CDN领域体量不断扩大,发展迅猛,CDN的峰值流量规模屡创新高。截止目前,阿里云CDN在全球有2800+边缘节点,150+T带宽储备,服务全球数十万企业客户,为超百万域名提供加速服务。阿里云CDN打造的一张连接全球终端用户的边缘生态网络,在晚高峰期间每秒处理上亿QPS的用户连接请求,每天将客户数十亿次配置管理指令下发到全网所有节点。

CDN行业发展与演变

CDN的发展主要经历了三个大的阶段:
  • 第一个阶段是以图文内容消费为主的阶段, 大家上网主要使用PC, 访问的主要是门户网站等含有大量图文的内容;

  • 第二个阶段是图文+视频内容消费为主的阶段, 直播、短视频、长视频的普及, 带领CDN进入了快速增长期, 带宽每年成倍的增长。但第二个阶段爆发式增长期已经过去, 带宽的增长已经放缓, 第二个阶段即将结束。 

  • 第三个阶段现在正处于酝酿期, 随着5G、IoT的发展, 物联网设备大范围普及, 越来越多的设备会接入网络, 必将会有标志性的应用出现来带动整个行业的大发展。CDN的分发也会由单一带宽的分发, 扩展到带宽、算力、存储等多维度的分发。 


基于边缘云节点的新型CDN技术架构

在谈到新型CDN概念时,李忠仁表示:CDN由传统的内容分发, 转变成带宽、算力、存储等多维的分发。CDN的技术底座已向边缘云操作系统演进, 传统CDN只是边缘云上的一个应用, 其消耗的主要是带宽, 此外还会有很多消耗算力和存储的应用运行在这个边缘云操作系统上。阿里云提供了底层操作系统, 用户可以根据自己的业务情况,构造自己的算子并托管到阿里云边缘云节点上。阿里云面向给用户提供就近接入、就近计算、位置无感、按需部署、弹性伸缩的自动化云服务。而这种新型的业务形态实现和传统的CDN优势互补,不仅复用CDN的上行带宽、闲散算力,还给用户提供延时更小、成本更优的服务。 

XDN整体架构

李忠仁指出XDN整体框架是阿里云在CDN领域的技术积累和沉淀之上演变而来, 分为资源交付层、平台层、组件层、产品层。
  • 资源交付层,基于运营商资源构建广域覆盖边缘云计算基础设施。节点硬件、网络构成是异构的,供应链需要保障各种异构资源的高效接入生产系统。
  • 平台层,衔接了上层业务和底层资源,将供应链能力进行整合来构建XDN的PaaS平台,包含中台支撑、智能调度、网络协议。其中中台支撑系统包含监控、日志、业务管控、资源纳管,这里会涉及海量数据处理、配管指令实时下发、业务和资源的管理、计费、运作状态监控等等。
    智能调度包含业务编排、资源调度,主要解决自动化决策哪些业务跑在哪些资源上,哪些资源上应该跑上业务的问题;和全局负载均衡一起决定着XDN系统的弹性能力。
  • 组件层,有高性能接入网关、高性能缓存服务器,高性能4层集群负载均衡等传统CDN基本组件功能;以及可编程CDN、函数计算、边缘转码、流媒体处理等各种生态外延功能。
    广域覆盖的节点承接了海量业务,需要成体系的安全防护策略来进行攻击防护、内容数据保护、传输可靠性保障等。
  • 最上层是产品输出层,包含CDN加速、内容下载、直播、点播、SCDN、DCDN, 以及向边缘云的EdgeImage、 EdgeRoutine、和视图计算等新型产品。 

新型CDN与传统CDN的差异

新型CDN和传统CDN的主要区别在于用户可以是否可以自定义算子并上传到边缘云节点, 享受按需部署、位置无感、弹性伸缩的自动化调度服务。相比于带宽型业务,算力消耗有其特点和难点:
  1. 算力消耗需要准确的评估:带宽消耗可以通过访问日志准确评估出来, 但是算力因为很多业务共享宿主机上的CPU, 怎么做准确的评估是需要深入研究的;

  2. 算力对调度的准确性要求更高:带宽如果调度的不准导致节点水位偏高, 对业务的影响较小, 网络丢包通过重传等机制, 可以近乎做到业务无感;但是如果CPU水位偏高, 那么整台机器几乎处于不可服务状态, 对业务的影响是比较大的。 

阿里云实现全球智能调度系统升级, 由带宽维度的调度演变为带宽算力双轮驱动的多维资源调度模型。这个模型的输入数据就是带宽消耗和算力消耗数据。对于算力消耗数据, 通过当前节点上服务的业务以及当前的CPU消耗来做业务画像求解出来。 
最后,李忠仁详细介绍基于边缘云节点的创新场景:ER、EI、视图计算、GRTN。


边缘创新场景-ER

ER是EdgeRoutine的缩写, 是一个运行在CDN边缘节点上的JavaScript代码运行环境。开发者可以将JS代码上传至ER,即可让JS代码在全球的CDN边缘节点上运行。相当于在全球各地拥有成千上万台微型服务器就近服务各地用户(客户端)。让做简单缓存分发的CDN具备了计算的能力,让小流量业务成为高附加值的场景。
传统的CDN请求链:到达tengine后, 去swift找缓存, 如果缓存名字则直接从缓存里面拿内容给客户端, 如果没有命中, 则去回源请求内容。在ER的模式下, 有四种形态: 
  • 第一种请求到达网关以后, 直接通过ER处理, ER处理完以后直接通过网关返回给客户,不再经过缓存;

  • 第二种ER向其他公网服务比如OSS等发起子请求, 然后把结果通过网关返回给客户;

  • 第三种请求到了ER后,可以从缓存、KV存储里读取或写入计算后的结果,一次计算的结果可以让其他大量的请求复用,减少不必要的重复计算,降低延时;

  • 第四种最复杂,ER和CDN业务进行耦合,请求到网关以后,先进入ER前置处理, 然后再走后续的CDN缓存和回源逻辑, 然后在通过ER和网关把响应返回给客户。

使用ER时,用户无需担心资源不够用的情况出现, 智能调度会根据业务量的情况自动做弹性伸缩, 满足业务的需求。通过Isolates隔离技术, 在一个进程里面实现租户隔离, 把资源的复用做到极致, 利用边缘的闲置算力, 给用户提供最优的按量付费服务。用户只需关心自己的核心业务代码, 写好代码之后上传到阿里云就完成了部署, 不用关心代码到底运行在哪台机器上, 阿里云为您提供底层运行环境的保障。同时阿里云遍布全球2800多个节点, 确保无论客户在何地,总能找到离客户近的边缘云节点,从而大大缩短了网络链路,减少了网络拥塞的风险,提供低延时的服务。


边缘创新场景-EI

EI即Edge Image,是阿里云推出的边缘图像处理功能,通过该功能,CDN可直接在回源节点对图片行处理和分发,可减轻源站压力,减少回源链路,节省回源流量。使用图像处理功能,客户可以对CDN上的原图进行缩放、裁剪、添加水印等操作,满足多种业务场景(比如电商, 媒体, 游戏, 金融等)的图片处理需求。 
在EI的整体架构图,首先将图片转换服务拆分到容器里面,这样可以做到业务隔离,不会因自身进程问题影响其他服务,另外可以做到资源独立控制。EI作为图片转换服务,会按需部署在CDN L2节点,在回源域生效而不是在接入域生效,这样的话,可以减少图片转换的次数,节约算力,一次转换,对多个边缘节点生效。将图片转换请求拦截并旁路转发到EI容器实现图片转换。同时EI支持热重启,升级过程中不会对正在进行的转换有任何影响。
同一张图片转换出的所有目标图都会作为原图的副本。刷新一次原图,可刷掉全部对应目标图。CDN对用户提交刷新的次数有限制,对目标图多的用户来说,可大大节省刷新次数。通过原图转目标图时,CDN会将原图缓存下来。当转其他目标图时,CDN无需回源即可转换另一个目标图。为了减少对源站的访问,客户一般会提前预热资源。对于一张图片对应多个目标图的场景,只需要预热一次原图,转多个目标图时会从CDN自身取原图而减少回源。在CDN做图片转换,可以给源站节省资源。源站只需要保存原图,降低存储多个目标图成本,降低转码计算成本。
在原图被缓存的情况下,图片转换整体链路减少一个环节,即CDN回源站这一段,减少请求的整体时间。一般情况下,用户需要对请求改造,通过加参数等方式指明具体要做哪些转换操作。CDN结合自身能力,可提供一些用户无需改造即可做图片转换的功能:
  • 自适应webp

    CDN根据请求头Accept,判断当前请求的客户端是否支持webp格式,如支持自动转换为webp格式再返回给客户端。webp格式由于自身高压缩比,比如和jpg格式相比,同样分辨率,大小会压缩的更小,节约流量。

  • 一键瘦身

    可通过配置,对某种格式的图片请求统一做质量缩放。在肉眼看不出变化的前提下,降低图片的质量,给客户节省带宽。

  • 弱网环境自适应质量

    CDN可根据请求的网络环境判断如果网速较慢,则将图片压缩质量后再返回,提高成功率和响应时间。


边缘创新场景-视图计算

CDN主要消耗的下行带宽,而视图业务可以复用CDN的上行带宽和闲散算力,刚好形成互补。目前生活中随处可见各种摄像头,这意味着需要连接到广泛分布的边缘节点, 进行计算、存储工作。大部分工作都会在边缘完成, 有极少数场景需要把边缘处理过以后的信息上传到中心。 
视图计算整个链路分为三个部分,分别是生产端、计算端、消费端,阿里云提供的主要是中间的计算端服务,包含:视图的处理( 录制、转码等)、视图的存储(存储在本地以及处理以后回传到中心Region)、视图的接入和管控(支持不同终端设备的接入)。
目前,视图计算主要应用在智慧交通、智慧教育、公共安全等领域。

边缘创新场景-GRTN

GRTN是全球实时传输网络,致力于通过边缘云的异构节点,构建超低延时、全分布式下沉的通信级流媒体传输网络。相比于传统的直播架构,GRTN架构的技术特点是:
混合组网:树状层级结构+对等图形网
能力下沉协议边缘卸载+内部传输协议归一化
控制和数据分离:动态路径规划+全分布式SFU
可编程可计算:流媒体Serverless计算服务
架构升级所带来的核心价值是:
  • 优成本,GRTN是一个多业务融合的网络,可以支持直播、RTC和视频上云等多种场景,业务复用率高,另外 GRTN内部链路更短,节点内的成本也更低。

  • 提质量,GRTN内部组网支持采用动态选路的方式来构建的网状结构,内部链路延时可以做到20ms左右,并且内部链路采用了私有协议来进行高效传输。另外客户端的推流和分发都是基于WebRTC来构建的,QoS拥塞控制是专门针对流媒体特性来进行设计的,并且还在基于线上数据建设进行持续迭代和打磨。

  • 易扩展,GRTN支持了WebRTC协议,可以在单个连接通道上进行全双工的通信,从而可以很自由的进行发布和订阅媒体流,在业务的扩展性上带来了更大的想象空间。

淘宝直播已经全量使用了GRTN,并且顺利保障了淘宝618直播大促,双十一大促直播等场景, 和传统的RTMP/ HTTPFLV方式相比,用户体验上,RTS端到端的延时降低了80%,卡顿率降低了30%, 带动了淘宝GMV的提升。
除了淘宝直播外, GRTN服务客户分布在电商、教育、泛娱乐等多个行业。





往期推荐





浏览 44
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报