保障5G:运营商应该采取4管齐下的方法来实现自动的服务保障
之前发表在Analysys Mason研究报告上
运营商要想在5G上取得成功,就应该采取4管齐下的方法来实现自动的服务保障,包括统一的跨域保障、动态监测、机器学习和人工智能,并通过MANO实现由保障辅助的闭环自动化。
5G有望支持多种行业用例,它们有不同的要求,如服务动态性、服务质量和延迟要求,而如果使用传统的物理网络和刚性的网络架构,则无法实现这些用例。为实现5G,整个行业都围绕着以服务为基础的架构(SBA),这种架构的实现有赖于网络功能虚拟化(NFV)、云原生计算(CNC)和软件定义网。5G网络还会结合边缘云和网络切片技术;边缘云让高性能计算更接近使用服务的地方,以支持低延迟和物联网(IoT)用例,而网络切片会向企业用户提供基于服务质量(QoS)和服务等级协议(SLA)的差异化服务。这些技术创新使运营商能够将自己的网络改造成数字化基础设施平台,以支持运营商和第三方进行敏捷的服务创新。
另一方面,这些创新和多样化的服务需求让网络与运营变得非常复杂。运营商必须实施高水平的网络自动化,才能应对这种复杂的5G要求并控制运营成本。由保障所主导的网络自动化方法可以帮助运营商大规模地实施5G。
5G网络需要高水平的网络自动化,才能应对复杂的网络和运营要求
为实现5G而引入SBA、NFV、CNC和基于SDN的网络,并在此基础上进一步采用边缘云和网络切片,这让5G网络变得比先前的各种网络复杂许多。这些截然不同、不断变化且非常复杂的架构是实现5G的基础,需要高水平的自动化,才能达到5G的预期规模和影响。
图1:实现5G的主要架构
以服务为基础的架构(SBA)将IT概念引入5G网络中
SBA强化了5G网络,使其能够使用开放的API,以动态的方式将网络功能互连起来,从而建立服务链,实现迅速的服务创新并将建立服务所需的时间缩短到几分钟。此外,SBA使第三方能够看到5G核心的网络功能,从而让运营商变成创新的推动者,并支持新的业务模式(如B2B2C)。欧洲的一家主流运营商分享了它实现5G新服务的方法。
“我们计划在B2C业务模式下探索少量的5G服务,它们被直接提供给客户。大多数5G服务将由第三方利用我们的平台,在B2B2C业务模式下向客户提供。”
欧洲的一家主流运营商
边缘云和网络切片会支持关键的5G用例
利用mMTC和URLLC功能的5G服务不能通过传统的网络方法来提供。这些服务需要新技术:多接入边缘计算(MEC),让计算资源更接近边缘;网络切片,提供有保障的服务质量(QoS),并为不同行业、用户和服务提供不同的服务等级协议(SLA)。
借助SBA、边缘云和网络切片,运营商可以将5G网络作为高度自动化的云平台,提供不同服务质量的任务关键型用例。这会增强运营商迅速提供服务创新的能力,并使第三方通过B2B2C业务模式实现外部创新。
NFV、CNC和SDN对于实现5G前景非常关键
NFV和CNC都是灵活、动态、可编程且高度自动的云原生网络的基本组成部分,使用预定义接口来取代传统的物理网络。NFV使运营商能够通过优化资源利用率来提高网络效率,而CNC技术,如容器和微服务,使网络能够部署在云中。SDN可实现集中的流量管理功能,从而优化服务传输、降低网络成本并提升客户体验。借助这些功能,运营商能够按照需要建立并修改网络资源,以反映不断变化的服务要求。
4管齐下的自动保障方法可增强运营商将5G网络自动化的能力
服务保障系统将在实现网络自动化的过程中发挥关键作用。数十年来,保障系统的部署主要是用于验证网络、上报故障和性能问题,将成本高且经常需要手动完成的故障根源分析及处理任务留给网络与运营部门的工程师。在针对5G改头换面后,保障系统会扮演运营“神经系统”的角色,负责推动网络自动化和5G服务的生命周期管理。我们推荐运营商采取4管齐下的方法,实现5G的自动保障(参见图2)。
图2:5G自动保障的重要支柱
1. 统一的跨域保障,包括应用性能监测。目前的服务保障方法基于孤立封闭的体系和流程,软件架构僵硬死板,对不同的功能进行定制的整合,这导致自动化水平较低,且依赖需要手动完成、重复、容易出错的流程。运营商必须接受端到端、跨域保障5G服务的概念,它涵盖网络的方方面面——从云核心到客户,包括回传、边缘云、前传和5G NR(5G New Radio)。此外,解决方案还必须涵盖1-7层监测,包括应用层,这对于为企业用户保障服务性能非常重要。运营商可以考虑采用以各种主动和被动探针为基础的统一监测解决方案,以软件、虚拟或云原生的形式,实现最大的覆盖范围和影响。
2. 对5G网络和网络切片进行动态监测,以保证QoS、SLA和客户体验。静态网络中的保障往往是事后才有的想法,经常在投资周期的最后阶段,将网络交付运营前才会想起来。这种方法不适用于5G时代,在这个新时代里,可以根据要求来创建和改变VNF(或云原生NF)和服务实例,包括根据SDN策略动态地改变流量。保障系统必须能够适应,并在需要时根据网络变化进行扩展,以监测便携的VNF和经过修改的服务链。例如,用户面VNF可能会移到边缘云,以支持URLLC用例——在这种情况下,如何还不存在的话,必须将用于保障的端点设备(如虚拟探针)必须实例化,部署在服务链内,而VNF部署在边缘云内,以抓取相关的网络性能数据。
3. 基于机器学习(ML)和人工智能(AI)进行预防性保障,并分析故障根源。运营商必须使用机器学习和人工智能来强化端到端监测和动态保障功能。让软件程序和算法能够使用机器学习技术来学习洞察能力和关系,这意味着可以将分析应用到人力密集型运营用例中,如复杂的故障根源分析。要进行非常准确、基于机器学习的故障根源分析以及预测性保障,一个关键先决条件是机器学习算法必须准确了解网络和服务拓扑,以及完全关联的网络切片拓扑。例如,大型企业对于使用基于VNF的服务有一些担心,因为网络功能的便携性使得保证服务质量变得非常困难。为了解决这种担心,运营商必须使用真正实时的拓扑,为故障根源分析和相关的保障流程提供依据。
4. 通过MANO实现保障辅助的闭环自动化。传统保障方法的关注点在很大程度上是单向的——也就是说,处理网络事件并呈现故障和性能数据,通过仪表盘和报告展现给用户。在这个流程之后,运营人员会分析输出结果并手动执行一系列工作流程步骤,以识别出造成性能和服务劣化的根源,然后手动更改设置,以修复网络问题。闭环自动化将两套流程无缝地集成起来,通过MANO系统引起策略驱动的网络变化,如NFV编排、SDN控制和多域WAN配置。