发表于

主动与被动网络监测在虚拟网络中的作用


在运营商网络虚拟化后,就服务监测所起的作用出现了哪些变化有许多讨论。这些讨论经常围绕着主动监测与被动监测的比较问题——但这是一个错误的问题。问题不在这两种监测方法的比较,而是在于了解何时使用一种监测方法,何时使用另一种监测方法。

是什么造就了这种状况?

在传统的物理网络中,服务路由经过精心设计,服务拓扑通常会映射网络拓扑。由于这个原因,根据网络质量可以很容易推断出服务质量,因此,根本就没有对许多服务进行监测。然而,虚拟化网络打破了这种1:1的对应关系,从而有可能使得运营团队无从了解许多服务的情况。因此,服务监测需要从仅仅监管收入较高、基于SLA(服务等级协议)的服务的工具,变成网络和服务运营团队的“耳目”。

监测的简单回顾

被广泛接受的服务性能监测方法有两种:主动监测和被动监测,各自都有自己的优势(见图1:主动监测 vs 被动监测)。


图1:主动监测 vs 被动监测

主动监测:也被称为综合监测,其过程包括向网络内注入测试流量,通常采用和被监测用户流量(服务)相同的转发标准,然后测量其性能。这些测试可以是单向的(从A点到D点),或双向(从A点到D点,然后返回A点),这取决于您要测量什么。由于测试流量模拟服务流量,因此主动测试特别适合提供实时的端到端服务性能概况,如延迟(又称时延)、抖动(又称时延变化)或丢包。值得一提的是,主动测试可在整个服务路径上任意两点间进行,如从A点到B点,或从A点到C点。这意味着,只需要一些简单的数学计算,就可以将整个端到端路径分段,以便获得各段的性能指标,从而更好地实时了解问题可能出现的地方。

主动监测是对SLA进行监管的主要方法,这是因为它可提供实时的性能状况。

被动监测:这种方法包括在网络内的具体位置抓取并分析实时的网络流量,或流量统计数据——例如,网络与应用服务器的连接处。顾名思义,被动监测不需要包括,甚至知道网络内的另一点。简单地说,被动监测可能无非就是定期收集端口统计数据,如字节和数据包传输与接收的数量。更常见的情况是,它包括抓取经过某个端口的部分或所有流量,进行详细、非实时的分析,如信令协议、应用程序的使用情况或占用带宽最多的应用程序等。

被动监测特别适用于深入的流量和协议分析,尤其是在出现情况后,如进行问题根源分析。它还特别适合深入了解客户的体验质量(QoE)。

两种方法的优点

回到现存的问题上来,在虚拟或混合的网络中,要获得网络全貌,主动和被动监测都很必要。

主动监测应该用来实时了解服务性能或服务质量(QoS)。利用这种方法,可为性能恶化提供早期预警,甚至在客户注意到性能出现恶化前。通过实时了解网络内大多数,甚至是所有服务的情况,使自动的排障工具能够迅速对受到影响的服务进行分类,并找出热点或常见原因,以确保首先解决最紧要的问题。

被动监测可用来支持两个关键的运营功能。首先,它应被用于事后分析,如确定问题根源或找出恶意流量。通过建立流量和信令的历史档案,可进行分析以找出异常流量,如分布式拒绝服务(DOS)攻击,或异常和指示性信号,如掉话率过高或重传率过高。其次,被动监测特别适用于详细了解用户的使用模式和应用性能,使运营商能够直接监测体验质量(QoE)。这方面的详细信息可提供大量的资料,从而根据用户的使用偏好来定制服务套餐、规划网络和系统升级以满足需求的增长并发现新的服务机会。

总结

主动监测和被动监测都是在虚拟网中建立并保持竞争优势必不可少的工具。通过使用白盒设备、虚拟网络功能(VNF)和开放式服务模式及API,虚拟化已经成为伟大的网络“民主主义者”,CSP现在必须关注QoE和客户满意度等指标,并将其作为自己与竞争对手的主要区别。

主动监测使运营商能够非常主动地应对潜在的客户服务问题、减少甚至消除客户服务中断。被动监测可深入了解根源问题和客户行为,从而更好地了解客户体验。

主动监测 被动监测
  • 服务质量(QoS)
  • 直接的端到端分析
  • 确定性和预测性
  • SLA、分段和隔离
  • 实时、端到端的传输、网络和服务性能监测
  • 体验质量(QoE)
  • 关联的端到端分析
  • 用于诊断的详细曲线
  • 诊断协议问题
  • 非实时、深入的网络、服务和用户体验监测

可能的侧边栏/标注

了解全貌:主动和被动监测要能够了解端到端的全貌,时间同步就必不可少。

对于主动监测,尤其是单向测量来说,测试流量的两端必须有相同的时间基准,以便能够准确测量延迟。然而,因为这种监测方法具有实时和基于流量的性质,不需要在其它网元之间进行其它关联,因为数据包流基本上会处理这个。

然而,对于被动监测来说,在关联网络内不同位置的观察结果时,绝对需要进行同步。如果不能获得一致、准确的时间,就不可能将网络内不同位置的观察结果关联起来。

要准确监测,同步就必不可少。无论它是使用卫星时间分配的分布式同步、基于数据包时间分配的同步、使用类似于EXFO通用虚拟同步(Universal Virtual Sync)的私有方法同步,还是通过非常稳定的时间源同步,包括时钟,都不会真正改变这个事实。随着手动、事件驱动的网络运营让位于自动、数据驱动的运营——以机器学习、分析和人工智能为基础——同步甚至变得更加重要。如果连续生成和保存主动与被动监测结果,就可以建立庞大的关联性能指标和测试结果数据湖,在驱动这些系统时需要这些指标和结果,但如果没有同步,这一切都将不可能。