使用抓包分析功能排除以太网服务故障(第1部分)
对于希望在其LTE网络上提供语音服务的运营商来说,有多个收入来源可供选择。为了更好地了解LTE运营商在提供高质量和可靠的语音服务时的权衡,需要揭开每种语音技术的神秘面纱。
以太网承载的数据量增长速度非常惊人。由于其可靠性不断增长,以太网从之前单纯地作为以太网数据管道,转换为承载以太传输服务。现在,以太网商业服务的承载能提供给企业和商业用户的三重播放,同时能承载整个分组网络上对时间敏感、任务关键的移动回传的数据服务,从而实现移动融合。由于所提供的服务变得愈加复杂,网络工程师和现场技术人员必须处理更多的故障排除服务请求,并且要对服务问题的情况进行快速精确定位、分析和报告。
网络故障排除需执行多个复杂的步骤,来识别发生网络故障的位置和原因。然而网络技术人员和工程师通常对这类事件知之甚少,因此必须查遍故障的多个可能原因。此外,由于清楚客户可能受到很大影响,从而必须在有限的时间内完成调查,任务会变得更加困难。
在技术人员可以选用的众多工具中,具备抓取受影响线路上的数据流量并对其进行分析功能的工具非常受欢迎。对数据流进行分析通常是指通过解读数据包头的内容来识别帧其中的问题,如对内容发生了修改和内容错误。通过分析,调查人员还可以在抓取全部数据流(如用户数据流和网络命令控制流)后识别线路中的真正内容。技术人员随后可通过搜索数据报文的列表,分析所捕捉数据流的封装开销内容来识别失序或不一致的数据流。
本文将介绍如何利用EXFO的数据包抓包分析功能对以太网服务进行故障排除。
现场应用
尽管便携式测试设备可以提供强大的测试功能,但在一些情形下,抓包能够提供更加详细的信息以便用户进行更为深入的故障排除。以下是几个示例:
最高带宽使用者分析
网络运营商面临的一个典型问题是如何识别垄断带宽者,即找到这些消耗带宽过多的工作站和巨量下载、使用非法信息流或者甚至是受到病毒侵害的计算机用户。从运营商的角度而言,垄断带宽可能意味着传输设备拥塞或者配置不正确。
抓包会话可以在发生问题时捕捉管道的实际内容来帮助排障。然后进行离线分析即可提供带宽和利用率的统计数据,如最高带宽使用者(MAC、VLAN和IP)或数据包的分发。
- 分析工具可以提供每次对话的统计数据并识别垄断带宽者
- 通过对分析后的统计数据进行排序来执行最高带宽使用者分析
执行数据包深入检查
数据包转发设备存在的三个主要配置问题是数据流分片、VLAN隧道穿通和帧头字段改写:
- 设备必须将数据流划分为更小的片段,才能在管道的最大传输单元(MTU)限制(即管道中允许的最大数据大小)以内进行传输时,就会发生信息流分段。发生信息流分片时,性能通常会降低,这是因为传输相同数据大小需要更多帧数,导致可用的有效带宽更低。
- 发生隧道穿通的情况通常是,以太网在处理信息流时添加、交换或删除VLAN标签。隧道穿通通常发生在网络边缘(在网络边缘,未加标签的数据包先被添加标签,然后再转发到L2网络)或已加标签的数据包被去除标签并转发至正确目标时。
- 在拥塞期间,具有特定优先级的信息流(通常为IP TOS/Diffserv)以不同的优先级转发,从而导致QoS问题的情况下,有时会发生帧头改写。
在这三种情况下,利用抓包功能均可以实时查看问题,并且让网络调查人员能够使用包头开销分析功能执行数据包深入检查。
对客户的TCP问题进行故障排除
尽管EXFO的TCP应用能为TCP管道进行重要的服务开通测试,但对用户TCP问题进行故障排除时,需要测试用户实际的TCP数据流才能识别开销或连接问题。
抓包功能可以对用户的实际TCP数据交换进行捕捉和分析,帮助TCP测试。通过分析,可以深入了解开销的内容,并且提供进一步的关联分析,如提供数据交换的流程图以及识别重传和复制的确认。通过使用分析功能,用户便可知道导致复制或重传的事件,还可以保障在该事件之后发生正确的重传。
新服务分析
除VoIP和视频(IPTV)服务外,运营商现在还在推广以太网同步服务,尤其是移动回传。精确时间协议(IEEE1588 PTP)是一个新的协议,设计用在基于客户端-服务器架构的分组网络中建立和维持同步,其中客户端边界时钟使用主时钟的通知和请求维持时钟的同步和稳定性。抓包分析功能可以捕捉这些服务并执行会话分析和数据包深入分析,从而以简单直观的方法来识别会话问题,如数据包丢失和失序。
- PTPv2数据包捕捉序列的一个示例。
- 分析工具可以对数据包进行深入的会话解析,从而确定边界时钟与主时钟之间的信息流中存在的问题。
当前存在的其他抓包分析方法
抓包分析的传统方法需要多种硬件和实验室设备来处理大量数据和较高的数据包速率。尽管专用硬件仍然是面向实验室应用和大规模处理应用的理想工具,但台式计算机和便携式计算机随着处理能力的提升,已经成为了可以进行简单捕捉和分析的平台。然而,虽然台式计算机和便携式计算机能够简化捕捉过程并降低步骤费用,但也存在一些缺点:
- 使用便携式计算机也会增加技术人员必须携带到工作现场的设备数量。随着技术人员需要在更多地点往返,控制在不同现场之间移动的设备数量就会成为问题。
- 为了控制成本和运营费用,网络运营商已将测试和故障排除预算削减到最低程度,因此越来越不可能使用专用计算机来实现捕捉和分析功能。
- 台式计算机和便携式计算机并非始终都能提供千兆速率功能,因此在必须对千兆速率或光连接执行测试时,需要将昂贵的适配器、交换机或光/电转换器与捕捉设备搭配使用。加入这些设备后,会增加测试架构的复杂性并且会增加额外的故障点;而在利用有限的信息执行故障排除时应避免增加额外的故障点。
- 随着10GigE链路得到越来越广泛的采用,工程师现在已经开始对使用10GigE链路的汇聚点进行故障排除。在典型计算机或便携式计算机场景中,10GigE功能需要使用非常昂贵的适配器,但通常使用转换交换机来执行。
本文的第2部分将介绍EXFO的数据包捕捉和分析功能,以及可以提升测试周期效率的其他功能。