当SD-WAN出现故障时企业该如何进行排除?

2020-04-15 17:32:36 云杰 107

1.对SD-WAN进行实时监控 IT团队应该配置SD-WAN设备,以便将事件发送到公共事件处理系统,在那里可以存储、关联和操作事件。 事件处理系统应配置为在检测到严重事件时自动生成故障单或向IT组织发送实时警报。 SDWAN使用多链路提供可靠的端到端服务。活动链路监控允许系统验证SD-WAN在提供所需可靠性方面成功与否。可能需要多次测试来验证不同类型流量的路径,例如实时数据与批量数据。随着SD-WAN站点数量的增加,易于部署对于成功实施至关重要。 确保将测试配置为模拟实际应用程序流量,包括数据包大小、传输速率和服务质量标记。活动链路测试的一个优点是,它可以在没有应用程序流量时检测正常工作时间之外的问题。活动链路测试模拟真实的应用流量并测试整个端到端系统,包括链路选择。 2.设备状态 SD-WAN设备通常基于具有内部CPU、内存、接口、电源和冷却的x86系统。验证SDWAN控制器在物理链路出现问题时提供警报和报告。它应该能够检测到由于拥塞和双工不匹配导致的振荡链路、接口错误、数据包丢失,双工不匹配仍然是一个常见的问题,因此尽可能使用自动协商。 3.拓扑图。 在进行故障排除时,了解拓扑很重要,但手动更新拓扑图是一个耗时且容易出错的过程。寻找SD-WAN控制系统,以提供物理和逻辑拓扑的动态映射。基线就像SD-WAN物理拓扑的真实网络源,了解实际状态和期望状态之间的差异可以使SD-WAN故障排除更加容易。  SD-WAN故障排除步骤 1.验证SD-WAN节点 检查CPU、内存和接口连接。节点应该能够与控制器通信并下载其配置。 2.检查基本接口功能。 所需的接口应该启动并与链路另一端的设备通信。应该与SD-WAN控制器建立基本连接,以便下载其配置。 3.验证VPN功能。  SD-WAN产品在物理拓扑之上创建逻辑VPN覆盖。您需要了解VPN的加密过程是如何工作、如何失败以及如何验证它是否正常工作的。 4.链路检查  SD-WAN设备能够使多个链路发挥作用,就像它们是一个链路一样。每个站点的网络可达性需要在不影响整体路由架构的情况下与其他站点进行通信。 5、验证转发策略。 数据包是否在SD-WAN设备之间采用了合适的路径? SD-WAN设备测量它们之间的延迟、数据包丢失和抖动,并使用策略来确定每个应用程序应使用哪个链路。当一个应用程序的链路失败、或者它超出该流量类型的规范时、流量将被移动到另一个链路,这可能会影响移动的应用程序,以及使用仍在运行的链路的应用程序。这种分析可能需要一些低级命令来访问详细数据。 当您需要低级别详细信息时,命令行界面非常有用。这些命令将包含用于检查系统状态和测试命令的show命令,例如ping和traceroute。了解如何将它们应用于单个链路以及应用程序流的测试。  当出现问题时,企业应及时进行故障排除以确保SD-WAN正常工作。


1.SD-WAN进行实时监控

IT团队应该配置SD-WAN设备,以便将事件发送到公共事件处理系统,在那里可以存储、关联和操作事件。

事件处理系统应配置为在检测到严重事件时自动生成故障单或向IT组织发送实时警报。

SDWAN使用多链路提供可靠的端到端服务。活动链路监控允许系统验证SD-WAN在提供所需可靠性方面成功与否。可能需要多次测试来验证不同类型流量的路径,例如实时数据与批量数据。随着SD-WAN站点数量的增加,易于部署对于成功实施至关重要。

确保将测试配置为模拟实际应用程序流量,包括数据包大小、传输速率和服务质量标记。活动链路测试的一个优点是,它可以在没有应用程序流量时检测正常工作时间之外的问题。活动链路测试模拟真实的应用流量并测试整个端到端系统,包括链路选择。

2.设备状态

SD-WAN设备通常基于具有内部CPU、内存、接口、电源和冷却的x86系统。验证SDWAN控制器在物理链路出现问题时提供警报和报告。它应该能够检测到由于拥塞和双工不匹配导致的振荡链路、接口错误、数据包丢失,双工不匹配仍然是一个常见的问题,因此尽可能使用自动协商。

3.拓扑图

在进行故障排除时,了解拓扑很重要,但手动更新拓扑图是一个耗时且容易出错的过程。寻找SD-WAN控制系统,以提供物理和逻辑拓扑的动态映射。基线就像SD-WAN物理拓扑的真实网络源,了解实际状态和期望状态之间的差异可以使SD-WAN故障排除更加容易。

 

SD-WAN故障排除步骤

1.验证SD-WAN节点

检查CPU、内存和接口连接。节点应该能够与控制器通信并下载其配置。

2.检查基本接口功能

所需的接口应该启动并与链路另一端的设备通信。应该与SD-WAN控制器建立基本连接,以便下载其配置。

3.验证VPN功能

SD-WAN产品在物理拓扑之上创建逻辑VPN覆盖。您需要了解VPN的加密过程是如何工作、如何失败以及如何验证它是否正常工作的。

4.链路检查 

SD-WAN设备能够使多个链路发挥作用,就像它们是一个链路一样。每个站点的网络可达性需要在不影响整体路由架构的情况下与其他站点进行通信。

5.验证转发策略

数据包是否在SD-WAN设备之间采用了合适的路径? SD-WAN设备测量它们之间的延迟、数据包丢失和抖动,并使用策略来确定每个应用程序应使用哪个链路。当一个应用程序的链路失败或者它超出该流量类型的规范时流量将被移动到另一个链路,这可能会影响移动的应用程序,以及使用仍在运行的链路的应用程序。这种分析可能需要一些低级命令来访问详细数据。

当您需要低级别详细信息时,命令行界面非常有用。这些命令将包含用于检查系统状态和测试命令的show命令,例如pingtraceroute。了解如何将它们应用于单个链路以及应用程序流的测试。

 

当出现问题时,企业应及时进行故障排除以确保SD-WAN正常工作。