摘要:研究了多主体智能故障管理模型的结构及系统构成并给出了模型功能的实现。
关键词:主体智能故障管理模型
随着网络规模的不断扩大,网络的维护和操作变得相当复杂。如何保证网络安全、稳定和可靠地运行,一直同络管理领域的热门研究课题。
故障管理是网络管理体系结构的一个重要组成部分,主要包括检测、隔离、确定故障因素、纠正故障等功能。设立故障管理的目标是提高网络可用性控制工程网版权所有,降低网络停机次数并迅速修复故障。作为高速骨干网络上运行的T比特路由器CONTROL ENGINEERING China版权所有,对它进行故障管理,以便在路由器发生故障时及时进行修复,避免影响网络的使用。
大规模汇聚接入路由器(ACR)系统中包括多个设备,而各个设备又是相互关联的,一个设备的故障同时可能会引起另外一个或多个设备故障的发生www.cechina.cn,从而可能会导致整个网络瘫痪。传统的故障管理方法只能对单设备故障进行有效的管理,对多设备的关联故障不能及时地进行诊断及恢复,不能保证网络的正常运行。
1 与现有故障管理技术的比较
目前,研究故障诊断的方法主要有两种类型:专家系统方法和工神经网络方法。专家系统是在宏观功能上模拟人的知识推理能力,是以逻辑推理为基础模拟人类思维的符
现有的智能故障管理技术主要有以下三个缺点:
(1)目前智能故障管理的研究主要集中在专家系统上,不能适应新的或不完备的数据控制工程网版权所有,很难应用于大型动态网络。
(2)故障诊断的专家系统主要采用一种技术,实际应用范围较窄。
(3)主要进行故障诊断,不支持故障自动恢复。
主体(Agent)是指能在动态的多Agent领域采取灵活、自治活动的计算机实体,智能Agent是具有实时处理多维信息、相互作用和能有效传递信念、意图等智能的自治的软件实体。它具有智能性、自治性、灵活性、开放性、适应性、协作性和推理机制等特性。
智能Agent的内部行为表现为:通信管理器接收外部环境的信息,由推理机根据这些信息和Agent状态。进行分析和理解,形成与其他A舞enI相一致的协同工作方式,并按该方式及自身能力(知识水平等),执行相关的动作,形成Atent新的状态,由此而进一步引起新的Agent推理活动。智能Agent的话动行为是主动进行的,Agent的推理机每隔一时间片都要检测通信状态和自身状态,以确定其推理活动的趋势。
同传统的故障管理技术相比,智能Agent故障管理模型具有下面三个优点:
(1)将多Agent技术应用于复杂故障诊断领域,对诊断任务辨识、分解,综合利用各Agent的内部诊断机制,通过各Agent问的交互、协作,对故障进行诊断,使故障诊断技术能应用于大型动态网络及各种复杂设备。
(2)各诊断Agent间综台利用多种智能故障技术,以便能对多数故障进行诊断。
(3)通过故障诊断结果,增加故障恢复模块,对故障进行自动恢复。
2 智能故障管理的模型
2.1 故障管理流程
故障管理主要包括故障发现、故障诊断和故障恢复三个部分。故障管理的流程如图1所示。
2.2 智能故障管理的自动机模型
通过上述定义可知,Agent是具有特定领域知识和问题求解能力,能自主工作和具有协作交互能力的智能实体,具有知识、模型和数据处理能力,基于Agen的语言L而进行多Agent问复合问题求解规划过程。Agent可由各Web节点组合而
智能故障管理的状态机模型如图2所示。
模型用BNF形式化表示如下:
<领域经验知识>::=<领域经验知识头><领域经验知识体>
<领域经验知识头>::=<领域经验知识名>[<经验知识代码>][<知识库名>][<说明表>]
<领域经验知识体>::=IF{<前提条件><运算符>}+THEN<结论>
<前提条件>::=项、变量或用户定义的表达式名<运算符>::=ANDIOR
<结论>::=表达式
这一描述完全揭示了模型的三级信息形式,即模型的用户视图、概念结构和可运行实体。
3 智能Agent框架结构
依据智能Agent的内部行为表现,为完成故障的实时监控、诊断及恢复功能,采用图3所示的结构来构成智能Agentwww.cechina.cn,内部结构采用统一模式来描述。