一、在设备出现故障时应该首先保证节目播出不中断
既然设备出现故障是不可避免的,那么在出现故障后我们首先要做什么呢?这个问题其实是最好回答的,我们首先要做的就是保证播出不中断。在保证播出不中断以后再来考虑怎么排除故障,恢复系统正常运行。
1.提前制定播出保障优先级:不是所有情况下我们都能做到保证播出不中断的,在一定的客观条件下,或者说极端情况下,我们将面临播出必须中断的情况,所以,我们应该在平时的工作中就确定好这种情况的优先级,并明文规定、全台统一执行。我个人认为,应该分三个方面来制定优先级:(1)节目质量优先级:优先保证优质播出,优质播出保证不了的情况下保证节目正常播出(节目质量虽然不太好,但还是应该播出的正常节目,并且没有达到劣播的程度),连正常播出都保证不了时保证节目信号不中断(采用补乐等)。(2)节目频率优先级:优先保证主频率(特别是新闻频率),其次保证其他上星频率,最后保证城市频率。(3)节目传输优先级:优先保证覆盖面最广的传输线路(如到卫星地球站的传输线路),其次保证覆盖人口最多的传输线路(如到省会城市发射台的传输线路),最后保证其他传输线路。
2.第一时间利用跳线盘甩掉故障点:我们现有系统中,一般和安全播出相关的关键设备都有备份,而且大多数都是在线热备份,甚至很多台都有系统级备份(对整个系统进行备份)。所以,我们在故障处理过程中,首先要做的就是启用备份系统或设备。这种操作一般都很简单,甚至大多数台站都采用的自动切换。但这种切换也不是万能的,有时候我们会遇到主备系统都有问题或单节点设备故障的情况,如切换装置故障等。这时候我们就需要利用跳线盘将故障设备或故障点跳过。跳线盘是我们在故障处理过程中最常用的利器,技术维护人员一定要熟练、准确的掌握好跳线盘的跳线操作。当故障出现时,一定要时刻保持镇定、清醒的头脑,把复杂的问题简单化处理,首先保证播出信号正常输出。当利用监测报警系统一眼就能准确判断故障点时,只需利用跳线盘把故障点甩掉。不能准确判断故障点时,不要费心思去分析故障点和故障原因,最快的处理办法是把能甩掉的设备全都甩掉,从信号源把信号直接送到输出口,这样做虽然因为少了信号处理环节,信号质量会受到很大影响,但能保证不停播。但一定要分清信号是数字信号还是模拟信号,不要把数字信号送给模拟传输系统或把模拟信号送给数字传输系统。我们在平时的工作中要提前做好各种情况下的应急预案和操作步骤让技术维护人员去熟悉,并通过应急演练等形式让技术维护人员熟练掌握。应急预案应该根据具体情况不断完善。
3.一个合格的技术维护人员一定要能在最短时间内恢复正常播出:在广播电视播出系统中,一个技术维护人员是否合格不是看他的文凭有多高、理论水平有多高、知识多么丰富,甚至不看他专业技术、技能有多过硬,主要看他能否快速有效的处理故障,以最快的速度恢复安全播出。一个不能快速有效的处理好故障恢复安全播出的技术维护人员是不入流、不合格的。可能有人会问,一个专业技术、技能过硬的人怎么可能不是一个合格的技术维护人员?那么请问,一个搞产品开发的高级工程师的专业技术、技能过不过硬?可是他在我们的系统内很可能连一个最简单的故障都处理不了,难道他是合格的技术维护人员?起码现在我们的系统范围内他是不合格的。所以,既然选择技术维护工作就要不断的熟悉、了解我们的系统和设备,熟练掌握应急预案的操作,不一定能在最短时间内恢复系统正常运行,但一定要能在最短时间内恢复正常播出。
二、播出恢复后如何找准故障点、恢复系统正常运行
播出恢复后,我们最紧迫的任务就算完成了,就有了充裕的时间来进行故障处理,恢复系统正常运行。这时候要做的就是找准故障点,解决故障,我就不在这里讨论了。主要来讨论一下比较难定位的故障点。
1.故障点的简单划分:按照设备故障的可复制性,我把故障分为硬故障和软故障,硬故障指可以多次被模拟复制出来的故障,只要你不去处理它,故障现象就一直在。软故障是指没办法模拟复制出来的故障,即使你什么也不做,过会儿设备运行就正常了,但你不处理,故障就会不定期的老出现,给安全播出带来极大隐患,软故障一般是设备软件或设备部分元件运行不稳定引起的。在故障点的定位和故障处理中,硬故障一般很容易解决,软故障既难以定位又难以处理。
2.用顺藤摸瓜寻找硬故障点:寻找硬故障点最常用的方法是顺藤摸瓜,顺藤摸瓜顾名思义就是顺着信号走过的地方逐级排查,因此要求技术人员对系统图纸了如指掌,清楚系统内的信号流程。顺藤摸瓜可以顺着信号流向向系统后级寻找,也可以从故障的最终点反向寻找,一般根据具体情况综合使用,缩小故障可能的范围,逐渐锁定故障设备。在具体操作中,利用相关检测设备,先检查上一级设备输出的信号是否正常,如果不正常,说明上一级设备有问题(但还不确定这一级设备没问题),先检查上一级设备,如果正常,再看这个设备的输入信号是否正常,如果不正常,说明设备连接线路有问题,如果正常,再检查这个设备的输出信号是否正常,以此类推,通过这样逐级排查找到故障点。
3.软故障点的分析和查找:软故障点也可以用顺藤摸瓜寻找,但难度很大,而且不一定能找到,只能作为辅助手段。因此软故障的处理除了要求技术人员对系统图纸了如指掌,清楚系统内的信号流程外,还必须熟悉每个相关设备的性能,理解系统设计理念,对每一条线路、每一个设备存在的作用和意义都要非常清晰。在此基础上,根据故障现象、设备报警信息等对故障进行分析,从而找出故障点。在具体的分析中,我认为应该注意以下几个方面:(1)从易到难,从简到繁的分析问题。我们要相信问题其实远没我们想象的复杂,很多故障虽然隐藏的很深,但故障本身一般都是些小故障,反过来想,大故障也藏不住,所以,我们要从小处着眼,从简单处下手。(2)大胆假设、小心求证。很多时候,我们从故障现象去找原因却一直没有找到,这时候我们可以考虑反过来思考,假设某一个设备出故障了,假设它出了什么故障,分析它出了故障后可能会给我们的系统造成什么样的影响,通过大量的分析也许就能找出问题的关键。虽然这样的方法看起来有点瞎猫碰死耗子的感觉,但有时候更容易打开思路找到灵感。这样的分析不光对这个故障有好处,在以后的维护工作中都会有很大的帮助。如果平时没事的时候多做做这样的分析对提高技术维护能力也有很大帮助。(3)我们的所有分析逻辑上必须是可行的。由于我们的技术维护主要立足于应用,我们不太可能把每一个设备的设计原理从细节上搞清楚,但我们在对故障进行分析的时候又必须要用到它。那么怎么办呢?我们可以丢开细节,着眼于整个系统和设备的逻辑结构和原理,从逻辑上去分析我们的系统和设备。(4)辩证地认识理论知识和经验的作用。在我们分析故障的时候,很多时候容易受自身的理论知识和经验的影响,这个影响有时候是好的,但也有时候会局限我们的思维。我们必须客观的来看这个问题,因为我们所学到的理论知识毕竟是有限的,也许问题就出在我们没有学到的部分,我们的经验也是有限的,同一个结果不见得就是同一个原因造成的。在平时的工作中我们应该去学习更多的理论知识、积累更加丰富的经验,让理论知识和经验结合起来,但当我们在处理一个问题时发现我们的理论知识和经验不管用时,我们不能局限于理论知识和经验,应该果断的丢掉它们,从其他角度去寻找新的有效方法和突破口。找到故障点后,我们可以用同样的设备去替换它,然后在观察系统运行情况,直到确保系统运行正常。有时候试验发现,每个设备单独运行都没问题,但放在系统中就不正常,这种情况问题应该出在设备设置上。
三、系统恢复正常运行后要认真分析和总结
系统恢复正常运行后,要对出现的故障进行认真分析和总结,一个简单的故障往往能揭示出很多问题,通过分析和总结,我们能找到很多类似问题的处理办法,甚至提前杜绝很多故障的发生。总的来说,广电系统的技术维护工作没有想象中那么难,只要熟悉系统和信号流程,制定好完善的应急预案并熟练掌握,就能在故障发生的第一时间恢复正常播出。只要在平时的工作中多总结,就能找到最适合自己的故障分析和处理方法,提高技术处理能力,确保广播电视的安全播出。
作者:李贵堪 单位:西藏人民广播电台