Принципы генерации аварийных сообщений и отображение показателей рабочих характеристик. Генерация и мониторинг аварийных сообщений и рабочих характеристик, страница 7

1.4.2 Аварийные сообщения

Метод устранения неполадок согласно аварийным сообщениям похож на метод устранения неполадок согласно рабочим параметрам. Разница состоит в том, что  устранить ошибку зачастую достаточно просто. А вот некоторые виды аварийных сообщений часто бывают перемешаны между собой, и различить их довольно трудно. При рассмотрении аварийных сообщений всесторонне, согласно механизму их генерации в потоке сигнальных сообщений, можно решить обычные общие проблемы. Рассмотрим следующий пример.

(1) Сетевая диаграмма

На рисунке 1-4 показана сетевая диаграмма.

Рисунок 1-4 Диаграмма взаимодействия при анализе проблемы аварийных сообщений

6 сетевых элементов OptiX 10G - A, B, C, D, E, F формируют кольцо секции мультиплексирования STM-64. Это централизованная услуга - каждая станция обменивается услугами со станцией A.

(1) Выявление неисправности

После определенного периода работы оборудования часто обнаруживаются  сбои процесса переключения во всей сети, что приводит к блокировке всех услуг. Специфика заключается в следующем:

Запросите статус переключения каждой станции и выясните, что станции F и B являются станциями переключения направлений Восток и Запад соответственно, а станции C, D и E находятся в «попутном» состоянии, и, наконец, станция А всегда имеет свободный статус.

При выполнении переключения восточное и западное оптические устройства станции A мгновенно генерируют аварийное сообщение T_LOS. Восточное оптическое устройство станции F и западное оптические устройство станции B соответственно генерирует аварийное сообщение HP_LOM. Каждая станция получает аварийное сообщение о защитном переключении PS, за исключением станции A.

(2) Анализ неисправности:

Согласно принципу "сначала станция, затем блок", сначала попытайтесь выявить проблему в каждой отдельной станции: отправка аварийного сообщения о потере сигнала T_LOS обычно указывает на то, что устройство кросс-коннекции не передает сигнал или сигнал приходит в линейное устройство без кадра. Это аварийное сообщение тестируется в восходящем потоке сигнальных сообщений. Аварийное сообщение HP_LOM тестируется в нисходящем потоке сигнальных сообщений. Оно показывает, что байт H4 несет информацию о сбое в маршруте от точки генерации противоположной станции к оконечной точке местной станции, и становится недействительным. Эти аварийные сообщения могут все относиться к станции A, поэтому мы предварительно ищем проблему в станции A.

Анализируя эти аварийные сообщения, мы знаем, почему байт H4 становится недействительным – из-за плохой координации блока кросс-коннекции и линейного блока, или проблемы возникают в линейном блоке или в блоке кросс-коннекции. Обычно аварийное сообщение T_LOS представляет собой сигнал, который отправляется в линейный блок блоком кросс-коннекции. В то же время, учитывая, что восточное и западное оптические блоки станции A выдают аварийные сообщения T_LOS одновременно, вероятность неисправности устройства кросс-коннекции значительно выше, чем вероятность неисправности линейного устройства. Решением является замена блока кросс-коннекции.

После замены блока кросс-коннекции необходимо установить наблюдение за его работой в течение некоторого времени. Если неисправностей не наблюдается, значит, проблема успешно устранена.

1.4.3 Заключение

Из проанализированных выше примеров мы можем увидеть, что использование позиции каждого аварийного сообщения в потоке сигнальных сообщений может постепенно снизить уровень потенциально существующих проблем, что приведет к реализации цели – быстрому обнаружению неисправностей. Опытному персоналу, обслуживающему оборудование, необходимо придерживаться соответствующих принципов работы с аварийными сообщениями и отображением рабочих показателей потока сигнальных сообщений.