В работе рассматриваются основные шаблоны, связанные с отказами оборудования, которые можно наблюдать в рядах данных системы экологического мониторинга города. Мы показываем, что отказы оборудования, регистрирующего метеорологические параметры, могут быть связаны не только с длительным отсутствием измерений. На примере данных, накопленных за шесть лет в распределенной сети мониторинга качества воздуха в Красноярске, мы описываем наблюдаемые шаблоны в данных, связанные с отказами оборудования, которые могут повлиять на качество дальнейшего прогнозирования. Приводится краткий обзор существующих методов обнаружения таких закономерностей в данных, а также ограничения их применимости к реальным временным рядам измерений.
В работе предложена следующая классификация основных шаблонов в поведении имеющихся для анализа рядов, которые мы связываем с отказами оборудования (см. рис. 1).
Рисунок 1. Графики сегментов ряда: а), г), ж), д) соответствуют нормальному поведению температуры, давления, влажности, и концентрации PM2.5 соответственно; б),в),е),з),и),к),л),м) показывают различные типы выбросов
1. Единичный выброс — это измерения, значения которых в определенный временной момент резко отличаются от соседних. Такое поведение данных лучше всего определить как локальный выброс. Отметим, что после внезапного роста значения может произойти его резкое падение, однако величина падения может быть не такой выраженной (рис. 1 (б)). Единичные выбросы очень распространены в наших данных (рис. \1 (б,д,з,л)). Отметим также, что мгновенный всплеск концентрации PM2.5 не всегда является отказом оборудования. Например, он может быть связан с транспортной пробкой, если датчик расположен вблизи дороги, или вызван другими естественными причинами. Для автоматического удаления из данных единичных выбросов требуется сначала дать физически обоснованное определение локального выброса, а затем разработать метод его дифференциации в серии данных.
2. Нетипичное поведение — это такое поведение параметра, когда отдельное наблюдение не обязательно является локальным выбросом, в то время как совместное поведение последовательных измерений с течением времени является необычным. Нетипичное поведение является выбросом подпоследовательности. Например, для температуры и относительной влажности любое изменение суточного периода сезонности ряда является нетипичным. В связи с этим, одним из способов поиска таких аномалий будут методы выделения сезонных составляющих.
В то же время изменение периода сезонности для уровней концентрации PM2.5 вряд ли будет признаком нетипичного поведения, поскольку существуют длительные периоды экстремально высоких уровней PM2.5, связанные с неблагоприятными условиями в городе. В эти периоды ряд данных для PM2.5 будет аномальным, но не выбросом подпоследовательности.
3. Плато — это подпоследовательность ряда, в которой значения не меняются (или почти не меняются), т. е. дисперсия близка к нулю. Этот тип сбоя обнаружить проще всего. Яркой иллюстрацией плато является сбой измерения относительной влажности при накоплении конденсата в оборудовании (рис. 1). Отметим, что на рис. 1 (е) давление между 12:00 5 февраля и началом 10 февраля 2022 года измерялось в нормальном режиме, и небольшой разброс измерений не является признаком плато.
4. Нерегулярная пульсация или биения наблюдались как выброс подпоследовательности, при котором амплитуда и частота колебаний измерений вокруг скользящего среднего становятся аномально высокими, что в свою очередь проявляется в увеличении дисперсии измерений. Такие аномалии встречаются в рядах измерений уровня концентрации PM2.5 и температуры (рис. 1 (в, м)).













