HTML-content

2303-9868

2227-6017

Международный научно-исследовательский журнал

2303-9868

ИП Соколова М.В.

10.23670/IRJ.2022.122.29

Brief communication

ЭВРИСТИЧЕСКИЙ ПОДХОД К ОПТИМИЗАЦИИ СТРУКТУРЫ КАДРОВ ТЕЛЕМЕТРИЧЕСКИХ ДАННЫХ ДЛЯ ЗАДАЧИ СЖАТИЯ

https://orcid.org/0000-0001-8203-7779

Богачев

Илья Владимирович

010608@pnu.edu.ru 1

1Тихоокеанский государственный университет

17 08 2022

2022

6 122 1 6 11 07 2022 13 07 2022

2022

This is an open-access article distributed under the terms of the Creative Commons Attribution 4.0 International License (CC-BY 4.0), which permits unrestricted use, distribution, and reproduction in any medium, provided the original author and source are credited. See http://creativecommons.org/licenses/by/4.0/.

В работе рассматривается эвристический подход к оптимизации структуры телеметрических данных для задачи сжатия, на основе которого разработан алгоритм обратимого упорядочивания структуры составленных из их разностно-битового представления кадров, а также способы оценивания их однородности. Показано, что разработанные решения позволяют значительно повысить эффективность сжатия кадров, данные в которых обладают преимущественно нестационарными характеристиками. Обосновано, что предложенные решения могут найти применение в составе системы адаптивного сжатия, в основу которой ляжет не только выбор оптимального для текущих кадров данных алгоритма сжатия, но и выбор способов оценки однородности кадров.

телеметрические данные кадр данных предварительная обработка структурное преобразование сжатие коэффициент сжатия

HTML-content

1. Введение

После спада в середине-конце XX века, связанного с обоснованием принципиальной невозможности преодоления верхней теоретической границы коэффициента сжатия для существовавших на тот момент способов представления телеметрических данных, к данной проблеме вновь обратилось пристальное внимание научного сообщества, что подтверждают исследования как отечественных [1], [2], так и зарубежных [3], [4] авторов.

Такой интерес в первую очередь связан со сложившимися тенденциями в современной промышленности, аэрокосмической отрасли, медицине и т.д., но к ним оказались совершенно не готовы существующие подходы к сжатию телеметрических данных, большинство из которых основаны на рассмотрении множества источников независимо друг от друга, с учетом только линейной структуры каждого из них в отдельности [5], [6]. На основе такого подхода разработаны практически все современные алгоритмы сжатия [7], [8], но, несмотря на их многообразие, наибольшее применение и по сей день находит подход, при котором используется дельта-кодирование с последующим представлением данных с использованием кодов переменной длины.

Однако, озвученный выше подход, как и любые классические алгоритмы сжатия не позволяют в полной мере учитывать особенности телеметрических данных, поступающих в один и тот же момент времени от разных источников, для которых характерно наличие как одномерных, так и двумерных корреляционных связей [9], [10]. Учет таких корреляций стал возможен с использованием другого подхода [11], в основу которого легло представление данных единой информационной единицей путем объединения в кадры с определенной структурой. Такой подход показал свое принципиальное превосходство над классическими алгоритмами сжатия [12] с точки зрения эффективности, которая связана с тем, насколько сильно структура данных соответствует некоторой «идеальной» структуре [13], на которой алгоритмы показывают предельно возможный коэффициент сжатия.

Исходя из вышесказанного, становится очевидной необходимость в разработке подходов к преобразованию структуры телеметрических данных и их кадров, которые позволят учитывать особенности алгоритмов сжатия и оптимизировать данные таким образом, чтобы алгоритмы показывали на них максимальную эффективность.

2. Способы оценки однородности кадров данных

Потоки телеметрических данных на протяжении длительных временных интервалов обладают свойством стационарности [9], исходя из чего предлагается организовывать множество отсчетов в виде кадров, содержащих результат дельта-кодирования для каждого отсчета, представленный в битовом виде. Пример такого представления приведен на рис. 1, где приняты следующие обозначения: ΔДi – результат дельта-кодирования пары отсчетов, полученных от датчика Дi, n – число источников данных разрядности m, ΔДi,j – представление отсчета ΔДi в виде последовательности бит.

Figure 1

Формы представления телеметрических данных

Очевидно, что при представлении кадра в виде двумерной матрицы, его биты образуют некоторые группы или области, как показано на рис. 2.

Figure 2

Примеры выделения различных структур в кадре

В данной работе под группами предлагается понимать последовательность связанных между собой бит одного типа, при этом можно выделить сильно и слабо связанные группы. Так, для первых характерна связь только с элементами, которые расположены рядом строго по горизонтали или вертикали (рис. 2, а), а для вторых также учитывается и диагональная связь (рис. 2, б). А под областями – образуемые множеством элементов одного типа прямоугольные области произвольного размера (рис. 2, в).

В свою очередь, их свойства могут выступать как мера однородности данных и, следовательно, отражать то, насколько эффективно может быть сжать кадр. Так, чем больше в нем определяется групп или областей, тем менее однородна структура, а следовательно, и ниже потенциальный коэффициент сжатия.

Важно заметить, что данные характеристики могут иметь не только количественное, но и качественное значение, так, при большом числе включенных элементов и/или сложной геометрии группы будет образовано множество групп меньшего размера, что также окажет негативный эффект на дальнейшую эффективность сжатия. Аналогичная особенность характерна и для областей, так, чем больше областей небольшого размера, тем хуже кадр поддается сжатию.

Таким образом оценивать свойства кадров с позиции последующей эффективности их сжатия предлагается при помощи коэффициентов однородности и пропорциональности.

С точки зрения решения задачи увеличения эффективности сжатия, целью любого преобразования над кадром является повышение его однородности, что возможно сделать за счет сокращения количества обнаруживаемых в нем групп или областей, т.е. устанавливается обратная связь между двумя этими характеристиками и тогда оценка, выраженная коэффициентом однородности групп (kодн.гр) или областей (kодн.обл), будет иметь следующий вид: kодн.гр = 1 / Nгр и kодн.обл = 1 / Nобл, где Nгр и Nобл – число обнаруженных в кадре групп или областей соответственно.

Описанные выше характеристики оценивают кадр с количественной позиции, качественно же его оценить можно с использованием отношения числа областей к группам, введя коэффициент пропорциональности: kпр = Nгр / Nобл.

Figure 3

Представление кадра в виде биграфа для элементов, принимающих значение единицы

Другим подходом может стать способ представления кадра, заключающийся в интерпретации его элементов, принимающих значение единицы или нуля в виде биграфа, как показано на рис. 3. Тогда положение каждой пары его вершин будет определяться следующим образом: для первой точки по оси ординат – нулем, а по оси абсцисс – номером строки элемента, а для второй точки – единицей и номером столбца элемента соответственно. В таком случае характеристикой оценки однородности кадра может стать общее число пересечений ребер биграфа (qп.р).

3. Алгоритм структурного преобразования

В общем виде рассматриваемое структурное преобразование может быть описано с помощью следующей последовательности шагов:

1. Вычисляется характеристика для исходной структуры кадра, оценивающая его однородность;

2. Выполняется последовательная попарная перестановка строк кадра от первой к последней, на каждом шаге которой вычисляется характеризующая кадр характеристика. Если ее значение показывает увеличение однородности кадра, то перестановка прерывается и запоминается тип операции и номер перемещенной строки;

3. Фиксируется структура кадра с измененным порядком строк;

4. Происходит последовательная попарная перестановка столбцов кадра от первого к последнему, на каждом шаге которой вычисляется характеризующая кадр характеристика. Если ее значение показывает увеличение однородности кадра, то перестановка прерывается и запоминается тип операции и номер перемещенной строки;

5. Фиксируется структура кадра с измененным порядком столбцов;

6. Сравнивается исходная структура кадра с парой измененных, если они эквивалентны, то преобразование завершается, иначе выбирается та измененная структура, которая показала большую однородность и происходит переход к следующему шагу;

7. Для структур кадра с измененным порядком срок и столбцов вычисляется оценка, отражающая эффективность их преобразования;

8. Полученные оценки сравниваются между собой, и исходной становится та структура кадра, которая обладает наибольшей однородностью, после чего происходит переход к п. 1.

В качестве способов оценки эффективности преобразования, предлагается использовать следующие:

- отношение коэффициентов сжатия для исходного (kcж.исх) и преобразованного (kсж.пр) состояния кадра данных;

- отношение предложенных в работе характеристик оценки однородности для исходного и преобразованного представления кадра данных.

Для описания результатов работы алгоритма предлагается к кадру добавлять заголовок (Hф.пр), в котором проведенные манипуляции кодируются двоичным кодом следующим образом:

[LATEX_FORMULA]$H_{\textit{ф.пр}}=F_{\textit{э.пр}}+\sum_{i=1}^{N_{\textit{пр}}}\left(T_{\textit{стр}/\textit{ст}}+N_{\textit{стр}/\textit{ст}}\right)_{i}$[/LATEX_FORMULA]

где Fэ.пр – флаг, указывающий на эффективность преобразования (в случае его неэффективности, происходит только его передача); Nпр – количество зафиксированных преобразований; Tстр/ст – флаг, указывающий на то, производилось преобразование над строкой или столбцом; Nстр и Nст – битовые поля, указывающее на номер перемещенной строки или столбца соответственно, размер которых (Lстр и Lст) рассчитывается согласно следующим формулам: Lстр = 1 + ⌊log2(n − 1)⌋ и Lст = 1 + ⌊log2(m − 1)⌋.

Важно отметить, что операции преобразования полагаются заранее известным и нет необходимости в их передачи.

4. Исследование предложенных решений

Тестирование разработанного алгоритма и способов оценки однородности кадров проводилось с использованием данных телемеханики, полученных от ряда объектов энергетики. В качестве тестовых использовались пять наиболее характерных наборов данных (НД), сформированных из отсчетов, полученных как в штатном режиме работы объекта (стационарные наборы НД1, НД3 и НД5), так и в режиме перевода энергосети из одного состояния в другое (нестационарные наборы НД2 и НД4). Следует отметить, что объем наборов варьировался от 11 до 19 тысяч кадров.

Для оценки эффективности предложенного в работе подхода, использовался универсальный алгоритм сжатия (АС), основанный на представлении кадра как таблицы истинности логической функции нескольких переменных (LC) [14].

Результат работы алгоритма сжатия над данными, для которых не применялось предварительное преобразование, приведен в табл. 1, при этом оценивались средний коэффициент (СКС) и среднее время (СВС) сжатия для каждого набора.

Table 1

Результаты исследования эффективности алгоритмов сжатия

АС	Параметр	НД
НД1	НД2	НД3	НД4	НД5
LC	СКС, ед	3,2055	1,7995	2,7288	2,1577	3,9509
СВС, мс	0,3241	1,3058	1,3021	1,4457	1,1031

Представленный результат показывает, что рассмотренный алгоритм на нестационарных НД дает относительно низкий коэффициент сжатия, и одновременно с этим затрачивает значительное количество времени на сжатие по сравнению с результатами, полученными для стационарных наборов. Такое его поведение означает малую эффективность в случае работы с данными нестационарного и смешанного типа, а также принципиальную непригодность при условии работы в «жестком» реальном времени.

С целью определения эффективности алгоритма структурного преобразования (АСП) и способов оценки однородности структуры кадров было проведено исследование, где их комбинации применялись над каждым НД и при этом фиксировались следующие параметры:

- средний коэффициент и среднее время сжатия одного кадра для каждого НД с применением предварительного преобразования;

- процент прироста среднего коэффициента сжатия кадров, для которых преобразование оказалось эффективным (СКСПК);

- процент кадров от всего их числа в наборе, для которых преобразование оказалось эффективным (ЧПК).

Результаты проведенного исследования приведены в табл. 2, при этом важно отметить, что:

- для вычисления характеристики qп.р построение вершин шло только для элементов, принимающих значение единицы;

- производился поиск только сильно связанных групп.

Table 2

Результаты исследования эффективности алгоритма структурного преобразования

АС	Хар-ка	Параметр	НД
НД1	НД2	НД3	НД4	НД5
LC	одн.гр	СКС, ед	3,2063	1,8499	2,7864	2,2160	3,9585
СВС, мс	1,6925	7,6950	2,9986	9,0810	3,5006
СКСПК, %	11,2600	7,1909	11,5487	6,9759	11,0058
ЧПК, %	18,1540	47,1807	29,4790	46,9453	16,6145
одн.обл	СКС, ед	3,3314	1,8774	2,8421	2,2569	4,0503
СВС, мс	25,0475	146,3014	45,5110	145,4572	42,1941
СКСПК, %	14,1813	8,3560	11,6385	8,1798	12,0895
ЧПК, %	42,2590	57,4089	45,7672	61,2022	35,9284
пр	СКС, ед	3,1960	1,8449	2,7589	2,2041	3,9500
СВС, мс	21,6190	145,9080	33,2227	158,3708	36,0025
СКСПК, %	9,4751	6,6896	9,2296	6,1637	10,1142
ЧПК, %	17,8185	46,5338	25,4682	44,3886	15,7477
п.р	СКС, ед	3,1779	1,8630	2,7576	2,2231	3,9287
СВС, мс	1,2045	17,0180	2,3810	9,3843	2,5900
СКСПК, %	6,9795	6,6397	5,1087	6,3862	5,4136
ЧПК, %	14,7186	61,2379	44,4507	56,3323	18,6665

Полученные в ходе исследований результаты показывают, что в среднем удается достичь не особо значительного прироста коэффициента сжатия, при этом лучший результат показал учет коэффициента однородности областей.

Важно заметить, что несмотря на невысокие показатели эффективности в среднем для НД, наблюдается значительное увеличение коэффициента сжатия отдельных кадров, а также прослеживается тенденция к увеличению количества удачных преобразований на тех наборах, стационарные свойства в которых выражены наиболее слабо.

5. Заключение

Несмотря на в среднем невысокую эффективность предложенного в работе подхода к оптимизации структуры кадров телеметрических данных, его применение можно найти в составе системы адаптивного сжатия, в основу которой ляжет не только выбор оптимального для текущих кадров данных алгоритма сжатия, но и выбор способов оценки однородности кадров.

Помимо этого, следует отметить, что основным преимуществом предложенного подхода является его эффективность для данных, обладающих нестационарными свойствами, уменьшение избыточности в которых является одной из важнейших задач в области неискажающего сжатия, что также может стать одним из дальнейших путей для проведения исследований, заключающегося в определении зависимости качества преобразования от степени стационарности кадров.

Additional File

The additional file for this article can be found as follows:

Online Supplementary Material

Further description of analytic pipeline and patient demographic information. DOI: https://doi.org/10.23670/IRJ.2022.122.29

Acknowledgements

Competing Interests

None

Salomon D.. Handbook of Data Compression / Salomon D., Motta G. – London: Springer, 2010. – 1370 c. DOI: 10.1007/10.1007/978-1-84882-903-9. [in English]

Ватолин Д.. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео / Ватолин Д., Ратушняк А., Смирнов М., Юкин В. – Москва: ДИАЛОГ-МИФИ, 2003. – 384 c.

Верба В.С. 10. Интеграция данных в многодатчиковых бортовых информационно-управляющих системах / Верба В.С., Меркулов В.И., Миляков, Д.А., Чернов В.С. // Информационно-измерительные и управляющие системы. – 2014. – № 2(12). – c. 32–43.

Capurro I. Efficient Sequential Compression of Multichannel Biomedical Signals / Capurro I., Lecumberry F., Martin A., Ramirez I., Rovira E., Seroussi F. // IEEE Journal of Biomedical and Health Informatics. – 2017. – № 4(21). – c. 904–916. DOI: 10.1109/JBHI.2016.2582683. [in English]

Markaryan L.V. Monitoring and modeling compression of geophysical data / Markaryan L.V. // Mining Informational and Analytical Bulletin (Scientific and Technical Journal). – 2018. – № 3. – c. 218–225. DOI: 10.25018/0236-1493-2018-3-0-218-225. [in English]

Bogachev I.V. Selection Criteria of the Compression Algorithm in Information-Measuring System / Bogachev I.V., Levenets A.V., Chye E.U. // 2nd International Conference on Industrial Engineering, Applications and Manufacturing (ICIEAM). – 2016. – № 2. – c. None. DOI: 10.1109/ICIEAM.2016.7911541. [in English]

Xin X. Unsupervised Learning for 3D Ultrasonic Data Compression / Xin X., Saniie J. // 2021 IEEE International Ultrasonics Symposium (IUS). – 2021. – № 22. – c. None. DOI: 10.1109/IUS52206.2021.9593654. [in English]

Лихтциндер Б.Я. Адаптивное сжатие измерительных данных в беспроводных сенсорных сетях / Лихтциндер Б.Я., Бакай Ю.О. // Измерение. Мониторинг. Управление. Контроль.. – 2021. – № 1(35). – c. 52–57. DOI: 10.21685/2307-5538-2021-1-6.

Левенец А.В. Алгоритм структурного упорядочивания измерительных данных / Левенец А.В., Нильга В.В., Чье Е.У. // Информатика и системы управления. – 2010. – № 3(25). – c. 82–87.

Богачев И.В. Геометрический подход к сжатию данных телеметрических систем / Богачев И.В., Левенец А.В. // Информатика и системы управления. – 2015. – № 4(46). – c. 16–22.

Байбекова Ф.Н. Обзор способов снижения избыточности телеметрической информации / Байбекова Ф.Н. , Подольцев В.В. , Беспалова Н.М. , Сологубова Л.А. // Радиопромышленность. – 2019. – № 2. – c. 8–16.

Левенец А.В. Представление телемеханических данных однородными n-мерными структурами как предварительная обработка в задачах сжатия / Левенец А.В., Нильга В.В., Чье Е.У. // Информационно-управляющие системы. – 2011. – № 6(55). – c. 7–10.

Богачев И.В. Статистический анализ телеметрических данных с точки зрения задачи сжатия / Богачев И.В., Левенец А.В., Чье Е.У. // Информационно-управляющие системы. – 2017. – № 1(86). – c. 11–16. DOI: 10.15217/issn1684-8853.2017.1.11.

Тулекбаев Е.Т. Эффективные методы сжатия телеметрической информации для наземных комплексов управления / Тулекбаев Е.Т. // Вестник науки и образования. – 2017. – № 10. – c. 14–20.