МЕТОД ВСТРАИВАНИЯ СТЕГАНОГРАФИЧЕСКИХ ВОДЯНЫХ ЗНАКОВ В ВЕЙВЛЕТ-КОЭФФИЦИЕНТЫ АУДИО-СПЕКТРОГРАММЫ

Research article
DOI:
https://doi.org/10.23670/IRJ.2017.58.125
Issue: № 4 (58), 2017
Published:
2017/04/17
PDF

Ямаев М.И.

ORCID: 0000-0001-5860-7997,

Пермский Национальный Исследовательский Политехнический Университет

МЕТОД ВСТРАИВАНИЯ СТЕГАНОГРАФИЧЕСКИХ ВОДЯНЫХ ЗНАКОВ В ВЕЙВЛЕТ-КОЭФФИЦИЕНТЫ АУДИО-СПЕКТРОГРАММЫ

Аннотация

Ставится проблема защиты авторского права аудиоданных. Рассмотрены устаревшие и современные методы защиты аудио-информации посредством стеганографических водяных знаков. На основе оценки их актуальности и эффективности выбран и проанализирован метод основанный на дискретном-вейвлет преобразовании. Основное преимущество метода заключается в его устойчивости к сжатию с потерями. На основе анализа предложен метод встраивания СВЗ в вейвлет коэффициенты аудио-спектрограммы. Для этих целей используется система математического моделирования MATLAB.

Ключевые слова: вейвлет-преобразование, стеганография, цифровой водяной знак, аудио-спектрограмма.

Yamaev M.I.

ORCID: 0000-0001-5860-7997,

Perm National Research Polytechnic University

METHOD OF BUILDING IN STEGANOGRAPHIC WATERMARKS IN WAVELET-COEFFICIENTS OF AUDIO SPECTROGRAMMAS

Abstract

The problem of copyright protection of audio data is presented in the article. We have considered obsolete and modern methods of protecting audio information through steganographic watermarks. Based on the assessment of their relevance and efficiency, we have chosen and analysed the method based on discrete-wavelet transformation. The main advantage of the method is its resistance to compression with losses. On the basis of the analysis, we suggested a method for integrating TWA into wavelet coefficients of an audio spectrogram. The mathematical modeling system MATLAB was used for these purposes.

Keywords: wavelet transformation, steganography, digital watermark, audio spectrogram.

Из-за большого числа возможностей представления звуковой информации в Интернете, её многообразия и колоссальных объёмов распространения, крайне сложно доказать авторство определённых аудиокомпозиций. У правообладателя зачастую возникает упущенная выгода. Технологии, которые позволили бы идентифицировать автора таких данных, являются перспективными и важными.

Данную проблему можно решить с помощью цифровой стеганографии. Цифровая стеганография сегодня имеет 3 направления:

  1. Цифровые отпечатки (ЦО, Digital fingerprint), которые подразумевают наличие различных стеганографических меток-сообщений, для каждой копии контейнера.
  2. Стеганографические водяные знаки (СВЗ) (Stego Watermarking). В этом случае это наличие одинаковых меток для каждой копии контейнера. К примеру, встраивание в каждый кадр видео-файла специальной идентифицирующей этот файл информации.
  3. Скрытая передача данных (СПД). Принципиальное отличие заключается в том, что целью СПД является сама скрытая передача данных, а в случае с СВЗ и ЦО это защита самого контейнера.

К примеру, в видеохостинге «YouTube» используется система цифровых отпечатков (ЦО, fingerprinting, сигнатуры, небольшие фрагменты аудиовизуального содержания). Такие сервисы как «Shazam» и «Yandex Музыка» так же используют цифровые отпечатки для распознавания аудио, но пока такие системы обладают недостаточной точностью и имеют высокие показатели ошибок. Более разумно использовать СВЗ. Для аудио на данный момент нет массово реализуемого алгоритма встраивания таких защитных данных. Основной причиной низкой надёжности методов встраивания СВЗ является обилие форматов звуковых файлов, связанных с различной степенью их сжатия, а так же возросшая с ростом технологий лёгкость обработки аудио сигнала пользователем с последующим его искажением.

Некоторые алгоритмы основываются на встраивании скрытой информации в служебные поля файла (заголовки) [1, С. 240]. Они являются очень уязвимыми. В действительности, злоумышленнику достаточно удалить служебную информацию или заменить на собственную. На данный момент уже появились стеганографические алгоритмы скрытия информации, неплохо удовлетворяющие поставленным требованиям: метод фазового кодирования; метод расширенного спектра; эхо-метод. Основные недостатки использования таких методов как эхо и расширенного спектра заключаются в том, что они вносят шум в аудиофайл, который может быть довольно различимым для человеческого уха.[2, С. 20] Данные методы имеют плохую робастность. Рассмотренные выше методы не устойчивы к большинству злоумышленных атак. Одна из актуальных методик сегодня основана на скрытии информации с применением дискретного вейвлет-преобразования (ДВП или DWT). Выдвигается концепция метода, основанная на применении ДВП в области акустической спектрограммы.

Первые вейвлет-преобразования были разработаны Хааром. Имея одномерный входной сигнал S каждой паре соседних элементов ставятся в соответствии их полусумма и полуразность. После чего данную операцию повторяют для каждого элемента исходного сигнала и получают на выходе два сигнала, один (a1) из которых является огрублённой версией входного сигнала, а второй (d1) содержит детализирующую информацию, необходимую для восстановления исходного сигнала. Длина таких сигналов вдвое меньше исходного сигнала. Данный процесс можно снова повторять, но уже на первый полусигнал сигнал (a1) и получить соответственно a2 и d2. Такой процесс будет будет называться преобразованием Хаара на глубину 2.

Пакет математического моделирования MATLAB обладает нужными средствами для проведения моделирования. Эти средства обеспечивают тонкий анализ сигналов и обнаружение порою скрытых их особенностей. В системе MATLAB эти средства реализованы в пакете расширения Wavelet Toolbox. [3] Пример преобразования звукового сигнала, с помощью вейвлет-преобразования Хаара на глубину 6 в этой системе (рис. 1, этапы декомпозиции a1-a5, d1-d5 пропущены). Сигналы a1-a6 - это выходы с фильтров низких частот, а сигналы d1-d6 - это выходы с фильтров высоких частот.

image001

Рис. 1 – Преобразование звукового сигнала, с помощью вейвлет-преобразования Хаара на глубину 6

Рассмотрим алгоритм создания СВЗ при помощи модификации вейвлет-коэффиициентов [4, С. 202], [5, С. 201]. Сокрытие производится в области вейвлет-преобразования. Для восстановления сообщения необходимо использовать нужный, заранее определённый вейвлет. Выделение области встраивания производится при помощи усовершенствованного алгоритма Маллата, посредством декомпозиции сигнала аудио-файла S. Как и в случае с ДВП сигнал подаётся на фильтры низких и высоких частот, после чего с помощью операции прореживания формируются массивы коэффициентов аппроксимации и детализирующих коэффициентов на выходах фильтров низких и высоких частот (рис. 2). Таким образом, в результате декомпозиции на глубину L на выходе получаются коэффициенты image002 субполос по image003 коэффициентов в полосе. Полученные в результате декомпозиции коэффициенты субполос являются пространством встраивания. Восстановление сигнала производится заменой прямого дискретного вейвлет-преобразования на обратное и прохождением этапов декомпозиции в обратном порядке.

image004

Рис. 2 – Декомпозиция при помощи вейвлет-преобразования на глубину 2

Существуют применения вейвлет-преобразования как двухмерно представленных данных (матриц), так и 3D (пространственных матриц, моделей). Упрощённо, изображение представляют собой таблицу, в ячейках которой хранятся цвета каждого пикселя. Значения яркости в цветных изображениях берут целыми из диапазона от 0 до 255. Именно эти значения и пропускаются через «Low» и «High» фильтры. 2D-вейвлет преобразования используют в сжатии изображений, но их так же можно использовать для создания СВЗ. При работе со звуковыми файлами часто удобным инструментом является анализ акустической спектрограммы. С недавнего момента их начали использовать для построения сигнатур, которые, впоследствии, используются для создания ЦО.

Спектрограмма может иметь трёхмерное представление. Отсюда выдвигается гипотеза о возможности применения пространственных фильтров. Для использования вейвлет-преобразования в аудио нужно реализовать 3D-версии фильтрующих банков. В случае с 3D, фильтры применяются по очереди к каждому из трех измерений. Пусть данные имеют размер image005(три измерения). Тогда после применения высокочастотного и низкочастотного фильтров к данным в первом измерении получится два набора данных, каждый из которых будет иметь размеры image006. после же применения фильтров на втором измерении уже получается четыре набора данных, каждый из которых будет размера image007. Наконец, применяя декомпозицию, получается 8 наборов данных размерами image008 (Рис.3.).

В системе MatLab имеется средства работы с пространственными вейвлетами. Данные, в таком случае, представляются тремя векторами (Рис. 4).

image009

Рис. 3 – Результат уменьшения сигнала в разных измерениях

image010

Рис. 4 – Декомпозиция данных представленных тремя векторами в MATLAB

а - Исходная 3D модель; б - второй уровень декомпозиции; в - третий уровень декомпозиции

То есть получаем пространственные коэффициенты, которые будут так же модулироваться для хранения СВЗ (внесение информации в области вейвлет-коэффициентов (рис.5).

image011

Рис.5 – Схема основных процессов необходимых для предполагаемого алгоритма

Стеганография на данный момент всё ещё имеем низкий приоритет исследований в сравнении с криптографией. Но ЦО уже начали использоваться на данный момент для защиты прав на различных сервисах или для более точной работы спецслужб. Применяться СВЗ в аудио будет только тогда, когда алгоритм, который станет достаточно стойким и эффективным к атакам злоумышленника, появится на практике.

Список литературы / References

  1. Кокорин П.П. О методах стегоанализа в аудиофайлах // Труды Спииран. – 2005 – С. 164-170.
  2. Дьяконов В.П. Вейвлет-анализ в MATLAB реальных осциллограмм // Контрольно-измерительные приборы и системы. - 2010. С.19-25.
  3. Нигматуллин Э. В., Ковырзина К. С. Обзор методов цифровой аулио стеганографии // Научное сообщество студентов XXI столетия. Технические науки: сб. ст. по мат. XLII междунар. студ. науч.-практ. конф. № 5(41). URL:https://sibac.info/archive/technic/5(41).pdf (дата обращения: 05.12.2016)
  4. Федоров В. М., Макаревич О. Б., Рублев Д. П. Метод стеганографии в аудиосигналах и изображениях, устойчивый к компрессии с потерями // Известия ЮФУ. Технические науки. 2006. №7 С.201-208.
  5. Рублёв Д. П., Макаревич О. Б., Федоров В. М. Метод стеганографического встраивания сообщений в аудиоданные на основе вейвлет-преобразования // Известия ЮФУ. Технические науки. 2009. №11 С.199-206.

Список литературы на английском языке / References in English

  1. Kokorin P.P. O metodah stegoanaliza v audiofaylah [About methods of stegoanalysis in audio files] // Trudyi Spiiran [SPIIRAS Proceedings]. – 2005 – S. 164-170. [in Russian]
  2. Dyakonov V.P. Veyvlet-analiz v MATLAB realnyih ostsillogramm [Wavelet analysis in MATLAB of real oscillograms] // Kontrolno-izmeritelnyie priboryi i sistemyi. [Instrumentation and systems] - 2010. P.19-25. [in Russian]
  3. Nigmatullin E. V., Kovyirzina K. S. Obzor metodov tsifrovoy aulio steganografii [Overview methods of Digital Audio Steganography] // Nauchnoe soobschestvo studentov XXI stoletiya. Tehnicheskie nauki: sb. st. po mat. XLII mezhdunar. stud. nauch.-prakt. konf. [XLII International Scientific and Practical Conference "Scientific community of students of the XXI century. Technical science"] # 5(41). URL:https://sibac.info/archive/technic/5(41).pdf (data obrascheniya: 05.12.2016) [in Russian]
  4. Fedorov V. M., Makarevich O. B., Rublev D. P. Metod steganografii v audiosignalah i izobrazheniyah, ustoychivyiy k kompressii s poteryami [The method of steganography in audio signals and images, resistant to lossy compression] // Izvestiya YuFU. Tehnicheskie nauki. [News of SFedU] 2006. #7 P. 201-208. [in Russian]
  5. RublYov D. P., Makarevich O. B., Fedorov V. M. Metod steganograficheskogo vstraivaniya soobscheniy v audiodannyie na osnove veyvlet-preobrazovaniya [The method steganographic embedding of messages into audio data on the basis of wavelet transform] // Izvestiya YuFU. Tehnicheskie nauki. [News of SFedU. Technical science] 2009. #11 P.199-206. [in Russian]