Сравнение объективных оценок набора метрик с субъективными оценками
Сравнение объективных оценок набора метрик с субъективными оценками
Аннотация
Субъективная оценка качества является фундаментальной темой исследований в области оценки качества видео, которая в настоящее время привлекает повышенное внимание всего научного сообщества. Несмотря на то, что данный тип оценки является трудновоспроизводимым, он остается до сих пор востребованным. Существует большое количество исследований, по объективной оценке, качества видео, но остается мало понимания того насколько хорошо существующие методы объективной оценки сравнимы с субъективной при измерении воспринимаемого качества. В работе с помощью выбранного набора метрик были исследованы две базы данных субъективных оценок и проведено экспериментальное сравнение результатов объективных и субъективных оценок, в ходе которого были выявлены расхождения результатов, полученных для одних и тех же кадров. На основе полученных результатов сделан вывод о необходимости разработки решения, альтернативного эталонным метрикам качества.
1. Введение
Качество видеоконтента представляет собой набор параметров, определяющих восприятие обработанного видео, человеком, просматривающим данный контент . Оценка качества обязательно проводится на разных этапах обработки видео. Данная оценка может быть субъективной или объективной. Субъективная оценка качества проводится группой экспертов, в соответствии с определенными рекомендациями и методологиями , и представляет собой экспертное мнение о качестве видео в заранее определенных тестовых условиях. Несмотря на то, что проведение субъективной оценки сопряжено со значительными трудностями, данный метод остается одним из самых надежных и актуальных методов оценки качества , а также является лучшим методом оценки качества в режиме реального времени. Данный тип оценки широко применяется в медиаиндустрии, при обработке и передаче видео, при имитации компьютерного зрения, также используется с целью обеспечения хорошего пользовательского опыта .
Объективная оценка качества проводится метриками, которые базируются на математических алгоритмах с использованием показателей, которые пытаются отразить механизмы восприятия зрительной системы человека для сравнения эталонного и искаженного изображения . Одной из проблем использования данного типа оценки является то, что некоторые метрики не учитывают особенности визуального восприятия видеоконтента человеком, а базируются, например, на таких критериях как структура и текстура, которые слабо различимы человеческим зрением, особенно при низком битрейте, когда текстурных и структурных искажений возникает больше.
Ко второй проблеме, по мнению авторов данной статьи, стоит отнести некоторую односторонность оценок качества видеоконтента с помощью существующих объективных метрик. Метрики, как правило, оценивают один параметр качества видео, без учета взаимного влияния разных параметров друг на друга.
Авторами статьи «Набор объективных метрик качества, ориентированных на особенности восприятия видеосигнала человеком» было проведено исследование объективных метрик качества с целью выявления набора метрик наиболее соответствующего субъективной оценке. В результате чего был выделен набор из 3 метрик, включающий в себя PSNR , SSIM и DISTS .
Задачей данной статьи является объективная оценка с помощью трех обозначенных метрик открытых баз видео с разными типами искажений и сравнение полученных результатов работы метрик из предложенного набора с результатами субъективной оценки на основе их относительных отклонений.
2. Основные результаты
Для проведения исследования были выбраны искаженные видео с субъективными оценками из открытых баз данных BVI-FVI и MCL-V .
База данных BVI-VFI, содержит 36 эталонных видео в разрешении 1920x1080, обладающих разной частотой кадров (30, 60 и 120 кадров в секунду). Каждое видео обработано с пониженной дискретизацией и интерполяцией пятью методами VFI (Video Frame Interpolation) , из чего получено 180 искаженных видеороликов. К данным видам искажений можно отнести:
1) Repeat (повторение) — метод, основанный на многократном дублировании последовательности кадров;
2) Average (усреднение) — метод, основанный на усреднении кадров, где средний кадр генерируется путем усреднения двух смежных кадров;
3) DVF (Deep Voxel Flow) — метод, основанный на глубокой нейронной сети, которая синтезирует видеокадры, извлекая значения вокселей из существующих;
4) QVI (Quadratic Video Interpolation) — метод, основанный на многослойной структуре, где присутствуют слои обратного и прямого потока для аппроксимации движения пикселей и создания дополнительных кадров;
5) ST-MFNet (Spatio-Temporal Multi-Flow Network) — метод, основанный на пространственно-временной многопоточной архитектуре, с помощью которой происходит прогнозирование дополнительных кадров и последующее их синтезирование.
Указанные методы, генерируя дополнительные видеокадры, позволяют создавать уникальные типы артефактов, такие как, дрожание и размытие, что непосредственно влияет на текстуру и структуру видеофайла.
При субъективной оценке кадров использовалась методология попарной оценки сходства, основанная на выборе пользователем лучшего из двух изображений и оценке степени различия между изображениями . Вывод средних субъективных оценок проводился по методу DMOS (Differential Mean Opinion Score) .
База данных MCL-V содержит 12 эталонных видео с разрешением 1920x1080 и частотой кадров 30 кадров в секунду. Каждое видео обработано в сервисах потоковой передачи видео (сжатие и масштабирование изображения) при помощи двух типов искажений c четырьмя уровнями сжатия, что суммарно дает 96 искаженных видео. К данным типам искажений можно отнести:
1) Сжатие с использованием стандарта H.264/AVC;
2) Сжатие с последующим масштабированием (изменение изображения при помощи каскада операций: понижающей дискретизации, кодирования, а затем изменения размера до исходного разрешения).
При сжатии изображения использовалось 4 уровня сжатия:
1) H.264_1 — метод, основанный на сжатии видео при ограничении пропускной способности до 2000 кбит в секунду;
2) H.264_2 — метод, основанный на сжатии видео при ограничении пропускной способности до 3000 кбит в секунду;
3) H.264_3 — метод, основанный на сжатии видео при ограничении пропускной способности до 4000 кбит в секунду;
4) H.264_4 — метод, основанный на сжатии видео при ограничении пропускной способности до 5000 кбит в секунду.
При сжатии видеофайла появляются такие артефакты сжатия, как, шумы, зернистость, что негативно влияет на текстуру и структуру.
При субъективной оценке кадров использовалась методология категориальной оценки ухудшения качества, основанная на поочередном представлении эталонного и искаженного изображения пользователю с последующей оценкой степени ухудшения качества изображения . Вывод средних субъективных оценок проводился по методу MOS (Mean Opinion Score) .
Исследование искажений и изменяемых параметров видеофайла двух баз данных показало, что главным изменяемым параметром является структура и текстура видеофайла. Далее необходимо сравнить результаты субъективной и объективной оценок и оценить результаты сравнения.
Сложность сравнения состоит в том, что каждая метрика имеет свою шкалу оценивания качества видеоконтента, в соответствии с используемым алгоритмом. Поэтому необходимо приведение получаемых оценок к единому виду. Для чего применялась шкала перевода оценок, представленная в таблице 1.
Таблица 1 - Шкала перевода оценок
Цветовая идентификация | Субъективная идентификация | Балльная шкала | SSIM | PSNR | DISTS | DMOS | MOS |
#D9EAD3 | отличное | 5 | 0,93 и выше | 38 и выше | 0 - 0,21 | 100 | 8-10 |
#FFF2CC | хорошее | 4 | 0,88-0,93 | 35-38 | 0,21 - 0,28 | 75-100 | 6-8 |
#C9DAF8 | среднее | 3 | 0,84-0,88 | 33-35 | 0,28 - 0,33 | 50-75 | 4-6 |
#F4CCCC | низкое | 2 | 0,78-0,84 | 30-33 | 0,33 - 0,43 | 25-50 | 2-4 |
#EA9999 | плохое | 1 | 0,78 и ниже | 30 и ниже | 0,43 и выше | 0-25 | 0-2 |
Для упрощения чтения таблиц, были введены сокращения, представленные в таблице 2.
Таблица 2 - Принятые сокращения
Полное | Сокращенное | Полное | Сокращенное |
Название видео | Наз. | SSIM | S |
Искажение | Иск. | PSNR | P |
Метрика | Мет. | DISTS | D |
DMOS | DM | MOS | M |
Для сравнения результатов объективных и субъективных оценок, из базы данных BVI-VFI был взят набор видео с разрешением 1920x1080 и частотой кадров 60 кадров в секунду. Результаты субъективной оценки видео, в соответствии с принятой шкалой перевода, представлены в таблице 3.
Таблица 3 - Результаты субъективной оценки видео из базы данных BVI-FVI
Наз. | Иск. | ||||
Average | DVF | QVI | Repeat | STM-FNET | |
Bubblehead (BH) | 46,75 | 80,38 | 33,04 | 48,6 | 37,45 |
Books (Bo) | 57,3 | 76,11 | 38,18 | 57,04 | 37,82 |
Bouncyball (BB) | 51,36 | 79,92 | 38,21 | 54,17 | 37,43 |
Catch_track (CT) | 57,01 | 78,52 | 45,01 | 56,39 | 40,27 |
Cyclist (Cy) | 51,07 | 82,04 | 50,04 | 52,81 | 37,71 |
Golf_side (GS) | 48,66 | 81,69 | 38,3 | 48,98 | 40,72 |
Hamster (Ha) | 47,98 | 78,29 | 37,47 | 50,67 | 38,57 |
Lampspot (La) | 48,52 | 74,1 | 34,53 | 49,67 | 36,49 |
Plasma (Pl) | 47 | 71,89 | 40,95 | 49,59 | 30,76 |
Pond (Po) | 38,18 | 51,22 | 38,6 | 38,19 | 33,49 |
Sparkler (Sp) | 47,7 | 81,09 | 65,03 | 44,45 | 51,21 |
Water (Wa) | 51,98 | 69,32 | 58,78 | 59,29 | 51,53 |
Для выполнения дальнейшего сравнения была проведена объективная оценка эталонных и искаженных видеофайлов базы данных BVI-FVI с помощью метрик (см. табл. 4).
Таблица 4 - Результаты объективной оценки видео из базы данных BVI-FVI
Иск. | Average | DVF | QVI | Repeat | STM-FNET | ||||||||||
Мет. Наз. | S | P | D | S | P | D | S | P | D | S | P | D | S | P | D |
BH | 0,966 | 40,33 | 0,065 | 0,929 | 36,34 | 0,126 | 0,979 | 42,95 | 0,020 | 0,957 | 39,03 | 0,033 | 0,980 | 43,18 | 0,039 |
Bo | 0,787 | 33,03 | 0,170 | 0,721 | 30,20 | 0,251 | 0,982 | 43,91 | 0,019 | 0,771 | 32,83 | 0,089 | 0,984 | 44,41 | 0,020 |
BB | 0,978 | 41,97 | 0,099 | 0,955 | 38,79 | 0,254 | 0,983 | 42,92 | 0,077 | 0,973 | 40,30 | 0,093 | 0,985 | 43,45 | 0,088 |
CT | 0,840 | 35,13 | 0,188 | 0,788 | 33,30 | 0,403 | 0,973 | 43,70 | 0,054 | 0,814 | 34,73 | 0,084 | 0,970 | 43,36 | 0,146 |
Cy | 0,852 | 34,90 | 0,099 | 0,785 | 32,07 | 0,260 | 0,976 | 42,21 | 0,024 | 0,832 | 34,92 | 0,040 | 0,979 | 43,38 | 0,023 |
GS | 0,969 | 40,29 | 0,053 | 0,963 | 37,90 | 0,083 | 0,955 | 39,27 | 0,045 | 0,966 | 39,06 | 0,031 | 0,973 | 41,48 | 0,037 |
Ha | 0,934 | 36,99 | 0,060 | 0,917 | 35,31 | 0,189 | 0,961 | 39,19 | 0,033 | 0,961 | 39,19 | 0,043 | 0,964 | 39,53 | 0,065 |
La | 0,935 | 35,41 | 0,047 | 0,844 | 31,72 | 0,081 | 0,951 | 36,61 | 0,031 | 0,905 | 33,54 | 0,034 | 0,959 | 37,40 | 0,029 |
Pl | 0,957 | 37,34 | 0,082 | 0,915 | 34,91 | 0,254 | 0,972 | 38,54 | 0,066 | 0,950 | 36,23 | 0,082 | 0,975 | 39,07 | 0,069 |
Po | 0,983 | 42,67 | 0,011 | 0,982 | 41,83 | 0,012 | 0,975 | 40,13 | 0,017 | 0,982 | 41,89 | 0,012 | 0,984 | 42,79 | 0,012 |
Sp | 0,923 | 36,78 | 0,121 | 0,914 | 39,64 | 0,215 | 0,938 | 37,52 | 0,171 | 0,920 | 36,12 | 0,091 | 0,901 | 28,06 | 0,394 |
Wa | 0,839 | 35,15 | 0,161 | 0,795 | 34,92 | 0,262 | 0,844 | 35,54 | 0,220 | 0,814 | 34,33 | 0,103 | 0,878 | 36,67 | 0,442 |
Данные, представленные в таблицах 3, 4 принадлежат разным оценочным диапазонам, что затрудняет их сравнение. Для приведения данных к единому диапазону значений необходимо обратиться к таблице 1.
Приведенные данные субъективной и объективной оценок показаны в таблице 5.
Таблица 5 - Приведенные значения субъективной и объективной оценок
Наз. | Avarage | DVF | QVI | Repeat | STM-FNET | |||||||||||||||
Мет. Наз | DM | S | P | D | DM | S | P | D | DM | S | P | D | DM | S | P | D | DM | S | P | D |
BH | 3 | 5 | 5 | 5 | 4 | 4 | 4 | 5 | 2 | 5 | 5 | 5 | 2 | 5 | 5 | 5 | 2 | 5 | 5 | 5 |
Bo | 3 | 2 | 3 | 5 | 4 | 1 | 2 | 4 | 2 | 5 | 5 | 5 | 3 | 1 | 2 | 5 | 2 | 5 | 5 | 5 |
BB | 3 | 5 | 5 | 5 | 4 | 5 | 5 | 4 | 2 | 5 | 5 | 5 | 3 | 5 | 5 | 5 | 2 | 5 | 5 | 5 |
CT | 3 | 2 | 4 | 5 | 4 | 2 | 3 | 2 | 2 | 5 | 5 | 5 | 3 | 2 | 3 | 5 | 2 | 5 | 5 | 5 |
Cy | 3 | 3 | 3 | 5 | 4 | 2 | 2 | 4 | 3 | 5 | 5 | 5 | 3 | 2 | 3 | 5 | 2 | 5 | 5 | 5 |
GS | 2 | 5 | 5 | 5 | 4 | 5 | 4 | 5 | 2 | 5 | 5 | 5 | 2 | 5 | 5 | 5 | 2 | 5 | 5 | 5 |
Ha | 2 | 5 | 4 | 5 | 4 | 4 | 4 | 5 | 2 | 5 | 5 | 5 | 3 | 5 | 5 | 5 | 2 | 5 | 5 | 5 |
La | 2 | 5 | 4 | 5 | 3 | 3 | 2 | 5 | 2 | 5 | 4 | 5 | 2 | 4 | 3 | 5 | 2 | 5 | 4 | 5 |
Pl | 2 | 5 | 4 | 5 | 3 | 4 | 3 | 4 | 2 | 5 | 5 | 5 | 2 | 5 | 4 | 5 | 2 | 5 | 5 | 5 |
Po | 2 | 5 | 5 | 5 | 3 | 5 | 5 | 5 | 2 | 5 | 5 | 5 | 2 | 5 | 5 | 5 | 2 | 5 | 5 | 5 |
Sp | 2 | 4 | 4 | 5 | 4 | 4 | 5 | 4 | 3 | 5 | 4 | 5 | 2 | 4 | 4 | 5 | 3 | 4 | 1 | 2 |
Wa | 3 | 2 | 4 | 5 | 3 | 2 | 3 | 4 | 3 | 3 | 4 | 4 | 3 | 2 | 3 | 5 | 3 | 3 | 4 | 1 |
На рисунке 1 представлены графики, построенные по полученным субъективным и объективным оценкам базы данных BVI — FVI.

Рисунок 1 - Графики сравнения оценок:
а – SSIM; б – PSNR; в – DISTS
На полученных графиках видно, что результаты объективной и субъективной оценок видео заметно расходятся.
Для определения количественных показателей расхождения двух типов оценок были рассчитаны их относительные отклонения. Данные расчетов представлены в таблице 6.
Таблица 6 - Результаты относительного отклонения (среднее по метрике) в процентах
| Average | DVF | QVI | Repeat | STM-FNET | ||||||||||
Мет. Наз. | S от DM | P от DM | D от DM | S от DM | P от DM | D от DM | S от DM | P от DM | D от DM | S от DM | P от DM | D от DM | S от DM | P от DM | D от DM |
BH | 67 | 67 | 67 | 0 | 0 | 25 | 150 | 150 | 150 | 150 | 150 | 150 | 150 | 150 | 150 |
Bo | 33 | 0 | 67 | 75 | 50 | 0 | 150 | 150 | 150 | 67 | 33 | 67 | 150 | 150 | 150 |
BB | 67 | 67 | 67 | 25 | 25 | 0 | 150 | 150 | 150 | 67 | 67 | 67 | 150 | 150 | 150 |
CT | 33 | 33 | 67 | 50 | 25 | 50 | 150 | 150 | 150 | 33 | 0 | 67 | 150 | 150 | 150 |
Cy | 0 | 0 | 67 | 50 | 50 | 0 | 67 | 67 | 67 | 33 | 0 | 67 | 150 | 150 | 150 |
GS | 150 | 150 | 150 | 25 | 0 | 25 | 150 | 150 | 150 | 150 | 150 | 150 | 150 | 150 | 150 |
Ha | 150 | 100 | 150 | 0 | 0 | 25 | 150 | 150 | 150 | 67 | 67 | 67 | 150 | 150 | 150 |
La | 150 | 100 | 150 | 0 | 33 | 67 | 150 | 100 | 150 | 100 | 50 | 150 | 150 | 100 | 150 |
Pl | 150 | 100 | 150 | 33 | 0 | 33 | 150 | 150 | 150 | 150 | 100 | 150 | 150 | 150 | 150 |
Po | 150 | 150 | 150 | 67 | 67 | 67 | 150 | 150 | 150 | 150 | 150 | 150 | 150 | 150 | 150 |
Sp | 100 | 100 | 150 | 0 | 25 | 0 | 67 | 33 | 67 | 100 | 100 | 150 | 33 | 67 | 33 |
Wa | 33 | 33 | 67 | 33 | 0 | 33 | 0 | 33 | 33 | 33 | 0 | 67 | 0 | 33 | 67 |
Среднее | 90 | 75 | 108 | 30 | 23 | 27 | 124 | 119 | 126 | 92 | 72 | 108 | 128 | 129 | 133 |
Проведя изучение расчетных данных, было замечено, что среднее отклонение ожидаемых и фактических результатов на всех типах искажений составляет значительно больше 10% (О.У. — оптимальный уровень), что говорит об очень высоком уровне расхождения объективной и субъективной оценок, что визуально отображено на графиках на рисунке 2.

Рисунок 2 - Графики относительного отклонения по искажениям
Проанализировав графики можно сделать вывод, что наименьшие отклонения наблюдаются по искажению DVF, наибольшие — по искажению STM-FNET. Лучше всего сходятся с субъективными оценками по всем типам искажений результаты работы метрики PSNR, в свою очередь, метрика DISTS обладает наименьшей сходимостью, из чего можно сделать вывод, что PSNR больше подходит для применения в случае интерполяционного увеличения кадров.
Следующим этапом был выбран ряд видео с разрешением 1920x1080 и соответствующий этому ряду набор субъективных оценок из базы MCL-V. Результаты субъективной оценки видео приведены в таблице 7.
Таблица 7 - Результаты субъективной оценки видео из базы данных MCL-V
Наз. | Иск. | |||
264_1 | 264_2 | 264_3 | 264_4 | |
Big Buck Bunny (BB) | 0,759 | 2,603 | 4,931 | 6,672 |
BQ Terrace (BQ) | 0,897 | 3,155 | 5,362 | 6,966 |
Dance Kiss (DK) | 0,352 | 2,593 | 4,611 | 6,630 |
El Fuente B (EB) | 0,704 | 2,852 | 4,500 | 6,426 |
Kimono (KM) | 0,796 | 2,611 | 4,852 | 6,926 |
Seeking (SK) | 0,865 | 3,000 | 4,904 | 6,808 |
Birds in Cage (BC) | 1,103 | 3,431 | 5,345 | 7,069 |
Crowd Run (CR) | 1,052 | 3,155 | 5,379 | 6,914 |
El Fuente A (EA) | 0,296 | 2,870 | 4,667 | 6,815 |
Fox Bird (FB) | 1,615 | 2,885 | 4,346 | 6,577 |
Old Town Cross (OT) | 0,923 | 3,231 | 5,577 | 7,077 |
Tennis (TN) | 0,346 | 2,654 | 4,519 | 6,923 |
Для дальнейшего сравнения была проведена объективная оценка эталонных и искаженных видеофайлов базы данных MCL-V с помощью выбранных ранее метрик (см. табл. 8).
Таблица 8 - Результаты объективной оценки видео из базы данных MCL-V
Иск. | 264_1 | 264_2 | 264_3 | 264_4 | ||||||||
Мет. Наз. | S | P | D | S | P | D | S | P | D | S | P | D |
BB | 0,857 | 33,87 | 0,170 | 0,888 | 35,18 | 0,142 | 0,924 | 37,10 | 0,107 | 0,951 | 39,17 | 0,107 |
BQ | 0,793 | 31,69 | 0,215 | 0,837 | 33,40 | 0,170 | 0,875 | 35,30 | 0,127 | 0,893 | 36,53 | 0,105 |
DK | 0,917 | 37,54 | 0,250 | 0,930 | 39,14 | 0,211 | 0,940 | 40,50 | 0,175 | 0,946 | 41,57 | 0,141 |
EB | 0,796 | 33,15 | 0,222 | 0,821 | 34,21 | 0,201 | 0,841 | 35,00 | 0,183 | 0,862 | 35,95 | 0,167 |
KM | 0,885 | 36,57 | 0,185 | 0,920 | 38,76 | 0,151 | 0,934 | 39,85 | 0,133 | 0,956 | 40,99 | 0,119 |
SK | 0,679 | 29,96 | 0,232 | 0,734 | 31,09 | 0,212 | 0,777 | 32,09 | 0,189 | 0,834 | 33,76 | 0,148 |
BC | 0,902 | 36,66 | 0,202 | 0,925 | 38,82 | 0,163 | 0,944 | 41,08 | 0,129 | 0,954 | 42,48 | 0,111 |
CR | 0,733 | 29,25 | 0,221 | 0,775 | 30,26 | 0,196 | 0,810 | 31,18 | 0,181 | 0,859 | 32,76 | 0,145 |
EA | 0,825 | 32,97 | 0,243 | 0,867 | 34,91 | 0,204 | 0,889 | 36,05 | 0,180 | 0,918 | 37,79 | 0,150 |
FB | 0,894 | 34,33 | 0,193 | 0,901 | 34,87 | 0,162 | 0,827 | 36,79 | 0,130 | 0,950 | 38,91 | 0,100 |
OT | 0,800 | 33,45 | 0,220 | 0,838 | 34,81 | 0,180 | 0,877 | 36,77 | 0,124 | 0,888 | 37,57 | 0,096 |
TN | 0,916 | 37,89 | 0,286 | 0,936 | 39,80 | 0,262 | 0,948 | 41,27 | 0,221 | 0,964 | 43,53 | 0,156 |
Данные, представленные в таблицах 7, 8 принадлежат разным оценочным диапазонам, что затрудняет их сравнение. Для приведения данных к единому диапазону значений необходимо вновь обратиться к таблице 1.
Приведенные данные субъективной и объективной оценки показаны в таблице 9.
Таблица 9 - Приведенные данные субъективной и объективной оценок
Иск. | 264_1 | 264_2 | 264_3 | 264_4 | ||||||||||||
Мет. Наз. | M | S | P | D | M | S | P | D | M | S | P | D | M | S | P | D |
BB | 1 | 3 | 3 | 5 | 2 | 4 | 4 | 5 | 3 | 4 | 4 | 5 | 4 | 5 | 5 | 5 |
BQ | 1 | 2 | 2 | 4 | 2 | 2 | 3 | 5 | 3 | 3 | 4 | 5 | 4 | 4 | 4 | 5 |
DK | 1 | 4 | 4 | 4 | 2 | 5 | 5 | 4 | 3 | 5 | 5 | 5 | 4 | 5 | 5 | 5 |
EА | 1 | 2 | 3 | 4 | 2 | 2 | 3 | 5 | 3 | 3 | 3 | 5 | 4 | 3 | 4 | 5 |
KM | 1 | 4 | 4 | 5 | 2 | 4 | 5 | 5 | 3 | 5 | 5 | 5 | 4 | 5 | 5 | 5 |
SK | 1 | 1 | 1 | 4 | 2 | 1 | 2 | 4 | 3 | 1 | 2 | 5 | 4 | 2 | 3 | 5 |
BC | 1 | 4 | 4 | 5 | 2 | 4 | 5 | 5 | 3 | 5 | 5 | 5 | 4 | 5 | 5 | 5 |
CR | 1 | 1 | 1 | 4 | 2 | 1 | 2 | 5 | 3 | 2 | 2 | 5 | 4 | 3 | 2 | 5 |
EA | 1 | 2 | 2 | 4 | 2 | 3 | 3 | 5 | 3 | 4 | 4 | 5 | 4 | 4 | 4 | 5 |
FB | 1 | 4 | 3 | 5 | 2 | 4 | 3 | 5 | 3 | 2 | 4 | 5 | 4 | 5 | 5 | 5 |
OT | 1 | 2 | 3 | 4 | 2 | 3 | 3 | 5 | 3 | 3 | 4 | 5 | 4 | 4 | 4 | 5 |
TN | 1 | 4 | 4 | 3 | 2 | 5 | 5 | 4 | 3 | 5 | 5 | 4 | 4 | 5 | 5 | 5 |
На рисунке 3 представлены графики, построенные по результатам полученных субъективных и объективных оценок базы данных MCL-V.

Рисунок 3 - Графики сравнения оценок:
а – SSIM; б – PSNR; в – DISTS
Как и в случае с базой данных BVI – FVI, полученные результаты проведенной объективной оценки качества значительно расходятся с субъективными оценками.
Относительные отклонения расхождения между ожидаемым (субъективная оценка) и фактическим (объективная оценка) результатами представлены в таблице 10.
Таблица 10 - Результаты относительного отклонения (среднее по метрике)
Иск. | 264_1 | 264_2 | 264_3 | 264_4 | ||||||||
Мет. Наз. | S от M, % | P от M, % | D от M, % | S от M, % | P от M, % | D от M, % | S от M, % | P от M, % | D от M, % | S от M, % | P от M, % | D от M, % |
BB | 200 | 200 | 400 | 100 | 100 | 150 | 33 | 33 | 67 | 25 | 25 | 25 |
BQ | 100 | 100 | 300 | 0 | 50 | 150 | 0 | 33 | 67 | 0 | 0 | 25 |
DK | 300 | 300 | 300 | 150 | 150 | 100 | 67 | 67 | 67 | 25 | 25 | 25 |
EA | 100 | 200 | 300 | 0 | 50 | 150 | 0 | 0 | 67 | 25 | 0 | 25 |
KM | 300 | 300 | 400 | 100 | 150 | 150 | 67 | 67 | 67 | 25 | 25 | 25 |
SK | 0 | 0 | 300 | 50 | 0 | 100 | 67 | 33 | 67 | 50 | 25 | 25 |
BC | 300 | 300 | 400 | 100 | 150 | 150 | 67 | 67 | 67 | 25 | 25 | 25 |
CR | 0 | 0 | 300 | 50 | 0 | 150 | 33 | 33 | 67 | 25 | 50 | 25 |
EA | 100 | 100 | 300 | 50 | 50 | 150 | 33 | 33 | 67 | 0 | 0 | 25 |
FB | 300 | 200 | 400 | 100 | 50 | 150 | 33 | 33 | 67 | 25 | 25 | 25 |
OT | 100 | 200 | 300 | 50 | 50 | 150 | 0 | 33 | 67 | 0 | 0 | 25 |
TN | 300 | 300 | 200 | 150 | 150 | 100 | 67 | 67 | 33 | 25 | 25 | 25 |
Среднее | 175 | 183 | 325 | 75 | 79 | 138 | 39 | 42 | 64 | 21 | 19 | 25 |
Проведенный анализ расчетных данных, показал, что среднее отклонение ожидаемых и фактических результатов на всех типах искажений составляет более 10% (О.У. — оптимальный уровень), из чего следует, что результаты объективной и субъективной оценки не сходятся. Полученные результаты для наглядности представлены в виде графиков на рисунке 4.

Рисунок 4 - Графики относительного отклонения по искажениям
Проанализировав данный график можно сделать вывод, что наименьшие отклонения наблюдаются по искажению 264_4, наибольшие отклонения наблюдаются по искажению 264_1. Также следует отметить, что результаты метрики SSIM наиболее сходятся с субъективными по всем типам искажений, в свою очередь метрика DISTS обладает наименьшей сходимостью, из чего можно сделать вывод, что SSIM наиболее применима в случае оценки сжатого видеофайла.
3. Заключение
Оценка качества играет значимую роль при поддержании требований к качеству видео, оценке производительности устройств сбора и отображения видео и оценке систем обработки видео на предмет сжатия. Субъективная оценка является единственным надежным методом оценки качества видео, так как конечным потребителем видео является пользователь и, именно, его оценка является определяющей при оценке качества. Однако из-за сложности и трудоемкости реализации субъективной оценки качества, все чаще применяются объективные методы и очень важно соответствие результатов, полученных при применении разных оценок для одного и того же набора кадров.
Экспериментальное сравнение результатов субъективных и объективных оценок качества видео из баз данных BVI-FVI и MCL-V показало значительное расхождение при различных типах искажений.
При анализе и сравнении работы метрик были получены следующие результаты:
1) Для базы данных BVI-FVI:
– лучшую сходимость показала метрика PSNR на всех типах искажений (самая большая сходимость на искажении DVF).
– худшую сходимость показала метрика DISTS на всех типах искажений (самая плохая сходимость на искажении STM-FNET).
Данный результат можно объяснить тем, при интерполяции появляются такие артефакты как: геометрические искажения, искажения контуров, размытия. Данные типы искажений плохо воспринимаются метрикой DISTS, но хорошо метрикой PSNR.
Расхождения субъективных и объективных оценок при интерполяционных искажениях можно объяснить тем, что человеческий глаз лучше реагирует на данный тип искажений, также следует обратить внимание на то, что с внесением дополнительных кадров происходят временные искажения, которые указанные метрики не видят.
2) Для базы данным MCL-V:
– лучшую сходимость показала метрика SSIM на всех типах искажений (самая большая сходимость на искажении 264_4).
– худшую сходимость показала метрика DISTS на всех типах искажений (самая плохая сходимость на искажении 264_1).
Данный результат можно объяснить тем, что при сжатии появляются артефакты сжатия, такие как: блоковые артефакты, потеря градиентов, искажение границ изображений. Данные типы искажений плохо воспринимаются метрикой DISTS, но хорошо метрикой SSIM.
Расхождения субъективных и объективных оценок при искажениях сжатия можно объяснить тем, что человеческий глаз более чувствителен к данным типам искажений, также следует обратить внимание на то, что сжатие может вносить несущественные искажения, которые могут игнорироваться некоторыми метриками, но они видимы для человека.
Получены результаты о сложности получения адекватной оценки качества видео с помощью одной метрики. Для объективной оценки необходим целый набор эталонных метрик, способный оценить изменения в качестве видео, под воздействием различных искажений. Или необходимо решение, альтернативное эталонной оценке качества. Таким решением может стать безэталонная нейросетевая модель.
