Вернуться к статье

Информационная система на основе искусственного интеллекта для перевода невербального языка в лингвистическую модель

Таблица 1 - Сравнение моделей искусственного интеллекта для распознавания действий

Наименование модели

Стратегия сэмплирования кадров

Разрешение

Скелет

top1/acc

top5/acc

FLOPS

MViTv2

16x4x1

224x224

MViTv2-S

81,1

94,7

64G

MViTv2

32x3x1

224x224

MViTv2-B

82,6

95,8

225G

C2D

16x4x1

224x224

ResNet50

74,97

91,91

39G

I3D

32x2x1

224x224

ResNet50

73,47

91,27

43.5G

VideoSwin

32x2x1

224x224

Swin-T

78,90

93,77

88G

VideoSwin

32x2x1

224x224

Swin-S

80,54

94,46

166G

VideoSwin

32x2x1

224x224

Swin-B

80,57

94,49

282G