Вернуться к статье
Информационная система на основе искусственного интеллекта для перевода невербального языка в лингвистическую модель
Таблица 1 - Сравнение моделей искусственного интеллекта для распознавания действий
Наименование модели | Стратегия сэмплирования кадров | Разрешение | Скелет | top1/acc | top5/acc | FLOPS |
MViTv2 | 16x4x1 | 224x224 | MViTv2-S | 81,1 | 94,7 | 64G |
MViTv2 | 32x3x1 | 224x224 | MViTv2-B | 82,6 | 95,8 | 225G |
C2D | 16x4x1 | 224x224 | ResNet50 | 74,97 | 91,91 | 39G |
I3D | 32x2x1 | 224x224 | ResNet50 | 73,47 | 91,27 | 43.5G |
VideoSwin | 32x2x1 | 224x224 | Swin-T | 78,90 | 93,77 | 88G |
VideoSwin | 32x2x1 | 224x224 | Swin-S | 80,54 | 94,46 | 166G |
VideoSwin | 32x2x1 | 224x224 | Swin-B | 80,57 | 94,49 | 282G |