Вернуться к статье

Информационная система на основе искусственного интеллекта для перевода невербального языка в лингвистическую модель

Таблица 1 - Сравнение точности прогнозируемых жестов

Наименование модели искусственного интеллекта

Точность прогнозируемых жестов (accuracy), %

Используемые вычислительные мощности

MViTv2-small-32-2 (обученная нами модель)

60,16

GPU (NVIDIA CUDA)

Swin-large-16-3

48,04

GPU (NVIDIA CUDA)

Swin-large-32-2

54,84

GPU (NVIDIA CUDA)

Swin-large-48-1

55,56

GPU (NVIDIA CUDA)

ResNet-i3d-16-3

32,86

GPU (NVIDIA CUDA)

ResNet-i3d-32-2

38,38

GPU (NVIDIA CUDA)

ResNet-i3d-48-1

43,91

GPU (NVIDIA CUDA)

S3D-32

44,22

CPU

S3D-48

52,28

CPU

S3D-64

55,86

CPU