Вернуться к статье
СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕТОДОВ КЛАССИФИКАЦИИ ТЕЛЕФОННЫХ ОБРАЩЕНИЙ: КЛАССИЧЕСКИЕ АЛГОРИТМЫ И ТРАНСФОРМЕРНЫЕ МОДЕЛИ
Таблица 2 - Параметры обучения трансформерных моделей моделей
Параметр | Значение |
Batch size | 4 |
Learning rate | 5×10-6 |
Оптимизатор | AdamW |
Max Sequence Length | 512 |
Epochs | до 100 |
Early Stopping | 10 эпох |
