Return to article

СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕТОДОВ КЛАССИФИКАЦИИ ТЕЛЕФОННЫХ ОБРАЩЕНИЙ: КЛАССИЧЕСКИЕ АЛГОРИТМЫ И ТРАНСФОРМЕРНЫЕ МОДЕЛИ

Таблица 2 - Параметры обучения трансформерных моделей моделей

​Параметр

​Значение

​Batch size

4​

​Learning rate

​10-6

Оптимизатор​

​AdamW

Max Sequence Length​

512​

​Epochs

​до 100

​Early Stopping

10 эпох​