Вернуться к статье

ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ЗАПРОСОВ В МНОГОПОЛЬЗОВАТЕЛЬСКИХ ИНФОРМАЦИОННЫХ СИСТЕМАХ

Таблица 1 - Метрики качества методов анализа частых запросов

Метод

Precision

Recall

F1-мера

Noise

Обоснование

Apriori

0,54

0,80

0,64

Высокий (11)

Много нерелевантных itemsets из-за отсутствия тематики

FP-Growth

0,66

0,85

0,74

Средний (7)

Лучше фильтрует шум, но не использует тематическую структуру

Dice + DIC

0,89

0,89

0,89

Низкий (1)

Кластеризация по тематике снижает шум и повышает точность

Q1–Q20