ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ЗАПРОСОВ В МНОГОПОЛЬЗОВАТЕЛЬСКИХ ИНФОРМАЦИОННЫХ СИСТЕМАХ
Таблица 1 - Сравнение DICE + DIC с алгоритмами Apriori и FP-Growth
Критерий | Apriori | FP-Growth | Dice + DIC (предложенный метод) |
Принцип работы | Генерация кандидатов и проверка поддержки | Построение FP-дерева и извлечение без генерации | Кластеризация по Dice + частотный анализ DIC |
Учет структуры SQL-запросов | Нет | Нет | Да (анализ структуры FROM, SELECT) |
Тематика (кластеризация запросов) | Нет | Нет | Да (кластеризация на основе коэффициента Dice) |
Поддержка сложных запросов | Ограничена | Ограничена | Поддерживается (работает с множеством таблиц) |
Избыточность результатов | Высокая (много нерелевантных itemsets) | Средняя | Низкая (только внутри тематических кластеров) |
Производительность на больших данных | Низкая (из-за генерации всех кандидатов) | Высокая | Средняя (оптимизация через кластеризацию) |
Гибкость настройки | Ограниченная | Ограниченная | Гибкая (порог сходства £ и порог частоты ß настраиваются) |
Применимость к интеллектуальному анализу запросов | Низкая | Средняя | Высокая |
Вывод частых itemset в тематическом контексте | Нет | Нет | Да (разделение по предметным областям, например, S1–S5) |
