Return to article

ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ЗАПРОСОВ В МНОГОПОЛЬЗОВАТЕЛЬСКИХ ИНФОРМАЦИОННЫХ СИСТЕМАХ

Таблица 1 - Сравнение DICE + DIC с алгоритмами Apriori и FP-Growth

Критерий

Apriori

FP-Growth

Dice + DIC (предложенный метод)

Принцип работы

Генерация кандидатов и проверка поддержки

Построение FP-дерева и извлечение без генерации

Кластеризация по Dice + частотный анализ DIC

Учет структуры SQL-запросов

Нет

Нет

Да (анализ структуры FROM, SELECT)

Тематика (кластеризация запросов)

Нет

Нет

Да (кластеризация на основе коэффициента Dice)

Поддержка сложных запросов

Ограничена

Ограничена

Поддерживается (работает с множеством таблиц)

Избыточность результатов

Высокая (много нерелевантных itemsets)

Средняя

Низкая (только внутри тематических кластеров)

Производительность на больших данных

Низкая (из-за генерации всех кандидатов)

Высокая

Средняя (оптимизация через кластеризацию)

Гибкость настройки

Ограниченная

Ограниченная

Гибкая (порог сходства £ и порог частоты ß настраиваются)

Применимость к интеллектуальному анализу запросов

Низкая

Средняя

Высокая

Вывод частых itemset в тематическом контексте

Нет

Нет

Да (разделение по предметным областям, например, S1–S5)