Вернуться к статье

Анализ мнения студентов о возможности получения дополнительных доходов в период обучения на основе данных цифровых следов в социальных сетях

Таблица 1 - Этапы подготовки данных для анализа

Этап

Наименование

Содержание

1

Отбор релевантных сообщений (очистка «мусорных» сообщений)

фильтрации выгруженного контента (постов, комментариев) по ключевым словам, использование метода латентно- семантического анализа данных позволило отфильтровать около 90% нерелевантных сообщений

2

Определение тематических сюжетов

В соответствии со смысловым содержанием выгруженного массива сообщений были выделены группы сообщений по тематическим сюжетам

3

Определение тональности сообщений

Присутствие различных лингвистических маркеров, знаков препинания, а также содержание контента позволили выделить три уровня тональности авторов сообщений:

– ¾    негативный,

– ¾    нейтральный,

– ¾    позитивный