Вернуться к статье

Анализ мнения населения о качестве регионального образования на основе данных цифровых следов в социальных сетях (на примере Республики Саха (Якутия))

Таблица 1 - Этапы подготовки данных для анализа

Этап

Содержание

Отбор релевантных сообщений по теме

Под релевантным сообщением принимались сообщения (посты, комментарии), в которых авторы высказывали свое мнение, суждение или давали свою субъективную оценку по той или иной проблеме, или ситуации в сфере вопросов проблем и качества образования.

Процесс отбора релевантных сообщений сопровождался исключением мусорных сообщений, т.е. сообщений, не относящихся к исследуемой тематической категории, в которых содержатся вопросы общего содержания, различные информационные сообщения, опросы, частные объявления, бытовые обсуждения, реклама, поздравления, ирония и шутки и т.п.

Определение тематических категорий

В соответствии со смысловым содержанием контента сообщений были определены основные категории проблем граждан, позволяющие выделить системные проблемы и наиболее часто обсуждаемые вопросы

Определение тональности сообщений

Позволяет оценить полярность, степень эмоциональности и отношения автора сообщения (поста/комментария) к сложившейся проблеме, ситуации, факту по исследуемой теме.

Были приняты 3 уровня тональности в сообщениях: позитивный, негативный и нейтральный. Определение тональности текстов базировалось на основе социального контента, а также исходя из лингвистических знаний и эмпирических наблюдений. 

В методике определения сообщений по тональности использовались основные лингвистические и синтаксические признаки: присутствие в тексте сообщения пунктуационных знаков препинания (например, восклицательный знак или несколько восклицательных знаков, вопросительный знак в сочетании с восклицательным знаком или несколько вопросительных знаков, многоточие), написание слов/ текста прописными буквами, а также присутствие в тексте более конкретизирующих тональность слов/словосочетаний лингвистических маркеров (например, «подлость», «бесит», «а когда вообще» – негативная; «лучший», «не пожалел», «плюсы»– позитивная). 

В сообщениях, в которых авторы не выражали ярко своего полярного эмоционального отношения и в основном содержание сообщений включало повествовательное описание сюжета/ проблемы/ факта, были отнесены к группе сообщений с нейтральной тональностью