ИССЛЕДОВАНИЕ СОЦИАЛЬНЫХ СЕТЕЙ ИНТЕРНЕТ НА ПРЕДМЕТ ВЫЯВЛЕНИЯ СОПУТСТВУЮЩИХ ИНТЕРЕСОВ ЛИЦ, СКЛОННЫХ К НАРКОМАНИИ

Research article
Issue: № 6 (6), 2012
Published:
2012/11/30
PDF

ИССЛЕДОВАНИЕ СОЦИАЛЬНЫХ СЕТЕЙ ИНТЕРНЕТ НА ПРЕДМЕТ ВЫЯВЛЕНИЯ СОПУТСТВУЮЩИХ ИНТЕРЕСОВ ЛИЦ, СКЛОННЫХ К НАРКОМАНИИ

Научная статья

Митягин С.А.1, Якушев А.В.2, Бухановский А.В.3

1м.н.с., НИИ Наукоемких компьютерных технологий НИУ Информационных технологий механики и оптики, 197101, Санкт-Петербург, пр. Кронверкский, д.49 г. Санкт-Петербург, Россия 

2м.н.с., НИИ Наукоемких компьютерных технологий, аспирант НИУ Информационных технологий механики и оптики, 197101, Санкт-Петербург, пр. Кронверкский, д.49 г. Санкт-Петербург, Россия.

3д.т.н., проф., директор НИИ Наукоемких компьютерных технологий НИУ Информационных технологий механики и оптики, 197101, Санкт-Петербург, пр. Кронверкский, д.49 г. Санкт-Петербург, Россия.

СПб ГУП «Санкт-Петербургский информационно-аналитический центр», Санкт-Петербург, ул. Черняховского, д. 59.

Аннотация

Рассматривается задача исследования текстов пользователей социальной сети LiveJournal на предмет содержащихся в них упоминаниях об опыте приема наркотиков. Обход пользователей социальной сети осуществляется по технологии краулинга, что позволяет восстанавливать социальную структуру личностных связей между пользователями, а также выявлять сообщества пользователей, предположительно склонных к потреблению наркотиков. В рассмотренном подходе исследуется понятие субкультуры потребителей наркотиков, проявляющейся в текстах пользователей. Развитием данного подхода является анализ сопутствующих интересов, на основе которого решается обратная задача выявления латентных потребителей наркотиков.

Ключевые слова и выражения: социальные сети, наркомания, краулинг, мониторинг интересов.

Key words and phrases: social networks, drug addiction, interest monitoring.

Введение

Развитие технологий web 2.0 и в частности социальных сетей интернета способствуют с одной стороны организации социальных коммуникаций между людьми, а с другой реализуют базовые социальные потребности. Этим объясняется их успешное развитие в последнее время. С другой же стороны, как отмечается в ряде научных трудов [3], онлайновые сети помимо выполнения функций поддержки общения, обмена мнениями и получения информации их членами все чаще становятся объектами и средствами информационного управления и ареной информационного противоборства.

Являясь основой практически неограниченного общения, социальные сети способствуют распространению информации самого разного рода, в частности мнений, сообщений, наблюдений, что позволяет рассматривать социальные сети как некий срез эмоционально-психологического состояния общества на момент наблюдения.

Отличительной чертой онлайновых социальных сетей является их динамическая структура, что способствует образованию локальных групп пользователей с близкими мнениями и интересами. Принимая во внимание определенную изменчивость мнений пользователей, наличие сообществ пользователей позволяет считать социальные сети инструментом информационного влияния.

Предметной областью данного исследования является изучение распространение информации о наркотиках и наркомании в социальных сетях. Распространение наркомании во многом зависит от общественного отношения к данному явлению, а ее распространение происходит в узких кругах поощряющих подобное поведение. Распространение потребления наркотиков сопровождается образованием субкультурных сообществ, поощряющих поведение, связанное с приемом наркотиков. Таким образом, само распространение наркомании и потребления наркотиков близко связано с вовлечением общества в наркокультуру, а наркоиммунитет территории связан со способностью индивидуумов противостоять восприятию чужих мнений и взглядов.

Таким образом, социальные сети являются важнейшим источником информации о наркоситуации на территории. Вместе с тем отмечается [3] острый дефицит методов и алгоритмов сетевого анализа контента социальных сетей и их систематического изложения, пригодных для современных прикладных исследований. Учитывая тот факт, что проблема наркомании является острой практически для всех регионов Российской Федерации и необходимость работ в данной области регламентирована соответствующими нормативно-правовыми актами, в частности в стратегии национальной безопасности [1] наркомания обозначена как одна из угроз национальной безопасности, задача исследования социальных сетей на предмет оценивания наркоситуации является особенно актуальной в настоящее время.

1. Социальные сети как объект социологического исследования

В литературе [3, 4, 8] под социальной сетью понимается социальная структура, состоящая из множества агентов и определенного на нем множества отношений. Формально социальная сеть представляет собой граф G(N, E), в котором N - конечное множество вершин-агентов и E - множество ребер, отражающих взаимодействие агентов.

Говоря о социальной сети как об объекте исследования, следует выделить три характеристики сети, подлежащие исследованию:

1. характеристика агентов социальной сети, определяема на основе информации, публикуемой на странице агента. В данной работе рассматривается такая характеристика агентов социальной сети, как вовлеченность в наркокультуру, которая оценивается по содержанию публикуемой информации.

Исследуя динамику распространения наркокультуры, рассматриваются такие характеристики агентов как восприимчивость чужому мнению, которое зависит от окружения агента.

2. характеристика связей между агентами, определяет окружение отдельных агентов, локальные характеристики сети от которых зависит скорость передачи информации между агентами и восприимчивость отдельных агентов и их групп.

3. офлайновые характеристики фрагментов сети, имеют существенное значение в задаче исследования наркоситуации. Среди них выделяют пол, возраст и географическое положение агентов. Так агенты, находящиеся в географической близости (проживающие в одном районе), могут иметь близкие мнения и взгляды, не состоя в онлайновых отношениях социальной сети.

В литературе [3] отмечается, что распространение информации в социальных сетях способствует образованию сообществ пользователей, придерживающихся схожих взглядов. Это приводит к тому, что пользователи, входящие в сообщества становятся подверженными и восприимчивыми для воздействия общих тенденций данного сообщества.

 Рис. 1. Базовые понятия о динамики мнений агентов.

Отмечается [3] наличие первичных и вторичных мнений агентов. Первичными являются мнения пользователей, согласно которым они идентифицируют себя в сети и могут войти в то или иное сообщество или мнения и взгляды агента до вступления в сообщества. Первичные мнения агентов наиболее близки к личностным характеристикам индивидуума. К вторичным мнениям агента относятся мнения, навязанные сообществами. Усредненное мнение сообщества включает взгляды, присущие большинству (или критической массе) пользователей каждого отдельного сообщества, и навязываемые другим членам данного сообщества, изначально не придерживающихся этих взглядов.

На основе схемы, представленной на рис. 1, понятие восприимчивости агентов оценивается как разница между усредненным мнением окружения и мнением агента.

Таким образом, наркокультура может развиваться в сообществах не только напрямую, а как нечто сопутствующее интересам данного сообщества. По этой причине рассматриваются две взаимосвязанные задачи исследования социальной сети на предмет распространения наркоситуации – это выявление пользователей, вероятно вовлеченных незаконный оборот наркотиков и выявление интересов агентов и тематик времяпровождения, сопутствующих потреблению наркотиков.

2. Метод исследования социальной сети  

Исследование социальных сетей позволяет получить еще одни важный срез знаний о проблеме наркотизации населения помимо общепринятых на данный момент социологических исследований методами опроса населения и анализа данных официальной государственной статистики государственной власти, органов здравоохранения и органов наркоконтроля.

В данной работе осуществлено исследование фрагмента социальной сети LiveJournal на основе технологии краулинга, заключающейся в обходе социальной сети по ссылкам между страницами пользователей. Данный подход позволяет не только осуществлять оценивание агентов социальной сети по публикуемой информации, но также восстанавливать структуру отношений агентов.

Алгоритм краулинга социальной сети можно описать следующим образом:

1. Определение стартовых страниц пользователей, мнения и взгляды которых соответствуют заданной тематики – потребления наркотиков.

2. Переход по ссылкам на страницы связанных пользователей пользователей.

3. Оценивание связанных пользователей на основе алгоритмов интеллектуального исследования текстов на предмет выявления искомых мнений и взглядов.

3.1. в случае отсутствия искомых мнений обход прекращается;

3.2. в противном случае алгоритм повторяется с шага №2.

Общая архитектура краулера представлена на рис. 2.

Рис. 2. Архитектура краулинга.

Говоря об анализе информации узлов социальной сети, следует отметить, что сленг индивидуумов, потребляющих наркотики может в различной степени отличаться от общепринятых норм. С другой стороны сообщества потребителей наркотиков в большой степени закрыты в силу их криминального характера. По этой причине с целью выявления пользователей предположительно имеющих опыт потребления наркотиков предлагается использовать базу знаний сигнальных слов. Среди сигнальных слов рассматриваются: сленг потребителей и распространителей наркотиков, специальные термины наркологии, сопутствующие слова и термины, имеющие двойной смысл применительно к тематике наркомании.

Построение базы знаний необходимо для учета характерных выражений, а также сочетаний слов, которые по отдельности не относятся к сленгу наркокультуры. Схема базы знаний приведена на рис. 3. Характерные (сигнальные) слова разделены на три группы (A, B, C), по степени важности в обобщенной оценке.  Таким образом, критерий оценки текста по содержанию сигнальных слов имеет вид

,                                                               (1)

, , ,         (2)

где  − число отдельных слов соответствующей группы в тексте;  - вес слова соответствующей группы;  − число отдельных слов группы B в тексте;  − число слов группы B, образовавших устойчивые сочетания в тексте;  − количество слов группы B, встретившихся вместе с часто употребляемыми словами в тексте.

 

Рис. 3. Схема базы знаний ключевых слов.

На основе описанного алгоритма было осуществлено исследование фрагмента социальной сети LiveJournal. Обобщенные характеристики исследования приведены в табл.1

Таблица 1. Обобщенные характеристики исследования социально сети LiveJournal.

Свойство

Результат

Размер словаря 450 (слов), 1500 (фраз)
Размер фрагмента сети 785107 (узлов)
Количество пользователей, в текстах которых выявлена тематика наркомании 32899 (узлов)
Количество различных тематик и интересов пользователей фрагмента сети 192709

3. Наркомания как явление в социальной сети

Рассмотрев классификацию агентов на основе критерия вовлеченности в наркокультуру (2), были выделены характерные группы пользователей социальной сети: лица, не подверженные наркотизации (I); группа риска   − лица, находящиеся в окружении, лояльном к наркотикам;  − лица, вовлеченные в наркокультуру и хорошо осведомленные в области потребления наркотиков и часто употребляющие жаргон наркоманов;  − лица, вовлеченные в наркопотребление, имеющие опыт приема наркотиков лично, либо кого-то из близкого окружения;  − лица скрыто или открыто пропагандирующие наркотики и соответствующий образ жизни. Оценка численности и состава данных групп осуществляется на основе анализа рангового распределения величины критерия (2).

Полученный массив узлов (страниц) социальной сети в большей степени содержит узлы, тексты которых содержат эпизодические упоминания о наркотиках и наркомании. Анализ сигнальных слов, выявленных в текстах, показал наличие характерных групп слов, определяющих вовлеченность лиц в наркокультуру, см. рис. 4. Полученное соотношение слов по критерию принадлежности жаргону свидетельствует о наличии центральной группы узлов, в текстах которых в равной мере представлены слова, описывающие приготовление, способ приема и производимый эффект.

 

                                                                        а)                                                                 б)

Рис. 4. Распределение тематик сигнальных слов по: а) тематике; б) принадлежности к жаргону.

Полученные результаты анализа агентов социальной сети LiveJournal по публикуемой информации свидетельствуют о наличии пользователей, которые регулярно публикуют информацию о наркотиках и способах их приема, использую в большей степени жаргон распространителей и потребителей наркотиков. При этом описанию последствий приема наркотиков внимания уделяется значительно меньше. Тем самым следует сделать вывод о наличии пользователей социальной сети, проводящих пропаганду наркотиков и подобного образа жизни.

4. Сопутствующие интересы вероятных потребителей наркотиков

Как отмечается рядом исследователей [2, 7] распространение наркотиков осуществляется преимущественно индивидуально, при личном контакте. При этом, говоря о первичном приеме потребление наркотиков не является основной тематикой времяпровождения индивидуумов и проявляется как нечто сопутствующее. Как было отмечено выше, общение в социальных сетях способствует образованию сообществ пользователей, придерживающихся схожих взглядов. Это приводит к тому, что пользователи, входящие в такие сообщества становятся подверженными и восприимчивыми для воздействия общих тенденций данного сообщества.

Исходя из всего вышесказанного, важной задачей исследования социальных сетей является определение интересов пользователей, которые сопутствуют потреблению наркотиков и, в дальнейшем, заболеванию наркоманией. Поскольку распространение наркомании во многом зависит от общественного отношения к данному явлению, а ее распространение происходит в узких кругах поощряющих подобное поведение. Таким образом, вовлечение агента в сообщества по сходным интересам может способствовать вовлечению пользователя в оборот и потребление наркотиков, если такое поведение поощряется в данном сообществе.

Задача поиска сопутствующих интересов связана с выявлением наиболее характерных интересов пользователей, предположительно подверженных наркомании. Такими интересами будем считать интересы, встречающиеся у пользователей, вовлеченных в наркокультуру чаще, чем у пользователей всего фрагмента сети. Решение этой задачи позволяет выявить латентных потребителей наркотиков и обозначить границы группы риска.

Рассматривая такую характеристику каждого интереса a как количество пользователей, интересующихся данной темой u(a). Мерой сходства двух интересов a и b можно считать

                                                         (3)

Мера сходства (3) может быть применена для кластеризации всех интересов пользователей. Используя иерархический алгоритм кластеризации интересов пользователей было получено дерево кластеров интересов, сопутствующих потребителям наркотиков, см. рис. 5.

 

Рис. 5. Иерархия интересов пользователей, предположительно потребляющих наркотики.

На основе полученного дерева интересов можно сделать важные выводы как о самом характере пользователей социальной сети и их эмоционально-психологическом состоянии, так и  составе интересов, сопутствующих наркотизации.

Так наличие кластера политики, содержащего преимущественно негативную оценку наблюдаемых пользователями процессов, говорит об общей определенной неудовлетворенности общества, что согласуется с понятием наркоиммунитета территории [5, 6].

Следует также отметить сравнительно небольшие размеры кластеров личностного развития и активного здорового образа жизни.

Наибольший по величине кластер содержит интересы, касающиеся отдыха и разного рода совместного времяпровождения, что подтверждает гипотезу о распространении и первичном приеме наркотиков как сопутствующего явления общению по другим тематикам.

Среди коллективного отдыха наблюдается кластер с алкоголем, что свидетельствует об упоминании алкоголя при описании пользователями разного рода мероприятий.

Исследуя литературные и культурные пристрастия пользователей, следует выделить большой процент альтернативной и нетрадиционной литературы.

Заключение

Полученные результаты позволяют заключить, что исследование социальных сетей интернета позволяет получить новый срез информации о явлении, что позволяет более обосновано осуществлять борьбу с таким негативным явлением как наркомания. Данные мониторинга социальных сетей подтверждают экспертное предположение о структуре сети распространителей наркотических веществ о пропорциональном соотношении между распространителями и покупателями наркотиков, а также о наличии группы риска, в лексиконе которых часто применяются термины наркокультуры, используемое в построении прогнозной модели наркотизации населения. Также данные мониторинга социальных сетей подтверждают оценку латентности величины потребителей «легких» наркотиков.

Следует отметить, что полученные результаты являются смещенными и характеризуют определенную часть общества, активно пользующихся социальными сетями интернета, однако, как показали исследования, результаты мониторинга социальных сетей могут эффективно применяться в задачах моделирования и исследования скрытых социальных процессов, таких как наркомания. Так следует отметить, что среди выявленных предположительных потребителей наркотиков не могут быть представлены потребители тяжелых наркотиков. Поскольку лица, имеющие тяжелую форму физической зависимости, не используют социальные сети. По этой причине исследования социальных сетей не могут применяться для оценивания наркоситуации без альтернативных и традиционных подходов, но существенно расширяют инструментарий социологического анализа.

С другой стороны, использование данных социальных сетей в моделировании позволяет поставить и разрешить ряд сопутствующих задач, таких как насколько распространение наркокультуру в социальных сетях соответствует распространению наркокультуры в обществе; по какому сценарию может осуществляться наркотизация населения при условии, что скорость распространения информации в обществе эквивалентен скорости в социальных сетях и спровоцирует ли дальнейшее развитие социальных сетей эпидемию наркомании.

Работа выполнена в рамках реализации постановлений № 220 и № 218 Правительства Российской Федерации при поддержке ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2012 годы» (проект № 07.517.11.4042 от 29 сентября2011 г., шифр 2011-1.4-514-048-066)

Список литературы / References

1. Указ Президента РФ от 12.05.2009 № 537 «Об утверждении Стратегии Национальной безопасности Российской Федерации до 2020 года».

2. Боев Б.В., Салман Э.Р., Барашкова Т.А., Баранчиков А.В. Методология математического моделирования процессов наркотизации молодежи //Социология. 2001. №13. С. 76-96.

3. Губанов Д.А., Новиков Д.А, Чхаришвили А.Г. Социальные сети: модели информационного влияния, управления и противоборства / Под ред. чл.-корр. РАН Д.А. Новикова. – М. Издательство физико-математической литературы, 2010. – 228 с. (ISBN 9785-94052-194-5)

4. Иванов С.В., Колыхматов И.И., Бухановский А.В. Моделирование эволюционной динамики ВИЧ. // Труды XV Всероссийской научно-методической конференции «Телематика-2008», том 1, 2008. – С. 103-104.

5. Митягин С.А., Якушев А.В., Бухановский А.В Имитационное моделирование наркотизации населения по данным мониторинга социальных сетей. // Современные исследования социальных проблем, №2 (10), 2012. – С. 133-151. (ISSN 2077-1770)

6. Стародубов В.И., Татаркин А.И. Влияние наркомании на социально-экономические развитие общества. УрО РАН, 2006. – 381 с.

7. Фридман Л.С., Флеминг Л.Ф., Робертс Д.Х., Хайман С.Е. Наркология: Пер. с англ. – 2-е изд. испр. – М.; СПб.; “Издательство БИНОМ” – “Невский диалект”, 2000. – 320 с.

8. M. E. J. Newman (2003). The structure and function of complex networks, SIAM Review 45, 167-256

9. Sloot, P.M.A., Ivanov, S.V., Boukhanovsky, A.V., van de Vijver, D.A.M.C., Boucher, C.A.B.: Stochastic simulation of HIV population dynamics through complex network modelling. Int. J. Comput. Math. 85(8), 1175–1187 (2008)

 

References