DATA JOURNALISM AS A TOOL OF INVESTIGATIVE JOURNALISM
DATA JOURNALISM AS A TOOL OF INVESTIGATIVE JOURNALISM
Abstract
The article examines the specifics of data journalism as one of the key tools of investigative journalism. Since databases are an important tool for investigative journalists, the methodology of discourse analysis of media texts of ‘Lenta.ru’, RBC, "Ostorozhno. Media." The results of the analysis showed that journalists often turn to publicly available databases when investigating — court websites, Avito, VKontakte, Yandex, 'SPARK', and the Unified State Register of Legal Entities. But this is only a small part of the databases that are freely available. To date, catalogues of open data are being formed in Russia. The study of catalogues of ‘Hub’, Andrey Dorozhny's data studio, found that data journalism has shown the ability to explain the current processes taking place in and around society without thematic restrictions.
1. Введение
Появление журналистики данных обусловлено ростом объёма доступной информации и необходимостью её обработки и интерпретации. Развитие технологий и появление новых источников данных, таких как социальные сети, интернет-платформы и государственные базы данных, предоставили журналистам доступ к большому количеству информации, которую необходимо было проанализировать и превратить в интересные и информативные истории.
Анализ научной литературы показал, что в трудах по теории и истории журналистики
, , , предпринята попытка присвоить термину «журналистика данных» официальную дефиницию. Применительно к аспекту нашего исследования наиболее ёмкое определение мы находим в статье руководителя программы по журналистике данных в Бирмингемском городском университете Пол Бредшоу. Он утверждает, что данные представляют собой источник или инструмент, необходимый для создания и рассказывания историй .На наш взгляд, использование такого инструмента эффективно по ряду причин: во-первых, способствует повышению достоверности информации — журналисты могут использовать данные из надёжных источников, что снижает вероятность ошибок и искажений в материалах; во-вторых, обеспечивает глубокое понимание проблемы — анализ данных позволяет выявить скрытые аспекты исследуемого вопроса, которые могут быть не очевидны при использовании традиционных методов журналистики; в-третьих, привлекает внимание к важным темам. Кроме того, способствует повышению прозрачности и открытости общества, предоставляя доступ к информации о деятельности государственных органов, компаний и других организаций.
2. Методы и принципы исследования
Цель исследования заключается в исследовании дата-журналистики как цифрового инструмента медиа-дискурса, специфики дата-журналистики как инструмента расследовательской журналистики, включая источники открытых данных, используемые журналистами, а также выявление инновационных формы подачи информации в формируемой информационно-интерактивной среде. Хронологические рамки исследования охватывают период 2010-2024, что позволяет проанализировать и процессы, произошедшие в журналистике данных. В эмпирическом исследовании «Лента.ру», РБК и «Осторожно. Медиа» используется методика дискурс-анализа.
3. Основные результаты
Интернет и открытые данные предоставили современным журналистам возможность собирать необходимую для расследования информацию, не выходя за пределы собственного офиса, но отправляясь бороздить бескрайние просторы интернета. Так, первой ступенью любого современного журналистского расследования можно считать интернет-разведку, или как ее называют «тихую разведку». Одним из методов сбора, анализа и использования информации является OSINT — «разведывательный набор инструментов, включающий в себя такие методы, как поиск, выбор, сбор, анализ информации». Преимущество OSINT для специалистов заключается в том, что все данные, собранные посредством метода, являются открытыми и могут быть проверены совершенно любым человеком и в любое время — метод прозрачен .
Одним из примеров интернет-разведки в современной журналистской практике, на наш взгляд, справедливо считать расследование Ивана Голунова, посвященное сфабрикованному уголовному делу Александра Горохова. Расследование было снято в жанре «скринлайф» и опубликовано на YouTube-канале «Осторожно. Собчак» 27 мая 2024 года. В процессе расследования Голунов использовал открытые источники данных: «СПАРК», ЕГРЮЛ, сайты судов и Фонда социального страхования, Avito, ВКонтакте, Яндекс .
В связи с развитием интернета и возможностью создавать расследования, не прибегая к традиционным методам поиска информации, появляются и скептические мнения. Так Ник Девис вводит термин «миксерная журналистика»: «Коллеги просто рыскают по интернету в поисках материалов, из которых, как в миксере, «сбивают» свои публикации, будь они важными или тривиальными, истинными или фальшивыми». А. А. Гуляев предлагает собственную дефиницию — «нечеловеческая журналистика»: «Это журналистика, в которой очень часто отсутствуют одушевленные источники информации, то есть источники, имеющие как свои недостатки, так и неоспоримые достоинства, позволяющие оценить информацию с точки зрения надежности и достоверности» .
На наш взгляд, справедливым будет возразить: разумеется, новый мир не отменяет постулатов старого мира, однако диктует новые правила. Как мобильный телефон со временем стал дополнительным человеческим органом, так интернет заменил извилину. На сегодняшний день журналистское расследование практически невозможно без использования интернета и вполне может быть выполнено, не выходя в поле — это закономерно, объемы данных, ежедневно производимых пользователями, приобрели монструозные размеры, человечество перестало с ними справляться без помощи «машины».
Другой вопрос, любую ли информацию можно найти в интернете и что делать с закрытой информацией? Открытые данные, используемые журналистами в своих расследованиях, дают читателям важное преимущество — позволяют в случае недоверия проверить опубликованную информацию. Исследователь Д. В. Неренц отмечает, что российские журналисты всё больше предпочитают работу только с открытыми данными: «В последнее время в России наблюдается тенденция ухода от работы с закрытой информацией» . Однако такого принципа российские практики придерживаются не всегда.
В 2019 году российское новостное интернет-издание «Лента.ру» запустило масштабный расследовательский проект «Россия под наркотиками», посвященный даркнет-рынку «Гидра». Материал поделен на три части, каждая из которых раскрывает различные аспекты наркоторговли в России. Анализ текста показал, что в своем расследовании издание крайне редко ссылается на конкретные источники информации, но прибегает к формулировкам вида «по словам источников» 43 раза.
В первой части журналисты чаще всего ссылаются на «бывших сотрудников силовых структур», «источники, близкие к российским силовым структурам», «источники, знакомые с маршрутами контрабандных поставок наркотиков», также появляются ссылки на администраторов даркнет-рынков — они представлены их никами в «теневом интернете» («Orange», «Existentia»).
Во второй части расследования появляются «профессиональные» монологи людей, имеющих отношение к торговле наркотиками через интернет: «Монолог складмена», «Монолог гровера», «Монолог физика», «Монолог владельца магазина на Hydra» и прочие.
В третьей части расследования журналисты представили личные истории «закладчиков», в этой части материала в квадратных скобках появляется уточнение «имя изменено». Помимо прочего в материале присутствуют не действительные на сегодняшний день ссылки на различные источники в интернете .
Такой подход к работе с источниками информации обусловлен спецификой темы и отсутствием исчерпывающих данных в открытом доступе. Более того, весомая часть расследования «Ленты.ру» пришлась на скрытый сегмент интернета, доступный только посредством специализированных браузеров. Таким образом, практически все расследование было построено на информации, недоступной для проверки обычными пользователями.
Примером же открытости информации, на наш взгляд, послужит одно из экономических расследований РБК «Расследование РБК: кто зарабатывает на реконструкции Москвы», опубликованное 19 октября 2015 года. Проанализировав текст материала, мы выделили три вида ссылок, используемых в статье: ссылки на расследования и статьи РБК, ссылки на сторонние ресурсы, ссылки на базы данных.
Мы выяснили, что в своем расследовании РБК 4 раза ссылалось на собственные материалы, в 13 случаях ссылки вели на сторонние ресурсы (две из них оказались не действительными на сегодняшний день), дважды журналисты использовали базы данных в качестве источников информации — «СПАРК» (spark-interfax.ru) и zakupki.gov.ru. Кроме того, одна инфографика была основа на данных сводного сметного расчета на комплексное благоустройство Ленинградского проспекта .
Как мы упоминали выше, журналисты-расследователи могут использовать информацию из открытых источников информации, таких как: «СПАРК», ЕГРЮЛ, сайты судов, сайт Фонда социального страхования, Avito, ВКонтакте, Яндекс, zakupki.gov.ru. Но это лишь малая часть баз данных, находящихся в свободном доступе. На сегодняшний день в России создаются каталоги открытых данных.
Один из таких каталогов был создан дата-экспертом Андреем Дорожным, он доступен на сайте «Дата-студия Андрея Дорожного» dorozhnij.com. Каталог включает более 300 источников открытых данных для бизнеса и медиа. Все источники можно отфильтровать по типу и уровню. Так, если мы выберем уровень «Каталог», то перейдем к документу, в котором собраны сайты, на которых можно найти статистику, результаты исследований и опросов. Сайты в документе поделены по следующим категориям: государственная статистика (в частности в данную категорию входят сайты Росстата, ФСИН, ФСРАР, Роспотребнадзора, Министерства туризма и прочие), статистика компаний (в частности Яндекс-исследования, Сбер-данные, Центробанк и прочие), опросы (ВЦИОМ, ТАСС, Левада-центр и Фонд общественного мнения), исследования и мониторинги университетов (Высшая школа экономики и Паб-мед), дополняется коллективно (COVID-data, Google Trends, Tinkoff-data, ЕМИС, Дом.рф и другие) .
Еще одним примером каталога баз данных является сайт hubofdata.ru, созданный АНО «Информационная культура». Хаб — это хранилище открытых данных, здесь собираются и публикуются данные государственных учреждений, НКО и коммерческих компаний. На сегодняшний день портал насчитывает 8215 массивов данных от 35 организаций. Все данные на сайте поделены на группы, в каждой группе находятся пакеты данных. Самой многочисленной группой являются Архивы государственных сайтов, насчитывающие 1807 массивов данных. Для удобной навигации по сайту предусмотрена функция фильтра — все массивы можно отфильтровать по организациям, группам, тегам, форматам и лицензиям. Так, если мы выберем организацию «Фонд общественное мнение» (ФОМ), то перейдем к странице, на которой представлено 415 массивов данных — все они демонстрируют результаты опросов ФОМ .
Базы данных являются важным инструментом для журналистов-расследователей. Журналисты могут использовать их для поиска информации о людях, компаниях, событиях. Это включает в себя поиск по именам, адресам, номерам телефонов, финансовым данным.
4. Заключение
Таким образом, анализ больших объёмов данных показал, что журналистика данных предоставила журналистам-расследователям возможность комбинировать данные из различных источников, чтобы создать более полную картину событий и тем самым представить читателям всесторонне проработанную историю. Журналистика данных демонстрирует высокий потенциал в удержании внимания аудитории посредством сочетания аналитической глубины исследования, визуальной привлекательности через инфографику, нарративного подхода и интерактивности в ряде случаев.
