megaputer-logo
  • Продукты
  • Решения
  • Обучение
  • Партнерство
  • О компании
СКАЧАТЬ

Платформа PolyAnalyst помогает ученым Вятского государственного университета находить жертв супружеского насилия

20 января 2020

Вятский государственный университет в составе Университетского консорциума исследователей больших данных реализует проект по поиску жертв супружеского насилия в сети Интернет. Техническое сопровождение проекта оказывают специалисты Томского государственного университета. Исследование проводится с поддержкой индустриального партнера Консорциума – российской компанией «Мегапьютер Интеллидженс», предоставившей инструменты для сбора данных в онлайн пространстве посредством парсинга, а также коллекции инструментов для проведения статистического анализа и наборы алгоритмов машинного обучения,  собранные в аналитической платформе PolyAnalyst.

Проблема супружеского насилия особенно обострилась в условиях глобальной пандемии COVID-19, когда повседневная жизнь людей резко изменилась. Эти изменения принесли с собой множество новых вызовов, включая физические и психологические риски для здоровья, изоляцию и одиночество, закрытие  школ и предприятий, а также потерю рабочих мест и как следствие экономическую уязвимость. Жертвами супружеского насилия становятся все больше людей как в России, так и по всему миру.

«Раскрытие информации о супружеском насилии и опыте обращения за помощью является затруднительным, и процент жертв, которые искали поддержку у профессиональных специалистов, полиции и медицинских работников, остается крайне низким. Кроме того, эксперты констатируют, что 56% жертв домашнего насилия, обратившихся в правоохранительные органы, а также в психологические и юридические службы, не удовлетворены работой этих организаций. Столкнувшиеся с насилием предпочитают искать механизмы помощи в интернет-пространстве, где действуют онлайн-сообщества их поддержки. Причины обращения к таким ресурсам кроются в желании людей убедиться в типичности или атипичности собственной ситуации, получить возможный вектор ее разрешения с сохранением конфиденциальности».

Екатерина Митягина 
Проректор по развитию на основе анализа данных ВятГУ

Исследование онлайн-обращений и комментариев к ним кафедрой социальной работы и молодежной политики ВятГУ стало дополнительным источником информации о специфике супружеского насилия, его видах и формах, масштабах распространения.

Чаще всего для поиска ответов на вопросы о насилии люди обращаются к социальным сетям. Как показало исследование, это 82% от всех интернет-сообщений о насилии: vk.com (63%), instagram.com (7.8%), odnoklassniki.ru (6.7%), facebook.com (4.5%) и др. Значительно меньшее количество сообщений встречается в микроблогах (twitter.com), интернет-СМИ (skoronovosti.ru, kavkaz-uzel.eu и др.), форумах (woman.ru и др.), видео (youtube.com) и блогах (zen.yandex.ru) – совокупный процент составляет 9.8%, из которых микроблоги (7.2%), интернет-СМИ (5.3%), видео (1.3%) и форумы (2%). Совокупная доля тематических порталов (otvet.mail.ru), мессенджеров (telegram.org) и сайтов отзывов (otzyvru.com) занимает менее 1%. (таблица 1).

Таблица 1 — Основные источники данных.

Тип источника

Пример источника

Количество сообщений

Процент

Социальные сети

vk.com, instagram.com, odnoklassniki.ru, facebook.com

22,638

82.0 

Микроблоги

twitter.com

1,994

7.2

Интернет-СМИ

skoronovosti.ru, kavkaz-uzel.eu

1,45

5.3

Форумы

woman.ru

563

2.0

Видео

youtube.com

356

1.3

Блоги

zen.yandex.ru

334

1.2

Тематические порталы

otvet.mail.ru

180

0.7

Мессенджеры

telegram.org

61

0.2

Сбор и обработка данных проекта осуществляется в рамках Центра коллективного пользования платформой PolyAnalyst на базе суперкомпьютера Томского государственного университета СКИФ Cyberia. Евгений Петров, сотрудник Центра прикладного анализа больших данных ТГУ, оказывающий техническое сопровождение проекта при работе с платформой PolyAnalyst заявляет, что «наиболее сложным этапом в работе с данными является их структурирование. Массивы должны быть подвергнуты серьезной проверке и качественному анализу, что требует значительных вычислительных ресурсов. Кроме того, в интернете встречается все больше сообщений, поддерживающих и оправдывающих насилие. Ориентация только на отрицательную тональность становится не единственным фактором, указывающим на релевантность сообщения» (рисунок 1).

Тональность связей в сообщениях о супружеском насилии

Рисунок 1 — Тональность связей в сообщениях о супружеском насилии.

Основной формой насилия в сообщениях является физическое насилие (81%), на втором месте – психологическое (15%). Сексуальные (3.5%) и экономические (0.5%) формы насилия составляют менее 5% от всех релевантных сообщений. В сознании пользователей насилие ассоциируется, прежде всего, с применением физической силы. При этом женщины чаще являются жертвами насилия (72%). Если жертвой выступает мужчина, то чаще речь идет о смешанной форме насилия, когда женщина совершила деяние в ответ на мужское насилие.

Функция извлечения ключевых слов при помощи платформы PolyAnalyst позволила расширить перечень субъектов насилия, которыми, помимо мужа и жены, также являются дети и старшее поколение, проживающие в семьях. Побои, травмы, синяки, оскорбления являются постоянными спутниками насильственных действий по отношению ко всем членам семьи (рисунок 2).

Рисунок 2 — Ключевые слова в сообщениях, релевантных теме супружеского насилия.

Схема, представленная на рисунке 3, иллюстрирующая ключевые слова, наиболее часто встречающиеся с понятием жертва, наглядно показывает «путь» между «первым звоночком» и проявлением насилия, позволяет уточнить «пусковые» механизмы и «роль» агрессора, случая, отношений в семье в ситуации семейного насилия. (рисунок 3).

Рисунок 3 — Ключевые слова, связанные с понятием «жертва насилия».

Ученым удалось не только предложить теоретические механизмы анализа, но и применить открывшиеся возможности на практике. Из всего массива сообщений о насилии были выделены посылы, связанные с просьбами реальных жертв о помощи: помогите, спасите, караул, поддержите, прошу совета, прошу помощи, больше не могу терпеть (рисунок 4).

Рисунок 4 — База данных, содержащих сообщения с просьбой о помощи.

На основе данных сообщений кировский Центр социально-психологической помощи  получил возможность улучшить работу и настроить чат-бот «Умный помощник «Лада»» (рисунок 5), который, благодаря возможностям машинного обучения, учится определять форму и вид насилия по обращению, а также адресует жертв к соответствующим специалистам.

Директор центра, кандидат психологических наук Нина Ершова считает, что самым важным в работе с жертвами насилия, особенно в отдаленных районах, является «создание условий для оказания комплексной онлайн-помощи на межведомственной и междисциплинарной основе. В этой ситуации апробированный постоянно действующий инструмент, которым является Умный помощник «Лада», просто незаменим».

Рисунок 5 — Умный помощник «Лада» в ситуации супружеского насилия.

Ученые продолжают статистическую обработку полученного корпуса сообщений. В ближайших планах представить типичные портреты жертвы и агрессора. К имеющимся данным планируется применить алгоритмы машинного обучения, что позволит проводить автоматизированный поиск фактов насилия, их классификацию и профилактику.

«Мы очень рады, что наша платформа PolyAnalyst помогает в исследовании и в борьбе со столь острой социальной проблемой, как семейное насилие. Мы делаем продукт, задача которого- облегчить работу с большими объемами данных, и для нас очень важно, что платформа несет прикладную пользу не только бизнес-заказчикам, но и обществу в целом». 

Дмитрий Гольцов 
Руководитель коммерческого направления «Мегапьютер Интеллидженс»

Команда исследовательского проекта благодарит компанию «Мегапьютер Интеллидженс», предоставляющую новые возможности в работе по такой чрезвычайно важной и трудной социальной проблематике.

ДРУГИЕ НОВОСТИ И СТАТЬИ

Мегапьютер завершил первый этап проекта доработки PolyAnalyst GRID при поддержке РФРИТ

Read More

29 сентября пройдет вебинар «Интеллектуальный анализ данных и текстов Luxms BI + PolyAnalyst»

Read More

Компания Мегапьютер представила платформу PolyAnalyst на конференции «Импортзамещение 2022: новый опыт»

Read More
ВСЕ НОВОСТИ

Продукты

PolyAnalyst Full

PolyAnalyst Text mining & NLP

PolyAnalyst Data mining & ML

PolyAnalyst ETL & BI

PolyAnalyst GRID

Sapremo

Решения

Интеллектуальные решения

Галерея проектов

Обучение

Видео-инструкции

Лекторий по анализу данных

Документация

Проверка сертификата

Свяжитесь с нами

+7(499)7530129

info@megaputer.ru

©1993-2023. ООО «Компания «Мегапьютер Интеллидженс». Пользовательское соглашение. Политика конфиденциальности.