Мегапьютер и Институт экономики, математики и информационных технологий РАНХиГС совместно разработали курс «Основы анализа данных и машинного обучения», ориентированный на широкий круг слушателей. Лекции рассказывают о том, как надежное извлечение полезной информации из текстовых документов открывает путь к решению многих важнейших бизнес-задач в самых разных областях деятельности. Основным инструментом исследователя в данном курсе является продукт PolyAnalyst.
Разработка данного курса является одним из шагов по реализации новых образовательных программ направления «Data Science» в президентской академии, где с 2020 года проводится подготовка специалистов по магистерской программе «Data Science and Artificial Intelligence», реализуемой совместно с Goldsmiths, University of London. Ознакомиться>>
Для чего нужно анализировать данные?
Как в эпоху четвертой промышленной революции анализ данных двигает бизнес вперед.
Об аналитической платформе PolyAnalyst
На что способна аналитическая платформа PolyAnalyst и как она работает с данными.
История создания платформы PolyAnalyst
Как группа исследователей из МГУ создала и развивала аналитическую платформу PolyAnalyst.
Введение в область машинного обучения
Что такое машинное обучение, какие задачи решает и чем оно интересно экономике.
Этапы создания модели машинного обучения
Четыре основных этапа в формировании процесса машинного обучения.
Обзор алгоритмов машинного обучения
Классические и глубинные алгоритмы машинного обучения.
Классические алгоритмы. Деревья решений
Принципы и механизмы алгоритма машинного обучения — дерево решений.
Прочие классические методы машинного обучения
Байесовский классификатор и другие классические методы машинного обучения.
Глубокое машинное обучение
Современные методы машинного обучения с применением многослойных нейронных сетей.
Преимущества гибридного подхода в обучении
Почему нельзя применять в машинном обучении только нейронные сети.
Компьютерная лингвистика — Определение языка и токенизация
Почему компьютеру сложно понимать человеческий язык и как они с этим справляются.
Поиск и исправление ошибок в тексте
Машинные инструменты выявления и исправления некорректно написанных слов.
Преимущества гибридного подхода в обучении
Почему нельзя применять в машинном обучении только нейронные сети.
Синтаксический анализ текста
Как машина определяет связь между словами и какую роль они в целом играют в предложении.
Семантический анализ текстов
Какие виды семантических связей существуют, и как они определяются компьютерным интеллектом.
Извлечение информации из текста
Какую информацию можно извлекать из документов, и чем это может быть полезно вашей компании.
Извлечение сущностей и фактов
Извлечение сущностей и фактов посредством машинного обучения и rule-based подхода.
Анализ тональности
Определение эмоциональной окраски текста и автоматическое определение объекта оценки.
Классификация текстов. Таксономия
Возможности и сферы применения классификации текстовых документов.
Автоматизация извлечения информации для бизнеса
Восемь видов бизнес-применения анализа текстов в эпоху роботизации и автоматизации.
Аналитика в области права. Legaltech
Автоматизация анализа правовых и относящихся к юриспруденции документов.
Аналитика новостного потока и отзывов клиентов
Анализ новостного потока на предмет негативных или позитивных сигналов о своих партнерах и конкурентах, а также отзывов клиентов.
Анализ данных о ремонтах оборудования
Извлечение полезной информации из документов, регистрирующих поломки и ремонт.
Контроль за содержанием учебных программ
Сравнение рабочих программ дисциплин и описания разделов дисциплин.