В ходе данного курса обучающиеся получат навыки анализа неструктурированных текстовых данных с помощью инструментов платформы PolyAnalyst и познакомятся с основными этапами анализа неструктурированных текстовых данных (загрузка данных, индексация текста, извлечение сущностей, извлечение фактов и т.д.) для дальнейшего анализа и создания интерактивных отчетов. По окончании курса обучающиеся смогут самостоятельно разрабатывать и реализовывать сценарии анализа неструктурированных текстовых данных при помощи последовательности функциональных узлов PolyAnalyst.
5 интерактивных занятий по 2 академических часа (90 минут) (базовый уровень) + 4 интерактивных занятия (продвинутый уровень)
2 автоматически оцениваемых теста для проверки понимания материала (базовый уровень) + 1 тест для продвинутого уровня
9 самостоятельных проектов (5 проектов по базовому уровню + 4 проекта по продвинутому уровню) по 3 академических часа самостоятельной работы над каждым проектом (5 академических часа для самостоятельной работы по Занятию 9)
Рекомендуемая продолжительность курса 21 день (2 интерактивных занятия в неделю) (базовый уровень) и 28 дней (продвинутый уровень)
Для прохождения курса вам потребуются следующие знания и умения:
Желательные, но необязательные знания:
По окончании курса обучающимся выдается сертификат об окончании курса “Анализ текстовых данных”, где указывается уровень пройденной программы (базовый или продвинутый), количество выполненных самостоятельных работ и баллы, набранные в результате прохождения тестов.
Занятие 1 «Основы обработки текстовых данных. Словари» (базовый уровень)
После занятия обучающиеся будут:
|
Создание проекта для закрепления умений по работе со словарями.
Занятие 2 «Извлечение стандартных сущностей. Словари сущностей, словари классов слов и пользовательские словари» (базовый уровень)
После занятия обучающиеся будут:
|
Создание проекта, в рамках которого будет закреплено умение работать с узлами Извлечение сущностей, Извлечение фактов, Анализ тональности, Анонимизация сущностей и Восстановление сущностей.
Занятие 3 «Классификация и кластеризация текстов» (базовый уровень)
После занятия обучающиеся будут:
|
Создание проекта, в котором будет проведена классификация и кластеризация текстовых данных. Обучающимся будет предложено дать интерпретацию полученным в ходе анализа результатам.
Занятие 4 «Язык поисковых запросов PDL» (базовый уровень)
После занятия обучающиеся будут:
|
Создание проекта, в котором будут отображены основные функции языка поисковых запросов PDL.
Занятие 6 «Язык извлечения информации XPDL» (продвинутый уровень)
После занятия обучающиеся будут:
Создание проекта, в котором будут представлены пользовательские сущности, извлеченные при помощи XPDL.
Занятие 7 «Дополнительные возможности языка XPDL» (продвинутый уровень)
После занятия обучающиеся будут:
Создание проекта, в котором будут представлены пользовательские сущности, извлеченные при помощи XPDL.
Занятие 8 «Работа с таблицами внутри текстовых документов» (продвинутый уровень)
После занятия обучающиеся будут:
Создание проекта, в котором будут представлены пользовательские сущности, извлеченные при помощи XPDL.
Занятие 9 «Разработка решения для анализа текстов на естественном языке» (продвинутый уровень)
После занятия обучающиеся будут:
Создание проекта, в котором будет представлено собственное решение обучающегося для анализа текстов на естественном языке.
Данный курс ориентирован на:
Если у вас нет опыта работы с платформой PolyAnalyst, мы рекомендуем пройти Базовый курс по работе с платформой. Базовые знания регулярных выражений желательны для прохождения курса, но не обязательны, т.к. набор предлагаемых инструментов текстового анализа позволяет осуществлять анализ текста различными методами (без обязательного знания регулярных выражений).
Рекомендуемая длительность курса – 21 день (2 занятия в неделю). Для продвинутого уровня – 28 дней (2 занятия в неделю). Данный формат позволяет комфортно сочетать обучение с другими активностями. Выполнение самостоятельных работ возможно в любое время по выбору обучающегося.
Курс состоит из 5 занятий для базового уровня + 4 занятия для продвинутого уровня. Занятие длится два академических часа (90 минут астрономического времени) и проводится в режиме онлайн в формате видеоконференции. Запись занятия будет доступна обучающимся в течении суток после занятия. По материалам Занятия 2 (базовый уровень), Занятия 4 (базовый уровень) и Занятия 6 (продвинутый уровень) обучающимся предлагается пройти тест. По каждому пройденному занятию обучающимся также предлагается выполнить самостоятельную работу.
После каждого занятия обучающимся предлагается разработать самостоятельный проект для закрепления полученных на занятии навыков. На разработку самостоятельного проекта отводится 3 академических часа. На разработку проекта по Занятию 9 (продвинутый уровень) отводится 5 академических часа. Для облегчения разработки самостоятельного проекта он разделен на небольшие этапы и каждый этап подробно описан.
Наши инструкторы готовы ответить на любые вопросы, связанные с обучением или платформой PolyAnalyst. Также мы готовы прийти на помощь при возникновении сложностей с выполнением самостоятельных заданий – разъяснить отдельные моменты, дать рекомендации по работе с платформой и т.п.
Мы не ограничиваем количество попыток при выполнении тестов. В сертификате будет отражен наилучший результат из всех предпринятых попыток.
Оценку работ проводят наши инструкторы на основании списка критериев, приведенных в описании каждой работы. При оценке работы инструкторы составляют список рекомендаций, на основании которых можно улучшить проект.
Для прохождения курса не требуется специального программного или аппаратного обеспечения. Достаточно наличия персонального компьютера с выходом в Интернет и установленным Интернет-браузером. Платформа PolyAnalyst располагается на учебных серверах компании, на время обучения учащимся предоставляется круглосуточный доступ к платформе.