megaputer-logo
  • Продукты
  • Решения
  • Обучение
  • Партнерство
  • О компании
СКАЧАТЬ

Российская MLOps платформа для бизнеса

Создание платформы MLOps с помощью открытых инструментов

Наряду с готовыми решениями, такими как PolyAnalyst, для анализа больших массивов информации можно применять функциональные платформы MLOps, построенные на базе инструментов, разработанных с применением «открытого кода». Рассмотрим особенности реализации таких платформ.
Подробнее про MLOps в PolyAnalyst>>

Жизненный цикл систем

При реализации MLOps применяется комплекс отработанных методов DevOps, которые позволяют создавать в автоматическом режиме конвейеры машинного обучения, действующие в производственной среде, их развертывание и контроль. Широкое применение получили фреймворки и инструменты MLOps, созданные с открытым кодом. От любой платформы MLOps требуется предоставление бизнесу инструментария для осуществления ключевых процессов, составляющих для системы ее жизненный цикл. В том числе требуется реализация следующих процессов.
  • Создание конвейера. Предусматривает осуществление процессов охватывающих машинное обучение и прогнозирование, в том числе с четкой координацией этапов. Упрощает развертывание конвейеров в автоматическом режиме.
  • Мониторинг экспериментов Machine Learning. Предусматривает сбор сведений о вошедших в определенную модель данных с учетом результатов производительности каждой модели, в том числе сбор данных о ее параметрах и характерных артефактах.
  • Развертывание и упаковка обученной модели ML.
  • Автоматизация. Обеспечивает расширение классической CI/CD с целью обеспечения непрерывности процесса обучения плюсом к автоматизации процессов, позволяющих развертывать конвейеров.
  • Обслуживание. Обеспечивает прием запросов прогнозирования действующей моделью ML с целью логического вывода. Предусматривает прием данных на входе с выдачей ответов, имеющих прогнозированные результаты.
  • Мониторинг. Необходим для контроля действующей модели, создания отчетов с целью обнаружения снижения производительности и разработки мер по улучшению работы.
Основная часть продуктов с открытым кодом, например Kubeflow или MLflow, предусматривает выполнение одной или нескольких базовых функций. В то же время есть коммерческие решения, которые объединяют комплекс функций в составе управляемой, интегрированной MLOps-платформы. Для ее унификации без серьезной привязки к конкретным инструментам часто используют принцип, который основан на сквозной архитектуре.

Инструментарий

Создание платформы MLOps предусматривает в первую очередь развертывание MLflow и Kubeflow и подключение через URI MLflow в рабочей зоне Kubeflow. После этого GoCD имеет возможность отслеживания репозитория Github и связи с хостами MLflow и Seldon Core, что упрощает процесс. Развертывание Prometheus выполняется в кластере с последующей настройкой с конечными точками Kubernetes для контроля и интеграции с Grafana. Это позволяет предоставить собранные метрики. Инструмент Streamlit работает на уровне потребления архитектуры. Он обеспечивает связь с конечными точками действующих моделей.

Начало процесса работы — создание конвейера, обеспечивающего работу с данными в пределах сервера ноутбуков Kubeflow. В этом пространстве осуществляется работа и масштабирование экспериментов по созданию конвейеров посредством Kubeflow Pipeline SDK.

SDK обеспечивает упаковку каждого шага в формате образа Docker и поддерживает дальнейшую работу с ним на собственном конвейере, основанном на инфраструктуре Kubernetes.

Kubeflow выполняет преобразование кода в контейнер DAG с последующей автоматической организацией рабочего процесса AirFlow. Этот инструмент MLOps делает возможным запуск сразу нескольких моделей одновременно. Несмотря на наличие у Kubeflow эффективного пользовательского интерфейса, он уступает MLflow по сложности и возможности простого сохранения данных уже выполненных экспериментов. Это осложняет воспроизводимость и мониторинг. MLflow намного более эффективен в отслеживании экспериментов. Это серьезный довод в пользу интеграции этих инструментов MLOps.

MLflow предусматривает возможность создания реестра моделей, что значительно упрощает управление жизненным циклом. Кроме этого, он содержит интеграцию с рядом популярных служб развертывания, в том числе с Seldon Core. Соответственно, эта служба выбирает из реестра необходимые модели, выполняет их развертывание.

Инструмент Seldon Core поддерживает развертывание моделей на локальном носителе или в облаке в любом из кластеров Kubernetes. При этом возможности платформы не зависят от инструментария. Поэтому Seldon Core может быть заменена с использованием альтернативного решения в облаке Azure. Использование Azure Kubernetes Services (AKS) позволяет развертывать действующие модели в области Azure с сохранением вышестоящих задач. В результате развертывание производится в различных целевых средах с сохранением кода. Создание интерфейса в формате веб-приложения может выполняться при помощи платформы Streamlit на базе Python. Она поддерживает вывод в интерактивном режиме, а также вывод пакетов для осуществления оценки массива данных.

ФУНКЦИОНАЛЬНОЕ ОПИСАНИЕ

Интеллектуальная аналитика розничных продаж

Интерактивный отчет для анализа структуры и динамики продаж розничной точки. Кроме того, отчет включает результат работы предиктивной модели, строящей прогноз реакции клиентов на проведение промокомпании, а также результат интеллектуального анализа покупательских корзин.

Анализ отзывов о продукции - Принтеры

Отчет демонстрирует ключевые темы и анализ пользовательского опыта в интернет-отзывах о принтерах четырех крупнейших производителей. Вы можете проанализировать разницу в рейтинговых позициях брендов на разных площадках и изучить причины этого.

Модель развития эпидемии COVID-19 в России

Визуализация модели прогноза масштабов и сроков заболеваемости COVID-19 в России. Визуализированы данные по новым случаям, общем количестве активных случаев, числу летальных исходов и выздоровлений. Данные представлены в общем по РФ и по регионам.

Автоматизация​

Применение GoCD для запуска действующих конвейеров позволяет обеспечить автоматизацию создания ML. Это дает возможность создания, тестирования, выпуска и запуска всего конвейера. Аналитик запускает конвейеры путем отправки в репозиторий Github вносимых изменений. В этом репозитории осуществляется хранение кода. Такое решение поддерживает непрерывность процесса обучения, что является отличием Machine Learning от классических приложений, не предусматривающих возможность переобучения.

Для контроля можно применять инструменты Prometheus и Grafana. Они помогут обеспечить непрерывный контроль работы запущенных моделей и базовых инфраструктур. Эти инструменты выполняют сбор операционных метрик, а также собирают метрики качества. Кроме этого, они поддерживают сбор пользовательских метрик, которые относятся к отдельным вариантам использования, предусмотренным на платформе. Также есть возможность настройки механизма оповещения, что позволяет реализовать телефонные уведомления при выявлении отклонений. Действующий сервер CI/CD позволяет запустить для определенных моделей процесс переобучения и развернуть их в автоматическом режиме на базе предельных значений предупреждений.

Альтернативное решение — PolyAnalyst

Российская MLOps платформа для бизнеса PolyAnalyst — удобный и эффективный аналог решениям на основе инструментов, основанных на открытом коде. Платформа выполнена в качестве единой системы, выполняющей все аналитические этапы.

Основные функции PolyAnalyst:

  • Загрузка массива данных из разных источников.
  • Очистка, преобразование, агрегация данных, проверка на ошибки, другие виды подготовки.
  • Создание нескольких моделей,
  • Выбор наиболее качественной модели;
  • Внедрение модели в промышленном прогнозировании;
  • Мониторинг применения и качества модели.

Благодаря этому платформа дает аналитику широкие возможности для проведения процедур MLOps, не требуя от него навыков программирования.

Инструкция по MLOps в PolyAnalyst. Внедрение и поддержка моделей машинного обучения в производстве.

СМОТРЕТЬ

Продукты

PolyAnalyst Full

PolyAnalyst Text mining & NLP

PolyAnalyst Data mining & ML

PolyAnalyst ETL & BI

PolyAnalyst GRID

Sapremo

Решения

Интеллектуальные решения

Галерея проектов

Обучение

Видео-инструкции

Лекторий по анализу данных

Документация

Проверка сертификата

Свяжитесь с нами

+7(499)7530129

info@megaputer.ru

©1993-2023. ООО «Компания «Мегапьютер Интеллидженс». Пользовательское соглашение. Политика конфиденциальности.