PolyAnalyst предоставляет широкий выбор алгоритмов машинного обучения и статистической обработки для анализа структурированных данных, таких как числа, строки и даты. Система позволяет решать задачи классификации, кластеризации, предсказания численных значений, выявлять типичные паттерны и аномалии, и строить предсказательные модели на основе анализа временных рядов и сетевых структур. PolyAnalyst может производить чистку и обогащение данных, используя алгоритмы нечеткого сравнения разных представлений объектов.
Построенные системой предсказательные модели позволяют извлекать полезные знания, скрытые в анализируемых сырых данных, и применять эти знания для принятия эффективных управленческих и бизнес-решений.
Важным значением для пользователя, работающего с системами обнаружения и извлечения знаний, является возможность обучения математических алгоритмов на исторических данных и построения предиктивных моделей для нахождения паттернов и
высокоточного прогнозирования результатов будущих событий. Ни один аналитический алгоритм не является универсальным средством, а каждая практическая задача имеет свою специфику, что требует применения множества инструментов для определения наиболее эффективного. PolyAnalyst содержит более тридцати современных инструментов интеллектуального анализа, позволяющих решать подавляющее число прикладных задач. Также в PolyAnalyst возможно использовать высокоуровневые языки программирования Python и R для выполнения специальных операций с данными.
выполняет следующие задачи:
Расчет статистических характеристик выборки: среднее, стандартное отклонение, асимметрия, превышение, медиана и мода.
Распознавание вида распределения: нормальное, экспоненциальное, двойное экспоненциальное, логнормальное и равномерное.
Проверка гипотез эквивалентности средних и дисперсии двух или более переменных.
Проверка гипотез эквивалентности медиан и близости форм распределения переменных.
Группировка переменных по результатам проверки гипотез.
Основная задача узла ARIMA - построение модели процесса, называемой ARIMA. Эта модель представляет собой сочетание следующих параметров:
Авторегрессивная модель процесса (Auto-Regression) – прогнозирование роста процесса исходя из его предыдущих состояний (режимов) (как линейная комбинация значений)
Интеграция временного ряда (Integration) – для создания стационарного процесса
Модель процесса скользящего среднего (Moving Average model of process) – модель помех остается от модели процесса AR.
Анализ данных, как и прочие процедуры PolyAnalyst вроде очистки или преобразования данных, проводится путем выстраивания и соединения последовательности графических узлов. Каждый такой узел является алгоритмом интеллектуальной аналитики, либо вспомогательным узлом, например для тестирования или применения обученной модели. Такой подход позволяет быстро строить многошаговые аналитические сценарии, включающие как классические, так и самые передовые алгоритмы машинного обучения, без необходимости сложного программирования. Встроенные механизмы автоматизации превращают построенные аналитические сценарии в полностью роботизированные приложения для решения конкретных бизнес-задач.
Ознакомьтесь с бизнес-кейсом использования алгоритмов интеллектуального анализа структурированных данных в мультиформатной продуктовой розничной компании. Применение разработанной в PolyAnalyst предиктивной модели к набору исторических данных об объемах продаж позволило построить для десяти товарных групп прогноз продаж на полтора года вперед.