Технология анализа данных

Извлечение знаний, скрытых в огромных количествах первичных данных

Успешное конкурирование требует наличия способностей. Способности складываются из знаний. Знания берутся из данных. Процесс извлечения знаний из данных называется анализом данных (Data Mining).

Типовые задачи, решаемые с помощью Data Mining:

  • Оценка покупателей по их склонности отвечать на предложение
  • Определение возможности перекрестных продаж
  • Обнаружение мошенничеств и неправильных обращений в сферах страхования и финансирования
  • Оценка возможности повторного заболевания или регоспитализации
  • Устранение коренных причин последствий при клинических исследованиях
  • Определение оптимального набора параметров для максимальной активности производственной линии
  • Прогнозирование пиковой нагрузки сети

Без мощного аналитического инструментария извлечение полезных знаний, скрытых в огромных количествах сырых, необработанных данных, представляет собой сложную, практически невыполнимую задачу. Экспоненциальный рост данных, в отличие от природы данных и целей анализа, сложности анализа перемемешанных структурных данных и текста, представляет собой фактор, делающий из сбора и анализа данных настоящую проблему.

Data Mining предоставяет инструментарий для автоматического изучения как исторических данных так и совершенствующихся моделей для прогнозирования последствий будущих ситуаций. Самые лучшие инструментальные программные средства Data Mining предоставляют многообразие алгоритмов машинного обучения для моделирования, таких как Регрессия, Нейронная сеть, Дерево решений, Байесовские сети, Метод опорных векторов, Случайный лес, CHAID и другие.

Однако, Data Mining - это больше чем просто машинное обучение. Кроме этого, Data Mining включает в себя предварительную обработку данных и доставку результатов. А предварительная обработка данных, в свою очередь, включает в себя загрузку данных с различных источников данных, их систематизацию, нормализацию и очистку, проведение исследовательского анализа данных. Доставка результатов включает в себя модельное приложение в производственной среде и создание отчетов, суммирующих результаты анализов в доступной форме для бизнес-пользователей.

Главный инструмент компании Megaputer Intelligence PolyAnalyst™ поддерживает предварительную обработку данных, моделирование и демонстрацию результатов. Система PolyAnalyst™ позволит Вам решать проблемы прогнозирования, классификации, кластеризации, группирование по родству, анализа связей, многомерного анализа и интерактивного создания отчетов.

Читать далее о продукте PolyAnalyst™.

Academic Resources

A collection of various academic publications from Megaputer.

Contact us
Следующие шаги
Обзор продукта PolyAnalyst™
PDF DocumentБрошюра о PolyAnalyst™
Образовательная программа компании Megaputer Intelligence Inc.
Data Mining Algorithms available from Megaputer
Predictive Neural Networks
Classification Neural Networks
Rule Induction
Linear Regression
Logistic Regression
Case Based Reasoning
Bayesian Networks
CHAID
Decision Trees
R-Forests
Association Rule Learning
Temporal Association Learning
Anomaly Detection
Healthcare Fraud Signatures
Support Vector Machines
Naive-Bayes Classification
Expectation Maximization Clustering
Correlation Analysis
Instance Based Reasoning

©2017 Megaputer Intelligence, Inc. All Rights Reserved. Legal & Privacy Information