Машинное обучение в MATLAB - Павел Рословец
←
→
Транскрипция содержимого страницы
Если ваш браузер не отображает страницу правильно, пожалуйста, читайте содержимое страницы ниже
План вебинара Машинное обучение Глубокое обучение 45 мин Обучение на Big Data Экспорт алгоритмов 2
Развитие технологий ИИ Искусственный интеллект Аргументация Широта применения Восприятие Машинное обучение Представление знаний Предсказание погоды Определение спама Алгоритмический трейдинг Машинный перевод Интернет вещей Обнаружение мошенничества Глубокое обучение Компьютерные игры Биоинформатика Распознавание объектов Интерактивные проргаммы Медицинская диагностика Автономные авто Экспертные системы Мониторинг здоровья Роботы 1950s 1980s сегодня 3
Машинное обучение рассматривают, когда • Решение слишком сложное для написания уравнений Потому что алгоритмы могут: находить сложные нелинейные Распознавание речи Распознавание объектов Контроль оборудования взаимосвязи • Решение должно адаптироваться под новые данные корректироваться при поступлении Прогноз погоды Предсказание энергозатрат Предсказание рынка новых данных • Решение нужно масштабировать эффективно обучаться на Аналитика IoT Поиск такси Предсказание задержки рейсов больших данных 4
Сложности машинного обучения Анализ занимает много времени Большое количество математических функций Необходима серьезная техническая экспертиза Документация и приложения упрощают работу Нет одного решения для всего Приложения позволяют быстро подобрать модель Решения в виде «черных ящиков» Создание из моделей независимых приложений 5
Алгоритмы машинного обучения Обучение без Кластеризация учителя Группировка и интерпретация Машинное входных данных обучение Классификация Обучение с учителем Поиск взаимосвязи Регрессия между входом и выходом 6
Методы кластеризации Кластеризация k-Means, Gaussian Hidden Hierarchical Fuzzy C-Means Mixture Markov Model 11
Методы обучения с учителем Gaussian Process Регрессия Non-linear Support Decision Ensemble Linear Reg. Vector Trees Methods (GLM, Logistic) Regression Machines Классификация Discriminant Nearest Naive Bayes Analysis Neighbor 12
Улучшение моделей • Выбор признаков • Трансформация признаков • Настройка гиперпараметров 13
Выбор признаков (Feature Selection) • Stepwise regression • Sequential feature selection • Regularization • Neighborhood component analysis (NCA) 14
Трансформация признаков (Feature Transformation) • Principal component analysis (PCA) • Nonnegative matrix factorization • Factor analysis • Sparse Filtering • Reconstruction ICA 15
Демо ирисы Фишера Кластеризация Sepal Petal 16
Предсказательное обслуживание (Predictive Maintenance) Сбор данных Анализ накопленных данных Создание модели для предсказания отказов Развертывание модели для предсказания в реальном времени Предотвращение отказов 17
Демо предсказание отказов двигателя Классификация Данные Сигналы с датчиков 100 двигателей одной модели Цель Построить модель предсказания отказов 18
Использование накопленных данных Начало использования Начало записи Отказ Обслуживание Накопленные Двигатель1 Двигатель2 Двигатель100 «Живые» Циклы (время) Двигатель200 ? 19
Демо предсказание стоимости такси Регрессия Данные Статистика поездок такси Нью-Йорка Цель Построить модель предсказания стоимости поездки 20
Обучение на больших данных Зачем использовать? –Обучение на больших выборках дает более точную модель Сложности –Данные не помещаются в память –Интерактивная работа непрактична 21
Стандартные методы • Использование только части данных • Последовательная работа с частями данных • Распараллеливание обработки • Дополнительная работа • Требует больше усилий/кода • Может повлиять на качество результата 22
Подход MATLAB • Быстрый переход к большим данным • Обучение на больших данных • Автоматическое распараллеливание • Бесшовный переход от обучения на обычных данных к Big Data 23
Машинное обучение на Big Data • Статистика (skewness, tabulate, • Linear classification methods for crosstab, cov, grpstats, …) SVM and logistic regression • K-means кластеризация (kmeans) (fitclinear) • Random forest ensembles of • Визуализация (ksdensity, classification trees (TreeBagger) binScatterPlot; histogram, histogram2) • Уменьшение размерности (pca, • Naïve Bayes classification (fitcnb) pcacov, factoran) • Regularized regression (lasso) • Linear and generalized linear regression • Предсказание по Big Data (fitlm, fitglm) • Discriminant analysis (fitcdiscr) 24
Экспорт алгоритмов MATLAB Runtime MATLAB MATLAB MATLAB Compiler Compiler SDK Standalone MATLAB Python Application Excel Hadoop C/C++ Java .NET Production Server 25
Генерация С кода из моделей машинного обучения MATLAB Coder MATLAB code Мобильные сенсоры Мониторинг состояния C code Предсказание отказов Пост-обработка для радаров Системы наблюдения Классификация физиологических сигналов(ECG) ... Embedded Systems 26
Генерация С кода из моделей машинного обучения – Vector machine classification (fitcsvm) – Linear classification models (fitclinear) – Multi-class versions of the above (fitcecoc) – Linear regression models (fitlm) – Generalized linear regression models (fitglm, glmval) – Decision trees for classification and regression (fitctree, fitrtree) – Ensembles of trees for classification (fitcensemble) 27
MATLAB идеальное решение для машинного обучения M Подбор Загрузка Обработка Извлечение Тренировка Интеграция в лучшей данных данных признаков модели производство модели MATLAB Compiler MATLAB Statistics and Machine Learning Toolbox MATLAB Compiler SDK MATLAB Coder 28
https://www.mathworks.com/campaigns/products/offer/machine-learning-with-matlab 29
Neural Network Toolbox • Создание и обучение нейросетей • Глубокое обучение • Классификация, регрессия и кластеризация • Графические инструменты • Экспорт алгоритмов и генерация С кода • (скоро) генерация GPU кода 30
Deep learning • Экспорт функций для тренировки • Transfer learning: нейросетей − AlexNet − VGG-16 • Поддержка AlexNet − VGG-19 − модели из Caffe • Поддержка нескольких GPU • Распознавание изображений: − R-CNN − Fast R-CNN − Faster R-CNN 31
Демо распознавание цифр Transfer learning Данные - Нейросеть для распознавания букв - Набор цифр Цель Обучить сеть распознавать цифры 32
Особенности машинного обучения в MATLAB Работа с любыми данными Огромные возможности анализа и визуализации Ускорение за счет параллельных вычислений Создание независимых приложений 33
Уникальность MATLAB Работа с Big Data • Легко работать с данными, не влезающими в память Экосистема тулбоксов • Реализация полного цикла разработки Графические приложения • Тренировка, сравнение и экспорт моделей без написания кода Генерация кода • Развёртывание моделей на встраиваемых системах 34
MATLAB – самая простая и эффективная среда для специалистов в области машинного обучения 35
• User stories mathworks.com • Products • Documentation • Мероприятия matlab.ru • Тренинги MATLABinRussia • Вводные ролики 36
• Поставка MATLAB & Simulink Центр инженерных технологий • Обучение специалистов и моделирования • Настройка решений под ключ • Консалтинг exponenta.ru info@exponenta.ru +7 (495) 009 65 85 37
Тренинги • MLBE: основы MATLAB • MLVI: MATLAB для обработки и визуализации данных • MLML: Машинное обучение с MATLAB • MLST: Статистические методы в MATLAB • MLEM: Генерация C кода из MATLAB с помощью MATLAB Coder и другие… 38
Консалтинг Интернет вещей Анализ данных Машинное обучение Встраиваемые системы 39
День вебинаров: Методы анализа данных для интернета вещей 11:00 - Анализ данных в MATLAB для IoT 13:30 - Машинное обучение в MATLAB 16:00 - Параллельные вычисления и Big Data 40
Вы также можете почитать