Машинное обучение в MATLAB - Павел Рословец
←
→
Транскрипция содержимого страницы
Если ваш браузер не отображает страницу правильно, пожалуйста, читайте содержимое страницы ниже
План вебинара
Машинное обучение
Глубокое обучение 45 мин
Обучение на Big Data
Экспорт алгоритмов
2Развитие технологий ИИ
Искусственный интеллект
Аргументация
Широта применения
Восприятие
Машинное обучение
Представление знаний Предсказание погоды Определение спама
Алгоритмический трейдинг
Машинный перевод Интернет вещей
Обнаружение мошенничества Глубокое обучение
Компьютерные игры
Биоинформатика Распознавание объектов
Интерактивные проргаммы Медицинская диагностика Автономные авто
Экспертные системы Мониторинг здоровья Роботы
1950s 1980s сегодня
3Машинное обучение рассматривают, когда
• Решение слишком сложное для написания уравнений Потому что
алгоритмы могут:
находить сложные
нелинейные
Распознавание речи Распознавание объектов Контроль оборудования взаимосвязи
• Решение должно адаптироваться под новые данные
корректироваться
при поступлении
Прогноз погоды Предсказание энергозатрат Предсказание рынка новых данных
• Решение нужно масштабировать
эффективно
обучаться на
Аналитика IoT Поиск такси Предсказание задержки рейсов
больших данных
4Сложности машинного обучения
Анализ занимает много времени
Большое количество математических функций
Необходима серьезная техническая экспертиза
Документация и приложения упрощают работу
Нет одного решения для всего
Приложения позволяют быстро подобрать модель
Решения в виде «черных ящиков»
Создание из моделей независимых приложений
5Алгоритмы машинного обучения
Обучение без
Кластеризация
учителя
Группировка и
интерпретация
Машинное входных данных
обучение
Классификация
Обучение с
учителем
Поиск взаимосвязи Регрессия
между входом и
выходом
6Методы кластеризации
Кластеризация
k-Means, Gaussian Hidden
Hierarchical
Fuzzy C-Means Mixture Markov Model
11Методы обучения с учителем
Gaussian
Process
Регрессия
Non-linear Support
Decision Ensemble Linear
Reg. Vector
Trees Methods (GLM, Logistic) Regression
Machines
Классификация
Discriminant Nearest
Naive Bayes
Analysis Neighbor
12Улучшение моделей
• Выбор признаков
• Трансформация
признаков
• Настройка
гиперпараметров
13Выбор признаков
(Feature Selection)
• Stepwise regression
• Sequential feature selection
• Regularization
• Neighborhood component analysis (NCA)
14Трансформация признаков
(Feature Transformation)
• Principal component analysis (PCA)
• Nonnegative matrix factorization
• Factor analysis
• Sparse Filtering
• Reconstruction ICA
15Демо ирисы Фишера
Кластеризация
Sepal
Petal
16Предсказательное обслуживание
(Predictive Maintenance)
Сбор данных
Анализ накопленных данных
Создание модели для предсказания отказов
Развертывание модели для предсказания в
реальном времени
Предотвращение отказов
17Демо предсказание отказов двигателя
Классификация
Данные
Сигналы с датчиков 100
двигателей одной модели
Цель
Построить модель предсказания
отказов
18Использование накопленных данных
Начало использования Начало записи Отказ Обслуживание
Накопленные
Двигатель1
Двигатель2
Двигатель100
«Живые»
Циклы
(время)
Двигатель200 ?
19Демо предсказание стоимости такси
Регрессия
Данные
Статистика поездок такси
Нью-Йорка
Цель
Построить модель предсказания
стоимости поездки
20Обучение на больших данных
Зачем использовать?
–Обучение на больших выборках дает более
точную модель
Сложности
–Данные не помещаются в память
–Интерактивная работа непрактична
21Стандартные методы
• Использование только части данных
• Последовательная работа с частями данных
• Распараллеливание обработки
• Дополнительная работа
• Требует больше усилий/кода
• Может повлиять на качество результата
22Подход MATLAB
• Быстрый переход к большим данным
• Обучение на больших данных
• Автоматическое распараллеливание
• Бесшовный переход от обучения на
обычных данных к Big Data
23Машинное обучение на Big Data
• Статистика (skewness, tabulate, • Linear classification methods for
crosstab, cov, grpstats, …) SVM and logistic regression
• K-means кластеризация (kmeans) (fitclinear)
• Random forest ensembles of
• Визуализация (ksdensity,
classification trees (TreeBagger)
binScatterPlot; histogram, histogram2)
• Уменьшение размерности (pca, • Naïve Bayes classification (fitcnb)
pcacov, factoran) • Regularized regression (lasso)
• Linear and generalized linear regression • Предсказание по Big Data
(fitlm, fitglm)
• Discriminant analysis (fitcdiscr)
24Экспорт алгоритмов
MATLAB
Runtime MATLAB
MATLAB MATLAB
Compiler Compiler SDK
Standalone MATLAB
Python
Application Excel Hadoop C/C++ Java .NET Production
Server
25Генерация С кода из моделей машинного обучения
MATLAB Coder MATLAB code
Мобильные сенсоры
Мониторинг состояния
C code
Предсказание отказов
Пост-обработка для радаров
Системы наблюдения
Классификация физиологических
сигналов(ECG)
...
Embedded Systems
26Генерация С кода из моделей машинного обучения
– Vector machine classification (fitcsvm)
– Linear classification models (fitclinear)
– Multi-class versions of the above (fitcecoc)
– Linear regression models (fitlm)
– Generalized linear regression models (fitglm, glmval)
– Decision trees for classification and regression (fitctree, fitrtree)
– Ensembles of trees for classification (fitcensemble)
27MATLAB идеальное решение для
машинного обучения
M
Подбор
Загрузка Обработка Извлечение Тренировка Интеграция в
лучшей
данных данных признаков модели производство
модели
MATLAB Compiler
MATLAB Statistics and Machine Learning Toolbox MATLAB Compiler
SDK
MATLAB Coder
28https://www.mathworks.com/campaigns/products/offer/machine-learning-with-matlab
29Neural Network Toolbox
• Создание и обучение нейросетей
• Глубокое обучение
• Классификация, регрессия и кластеризация
• Графические инструменты
• Экспорт алгоритмов и генерация С кода
• (скоро) генерация GPU кода
30Deep learning
• Экспорт функций для тренировки • Transfer learning:
нейросетей − AlexNet
− VGG-16
• Поддержка AlexNet − VGG-19
− модели из Caffe
• Поддержка нескольких GPU
• Распознавание изображений:
− R-CNN
− Fast R-CNN
− Faster R-CNN 31Демо распознавание цифр
Transfer learning
Данные
- Нейросеть для
распознавания букв
- Набор цифр
Цель
Обучить сеть распознавать
цифры
32Особенности машинного
обучения в MATLAB
Работа с любыми данными
Огромные возможности анализа и
визуализации
Ускорение за счет параллельных
вычислений
Создание независимых приложений
33Уникальность MATLAB
Работа с Big Data
• Легко работать с данными, не влезающими в память
Экосистема тулбоксов
• Реализация полного цикла разработки
Графические приложения
• Тренировка, сравнение и экспорт моделей без
написания кода
Генерация кода
• Развёртывание моделей на встраиваемых системах
34MATLAB – самая простая и
эффективная среда для специалистов
в области машинного обучения
35• User stories
mathworks.com • Products
• Documentation
• Мероприятия
matlab.ru • Тренинги
MATLABinRussia • Вводные ролики
36• Поставка MATLAB & Simulink
Центр инженерных технологий
• Обучение специалистов
и моделирования
• Настройка решений под ключ
• Консалтинг
exponenta.ru
info@exponenta.ru
+7 (495) 009 65 85
37Тренинги
• MLBE: основы MATLAB
• MLVI: MATLAB для обработки и визуализации
данных
• MLML: Машинное обучение с MATLAB
• MLST: Статистические методы в MATLAB
• MLEM: Генерация C кода из MATLAB с
помощью MATLAB Coder
и другие…
38Консалтинг
Интернет вещей
Анализ данных
Машинное обучение
Встраиваемые системы
39День вебинаров:
Методы анализа данных
для интернета вещей
11:00 - Анализ данных в MATLAB для IoT
13:30 - Машинное обучение в MATLAB
16:00 - Параллельные вычисления и Big Data
40Вы также можете почитать