Машинное обучение в MATLAB - Павел Рословец

Страница создана Виктор Одинцов
 
ПРОДОЛЖИТЬ ЧТЕНИЕ
Машинное обучение в MATLAB - Павел Рословец
Машинное обучение
         в MATLAB

        Павел Рословец
                         1
Машинное обучение в MATLAB - Павел Рословец
План вебинара
 Машинное обучение

 Глубокое обучение        45 мин
 Обучение на Big   Data
 Экспорт алгоритмов

                                    2
Машинное обучение в MATLAB - Павел Рословец
Развитие технологий ИИ
                    Искусственный интеллект
                     Аргументация
Широта применения

                                         Восприятие
                                                          Машинное обучение
                           Представление знаний           Предсказание погоды     Определение спама

                                                                                     Алгоритмический трейдинг
                        Машинный перевод                         Интернет вещей

                                                          Обнаружение мошенничества      Глубокое обучение
                                    Компьютерные игры
                                                            Биоинформатика                Распознавание объектов
                     Интерактивные проргаммы                  Медицинская диагностика       Автономные авто

                                     Экспертные системы    Мониторинг здоровья                            Роботы

                1950s                                       1980s                                               сегодня
                                                                                                                      3
Машинное обучение в MATLAB - Павел Рословец
Машинное обучение рассматривают, когда
• Решение слишком сложное для написания уравнений                           Потому что
                                                                            алгоритмы могут:
                                                                           находить сложные
                                                                           нелинейные
   Распознавание речи    Распознавание объектов Контроль оборудования      взаимосвязи
 • Решение должно адаптироваться под новые данные

                                                                           корректироваться
                                                                           при поступлении
     Прогноз погоды     Предсказание энергозатрат Предсказание рынка       новых данных
 • Решение нужно масштабировать

                                                                           эффективно
                                                                           обучаться на
     Аналитика IoT            Поиск такси   Предсказание задержки рейсов
                                                                           больших данных
                                                                                               4
Машинное обучение в MATLAB - Павел Рословец
Сложности машинного обучения
    Анализ занимает много времени
     Большое количество математических функций
    Необходима серьезная техническая экспертиза
     Документация и приложения упрощают работу
    Нет одного решения для всего
     Приложения позволяют быстро подобрать модель
    Решения в виде «черных ящиков»
     Создание из моделей независимых приложений
                                                    5
Машинное обучение в MATLAB - Павел Рословец
Алгоритмы машинного обучения
             Обучение без
                                Кластеризация
               учителя
              Группировка и
             интерпретация
 Машинное    входных данных
 обучение
                                Классификация
              Обучение с
               учителем
            Поиск взаимосвязи     Регрессия
             между входом и
                выходом
                                                6
Машинное обучение в MATLAB - Павел Рословец
Кластеризация
        Обучающие данные
    Входные
    данные                 Кластеры

                ?
                                      7
Машинное обучение в MATLAB - Павел Рословец
Классификация
        Обучающие данные
    Входные
    данные                 Классы

                ?
                                    8
Машинное обучение в MATLAB - Павел Рословец
Регрессия
        Обучающие данные
    Входные                Непрерывная
    данные                 величина

               ?
                                         9
Машинное обучение в MATLAB - Павел Рословец
Statistics and Machine Learning
Toolbox

                                  10
Методы кластеризации

                     Кластеризация

     k-Means,                     Gaussian      Hidden
                   Hierarchical
   Fuzzy C-Means                  Mixture    Markov Model

                                                            11
Методы обучения с учителем
                               Gaussian
                               Process

                             Регрессия
                                Non-linear                   Support
   Decision     Ensemble                          Linear
                                  Reg.                        Vector
    Trees       Methods       (GLM, Logistic)   Regression
                                                             Machines

                      Классификация
              Discriminant                      Nearest
                              Naive Bayes
                Analysis                        Neighbor
                                                                        12
Улучшение моделей
• Выбор признаков
• Трансформация
  признаков
• Настройка
  гиперпараметров

                    13
Выбор признаков
(Feature Selection)

  • Stepwise regression
  • Sequential feature selection
  • Regularization
  • Neighborhood component analysis (NCA)

                                            14
Трансформация признаков
(Feature Transformation)

  • Principal component analysis (PCA)
  • Nonnegative matrix factorization
  • Factor analysis
  • Sparse Filtering
  • Reconstruction ICA
                                         15
Демо ирисы Фишера
Кластеризация

Sepal
          Petal

                    16
Предсказательное обслуживание
(Predictive Maintenance)

                           Сбор данных

                  Анализ накопленных данных

            Создание модели для предсказания отказов
             Развертывание модели для предсказания в
                       реальном времени
                     Предотвращение отказов
                                                       17
Демо предсказание отказов двигателя
Классификация

   Данные
    Сигналы с датчиков 100
    двигателей одной модели
   Цель
    Построить модель предсказания
    отказов

                                      18
Использование накопленных данных
                 Начало использования   Начало записи   Отказ   Обслуживание
 Накопленные

                 Двигатель1

                 Двигатель2

               Двигатель100
 «Живые»

                                                                    Циклы
                                                                   (время)
               Двигатель200                              ?

                                                                               19
Демо предсказание стоимости такси
Регрессия

   Данные
    Статистика поездок такси
    Нью-Йорка
   Цель
    Построить модель предсказания
    стоимости поездки

                                    20
Обучение на больших данных
   Зачем использовать?
    –Обучение на больших выборках дает более
     точную модель
   Сложности
    –Данные не помещаются в память
    –Интерактивная работа непрактична

                                               21
Стандартные методы
 • Использование только части данных
 • Последовательная работа с частями данных
 • Распараллеливание обработки

      • Дополнительная работа
      • Требует больше усилий/кода
      • Может повлиять на качество результата
                                                22
Подход MATLAB
 • Быстрый переход к большим данным
 • Обучение на больших данных
 • Автоматическое распараллеливание

      • Бесшовный переход от обучения на
        обычных данных к Big Data

                                           23
Машинное обучение на Big Data

• Статистика (skewness, tabulate,            • Linear classification methods for
  crosstab, cov, grpstats, …)                  SVM and logistic regression
• K-means кластеризация (kmeans)               (fitclinear)
                                             • Random forest ensembles of
• Визуализация (ksdensity,
                                               classification trees (TreeBagger)
  binScatterPlot; histogram, histogram2)
• Уменьшение размерности (pca,               • Naïve Bayes classification (fitcnb)
  pcacov, factoran)                          • Regularized regression (lasso)
• Linear and generalized linear regression   • Предсказание по Big Data
  (fitlm, fitglm)
• Discriminant analysis (fitcdiscr)
                                                                                     24
Экспорт алгоритмов
MATLAB
Runtime                     MATLAB

          MATLAB                        MATLAB
          Compiler                    Compiler SDK

 Standalone                                                 MATLAB
                                                  Python
 Application Excel Hadoop   C/C++   Java   .NET            Production
                                                             Server
                                                                        25
Генерация С кода из моделей машинного обучения
MATLAB Coder             MATLAB code

     Мобильные сенсоры

     Мониторинг состояния
                                      C code
     Предсказание отказов

     Пост-обработка для радаров

     Системы наблюдения

     Классификация физиологических
      сигналов(ECG)

     ...
                                               Embedded Systems
                                                                  26
Генерация С кода из моделей машинного обучения

  – Vector machine classification (fitcsvm)
  – Linear classification models (fitclinear)
  – Multi-class versions of the above (fitcecoc)

  – Linear regression models (fitlm)
  – Generalized linear regression models (fitglm, glmval)
  – Decision trees for classification and regression (fitctree, fitrtree)
  – Ensembles of trees for classification (fitcensemble)
                                                                            27
MATLAB идеальное решение для
 машинного обучения
                                                                     M
                                                     Подбор
Загрузка   Обработка    Извлечение    Тренировка                Интеграция в
                                                     лучшей
данных      данных      признаков       модели                  производство
                                                     модели

                                                               MATLAB Compiler

      MATLAB           Statistics and Machine Learning Toolbox MATLAB Compiler
                                                                    SDK

                                                                MATLAB Coder

                                                                           28
https://www.mathworks.com/campaigns/products/offer/machine-learning-with-matlab
                                                                                  29
Neural Network Toolbox
 •   Создание и обучение нейросетей
 •   Глубокое обучение
 •   Классификация, регрессия и кластеризация
 •   Графические инструменты
 •   Экспорт алгоритмов и генерация С кода
 •   (скоро) генерация GPU кода

                                                30
Deep learning

• Экспорт функций для тренировки   • Transfer learning:
  нейросетей                          − AlexNet
                                      − VGG-16
• Поддержка AlexNet                   − VGG-19
                                      − модели из Caffe
                                   • Поддержка нескольких GPU
                                   • Распознавание изображений:
                                      − R-CNN
                                      − Fast R-CNN
                                      − Faster R-CNN              31
Демо распознавание цифр
Transfer learning
   Данные
    - Нейросеть для
      распознавания букв
    - Набор цифр
   Цель
    Обучить сеть распознавать
    цифры
                                32
Особенности машинного
обучения в MATLAB
  Работа с любыми данными
  Огромные возможности анализа и
   визуализации
  Ускорение за счет параллельных
   вычислений
  Создание независимых приложений
                                     33
Уникальность MATLAB
  Работа с Big Data
  • Легко работать с данными, не влезающими в память
  Экосистема тулбоксов
  • Реализация полного цикла разработки
  Графические приложения
  • Тренировка, сравнение и экспорт моделей без
    написания кода
  Генерация кода
  • Развёртывание моделей на встраиваемых системах
                                                       34
MATLAB – самая простая и
эффективная среда для специалистов
в области машинного обучения

                                     35
• User stories
mathworks.com    • Products
                 • Documentation

                 • Мероприятия
matlab.ru        • Тренинги

MATLABinRussia   • Вводные ролики
                                    36
• Поставка MATLAB & Simulink
Центр инженерных технологий
                              • Обучение специалистов
      и моделирования
                              • Настройка решений под ключ
                              • Консалтинг
    exponenta.ru
    info@exponenta.ru
    +7 (495) 009 65 85
                                                             37
Тренинги
• MLBE: основы MATLAB
• MLVI: MATLAB для обработки и визуализации
  данных
• MLML: Машинное обучение с MATLAB
• MLST: Статистические методы в MATLAB
• MLEM: Генерация C кода из MATLAB с
  помощью MATLAB Coder
                               и другие…
                                              38
Консалтинг
Интернет вещей
Анализ данных
Машинное обучение
Встраиваемые системы

                        39
День вебинаров:
Методы анализа данных
для интернета вещей

11:00 - Анализ данных в MATLAB для IoT
13:30 - Машинное обучение в MATLAB
16:00 - Параллельные вычисления и Big Data
                                             40
Вы также можете почитать