IPavlov Artificial Business Intelligence (ABI) Platform - Smart Search

Страница создана Любомир Аникин
 
ПРОДОЛЖИТЬ ЧТЕНИЕ
IPavlov Artificial Business Intelligence (ABI) Platform - Smart Search
iPavlov Artificial Business Intelligence
(ABI) Platform - Smart Search
IPavlov Artificial Business Intelligence (ABI) Platform - Smart Search
О проекте
Функции:
• Кластеризация текстовых коллекций
• Маршрутизация текстовых коллекций
• Умный поиск информации
Проект построен на основе библиотеки TopicNet (библиотека автоматизированного тематического моделирования)
Преимущества TopicNet:
• Cодержит функционал необходимый разработчику
• Позволяет использовать сложные сценарии обучения и подготовки моделей
• Возможность встраивать собственные критерии качества для обучения моделей
• Возможность встраивать собственные регуляризаторы как этапы обучения модели
• Построение базовых решений повышенной точности
• Автоматизация стандартной стартовой работы исследователя в области анализа и обработки данных
• Минимизация затрат в предметную область
IPavlov Artificial Business Intelligence (ABI) Platform - Smart Search
Актуальность проекта

                           Постановка задачи                   Разведочный анализ

                        Разработка технологии                  Создание решения

• Снижение «рутинной работы»

• Снижение процента ошибок, обусловленных человеческим фактором

• Отсутствие технологических аналогов на рынке SDK продуктов

• Современная тенденция быстрого получения информации

• Бесперебойность работы

• Возможность создания под индивидуальный запрос
IPavlov Artificial Business Intelligence (ABI) Platform - Smart Search
История
                                                                                                                             Подписано значимое соглашение
       МФТИ выиграл грант на                 Постепенное разделение проекта на 2равноценные команды:                         с руководством холдинга «Швабе»
       создание ИИ-проекта                   Команда коммерциализации РИД (Лоран Акопян)                                     (Госкорпорации «Ростех»), в рамках
       «Нейроинтеллект iPavlov».             Лаборатория: исследовательская составляющая (Михаил Бурцев)                     которого был создан НИЦ АО "Швабе" в МФТИ.

                Реализация проекта iPavlov                                В результате успешных переговоров с Дмитрием Дэйн,                       Цель: коммерциализация новых продуктов
                в рамках НТИ, при индустриальной                          сооснователем и техническим директором компании                          и технологий, улучшение качества
                поддержке Сбербанка. Главная цель                         Virgil Security, Inc. (Manassas,VA, USA) была открыта                    и эффективности научно-исследовательских
                проекта: создание open-source                             международная лаборатория интеллектуальных                               и опытно-конструкторских работ между
                библиотеки DeepPavlov, доступной                          криптографических систем в рамках ЦК НТИ по                              лабораториями МФТИ и промышленными
                для скачивания по всему миру.                             направлению «Искусственный интеллект» на базе МФТИ.                      предприятиями Холдинга.

 2017                    2017                                  2018                  2019                                                   2019
                         2020

2019           2018                                                                          2020        2020                                 2020       2020
               2020

                                                                                                             На заседании наблюдательного                    МФТИ принял стратегически-
                   Реализован широкий пласт работ по привлечению партнеров,
                                                                                                             совета АСИ, президент и                         важное решение о создании
                   клиентов и инвесторов (в том числе: Альфа-Банк,
                                                                                                             председатель правления                          спин-офф компании
                   ПАО «МегаФон», АО ПО УОМЗ, ПАО «Ростелеком», SAP,
                                                                                                             Сбербанка России Герман Греф                    ООО “Айпавлов”, для продолжения
                   Медиалогия, ФГБУ «НМИЦ им. В. А. Алмазова» Минздрава России,
                                                                                                             доложил об успехах iPavlov.                     коммерциализации ИИ-разработок
                   ПАО «РГС Банк» и др.)
                                                                                                                                                             и вывода их на глобальные рынки.
   Подписание трехстороннего соглашения
                                                                      Выпущена первая версия рыночного продукта
   о совместном развитии высокотехнологичной
                                                                      «Платформа создания мультифункциональных                       В ходе заседания проектного комитета НТИ
   области искусственного интеллекта (ИИ) между
                                                                      чат-ботов iPavlov», а также первая версия ПО для               было рекомендовано проработать состав
   РФПИ, МФТИ и Национальным центром больших
                                                                      многофункционального медицинского терминала.                   учредителей ООО “Айпавлов”.
   данных и искусственного интеллекта имени Короля
   Абдель Азиза Королевства Саудовская Аравия.
IPavlov Artificial Business Intelligence (ABI) Platform - Smart Search
iPavlov: 5 направлений развития компании

       NLP               Smart City         Smart Clinic              ABI                  CV

      ЦА для           Интеллектуальные        Создание                                 Сервис по
                           дорожно-        антропоморфных      Сервис по анализу     распознаванию
  автоматизации
                         транспортные          роботов-        временных рядов
   HR процессов                                                                        объектов и
                            системы          ассистентов                             их сегментации

                           Решения         Система анализа
  Маршрутизатор
                         “Умное ЖКХ”      медицинских карт и                             Сервис по
    запросов                                                      Разработка ПО
                                            изображений                               распознаванию
                                                               для телеметрических     и обработке
                                                                    комплексов          документов
                                                                     различных
 Сервис по анализу        Решения
                                                                  технических и
  транзакционных         «Обработка                             «умных» объектов
                                          Цифровой комплекс
      данных             обращений        нейрореабилитации
                         населения»            больных                                   Система
                                                                                      компьютерного
                                                                                     зрения в области
                                                                                       розничной и
   Модели intent                          Автоматизированная    Сервис по анализу
                           Решения                                                   оптовой торговли
  recognition, NER,                       система управления    мультимодальных
                        «Общественная
 sentiment analysis,                       потоками клиентов   неструктурированных
                        безопасность»                                 данных
        etc.
IPavlov Artificial Business Intelligence (ABI) Platform - Smart Search
Анализ отрасли цифровых ассистентов

 По исследованиям Gartner - в следующие три года
 все больше организаций станут использовать
 виртуальных помощников для сотрудников. Среди
 отраслей, наиболее заинтересованных во
 внедрении - страхование и сферу финансовых
 услуг. Также виртуальные ассистенты
 используются в ИТ-секторе, отделах клиентского
 обслуживания и информационных запросов

                                                                                             https://vc.ru/future/105785-rynok-iskusstvennogo-intellekta-prognoz-razvitiya-do-2025-goda

                                                                                             Прогнозируется, что ежегодный глобальный доход от
                                                                                             программного обеспечения (ПО) вырастет с 10,1 млрд
                                                                                             долларов в 2018 году до 126 млрд. долларов в 2025.

                                                                                             Цифровые ассистенты по прогнозам принесут около 4,8
                                                                                             млрд. долларов годовой прибыли в 2025 по сравнению с
                                                                                             всего 876,3 млн. долларов в 2018.
https://vc.ru/future/105785-rynok-iskusstvennogo-intellekta-prognoz-razvitiya-do-2025-goda
IPavlov Artificial Business Intelligence (ABI) Platform - Smart Search
Цель и задачи проекта

Цель:
Создание библиотеки TopicNet - автоматического построения тематических сетей в прикладных задачах текстовой
аналитики и анализа финансовых транзакционных данных. Это необходимо для снижения порога входа при
использовании иерархических интерпретируемых тематических моделей в прикладных задачах и получения
автоматизировано-настраиваемых базовых моделей высокого качества.

Задачи:

• Построение иерархических тематических моделей по большим динамически
  обновляемым текстовым или транзакционным данным

• Рубрикация данных контактного центра: выделение интентов в текстовых обращениях
  клиента.

• Векторизация юридических лиц – клиентов банка на основе информации об их
  транзакционной активности с последующим поиском потенциальных конкурентов,
  партнеров, поставщиков и клиентов.
IPavlov Artificial Business Intelligence (ABI) Platform - Smart Search
Развитие проекта

                Этап                                     Перечень работ                                            Результаты
Этап 1: текстовые и транзакционные      • Создание библиотеки TopicNet - автоматизированный   • Первая версия библиотеки Topic Net, документация по ее
данные                                    тематический анализ                                   использованию
Этап 2: мультимодальные данные:         • Создание части библиотеки TopicNet с поддержкой     • Вторая версия библиотеки Topic Net, документация по ее
изображения, временные ряды, тексты,      английского языка, визуализацией результатов;         использованию: обработка документов
транзакции. Внутренние библиотеки       • Первая версия анализа изображений печатных
                                          документов
Этап 3: развитие внутренней библиотеки • Создание библиотеки предобученных моделей            • Третья версия библиотеки с предобученными моделями,
и реализация первых продуктов на ее     • Создание внутренних технологических составляющих      документация по ее использованию.
основе                                    ряда продуктов: информационный поиск, рубрикация    • Внутренний технологический стек для сервисов.
                                          диалогов, сегментации ипрофилирования клиентов
Этап 4: улучшение продуктов, реализация • Создание сервисов: выделения тем диалога,           • Готовая для развертывания и обучения на стороне
новых на их основе. Добавление нового     профилирования клиентов / спецификации                заказчика система. Документация по ее обучению и
функционала в библиотеку                                                                        использованию
Этап 5: новые продуктовые направления Создание сервисов:                                      • Готовая для развертывания и обучения на стороне
                                      • вопросно-ответная система                               заказчика система. Документация по ее обучению и
                                      • dewarping документа                                     использованию
                                      • профилирование пользователя
Этап 6: новые продуктовые направления • Создание библиотеки локально аппроксимирующих         • Четвертая версия библиотеки Topic Net с частью
                                        моделей временных рядов                                 обработки временных рядов
                                                                                              • Документация по ее использованию
Этап 7: новые продуктовые направления • Упаковка сервисов в продуктовые линейки               • Готовая библиотека для масштабирования проектной
(интеграция мультимодальных данных в                                                            деятельности, документация по ее использованию
одну систему)                                                                                 • Готовые для развертывания и обучения на стороне
                                                                                                заказчика сервисы и документация по их обучению
                                                                                              • Свидетельство о регистрации РИД
IPavlov Artificial Business Intelligence (ABI) Platform - Smart Search
Реализация проекта

                Этап 3-4. Мониторинг и контроль разрабатываемой платформы.
                Ожидание сдачи всего функционала согласно ТЗ, доработка
                индивидуальных потребностей

                Этап 3. Мониторинг и контроль разрабатываемой
                платформы. Ожидание сдачи всего функционала
                согласно ТЗ

                Этап 1-2. Индустриальный партнер, заказчик технологии,
                договор заключен, проект сдан, оплата за проект
                получена

                Этап 1-2. Индустриальный партнер, заказчик технологии,
                договор заключен, первый этап сдан, оплата за первый
                этап получена

                Этап 1-2. Индустриальный партнер, заказчик технологии,
                договор заключен, первый этап сдан, оплата за первый этап
                получена
IPavlov Artificial Business Intelligence (ABI) Platform - Smart Search
Предполагаемые результаты

                                  Адаптированная и
Библиотека TopicNet по
                                  апробированная система
автоматизированному созданию
                                  анализа покупательской
тематических сетей для
                                  активности клиентов банка.
масштабирования проектной
деятельности

Адаптированная и                  Адаптированная и
апробированная система анализа    апробированная система
и рубрикации диалогов             анализа внутренних процессов
контактного центра.               персонала

 Адаптированная и                 Лицензируемый модуль
 апробированная система поиска    TopicNet для капитализации и
 по большому количеству           коммерциализации научных
 данных. Распознавание            исследований по созданию
 запросов на естественном языке   тематических сетей
 и свободной форме
Сравнение с аналогами по конкретным результатам

                              Gensim LDA   SkLearn LDA   VW LDA    TopicNet
      Автоматизированное         Нет          Нет         Нет         Да
       построение модели
          Возможность            Нет          Нет         Нет         Да
      построения иерархий
              тем
      Скорость обработки       Высокая       Низкая      Высокая   Высокая
          коллекции
      Возможность выбора         Нет          Нет         Нет         Да
       стратегии обучения
      тематической модели
        Число потоков             1            1           1       2 и более
      построения модели
     /Зависит от коллекции/     < 0.7         < 0.7       < 0.7      < 0.9
      Декоррелированность
               тем
     /Зависит от коллекции/    До 70%        До 70%      До 70%     До 90%
              Доля
     интерпретируемых тем
     /Зависит от коллекции/     < 0.6         < 0.6       < 0.6      < 0.9
       Разреженность тем
      Число модальностей          1            1           1       5 и более
Научная база проекта
                                                           Ресурсы:
1    Open Source библиотека Topic Modeling: BigARTM
                                                           1   Библиотека обработки фотографий и
                                                               сканов документов iDog
     Области внедрения методов AI: банкинг, телеком,
5    документооборот, гос. корпорации, архив
                                                           2   Системы разведочного анализа
                                                               текстовых и транзакционных данных
3    Ключевых партнера в области Artificial Intelligence

     Успешно завершенных проектов в области Artificial     2   Лицензируемых модуля
5                                                              предобработки и анализа текстовой
     Intelligence                                              информации

8    Докладов на международных конференциях

18   Публикаций в изданиях, рецензируемых Scopus, WoS

              Лаборатория машинного интеллекта МФТИ ведет постоянную работу в направлении
                   создания технологических компонента для последующей капитализации
                         результатов научной деятельности и их коммерциализации
Коммерциализация результатов

Результаты первого этапа:
    •   Масштабирование проектной деятельности на новых клиентов
    •   Увеличение потока финансирования лаборатории
    •   Зарегистрированный РИД в формате лицензируемого кода, распространяющегося
        по лицензионным договорам среди заинтересованных технологических команд и
        компаний

Результаты последующих этапов:
    •   Создание отдельных сервисов и продуктов индустриальными партнерами или
        компаниями, представляющими spin-off Лаборатории машинного интеллекта

Целевая аудитория:
    •   Банки
    •   Телеком
    •   Медицина
    •   Гос. Учреждения
    •   Архивы
    •   Музеи
    •   Образовательные учреждения
Наши партнеры

                Банковский   IT компании/
  Telecom                                   Прочее
                  сектор          retail
Контактная информация

Адрес: Россия, 141701, Московская обл.,
г. Долгопрудный, Институтский переулок 9 с.3,
МФТИ, корп. «Физтех.Цифра»

Тел: +7 (498) 713-91-67

Почты:
info@ipavlov.ai
pr@ipavlov.ai
partner@ipavlov.ai
hr@ipavlov.ai
shvabe.ai@mipt.ru

iPavlov.ai

НИЦ АО «Швабе» в МФТИ
Вы также можете почитать