Топологический анализ матриц коннективности в задачах медицинской диагностики

Страница создана Георгий Пастухов
 
ПРОДОЛЖИТЬ ЧТЕНИЕ
Топологический анализ матриц коннективности в задачах медицинской диагностики
Топологический анализ матриц коннективности
 в задачах медицинской диагностики
 А. Бернштейн1, В. Бухштабер1,2, Е. Бурнаев1, М. Шараев1,
 О. Качан1, Е. Стрельцова2, М. Поминова1

 1Сколковский институт науки и технологий
2Московский Государственный Университет им. М.В. Ломоносова

 4 декабря 2019 г.
Топологический анализ матриц коннективности в задачах медицинской диагностики
О чем доклад
 … математика мозга …
междисциплинарные контакты Topological data analysis

Топологический анализ … в … медицинской диагностике

 Процесс диагностики

 Нейровизуализационные Диагноз
 данные Топологический
 Анализ Данных
Топологический анализ матриц коннективности в задачах медицинской диагностики
Медицинская диагностика

 Данные Процесс диагностики Диагноз

Данные:
- клинические, описание
- лабораторные,
- нейровизуализационные,
 снимка
- демографические, …
Топологический анализ матриц коннективности в задачах медицинской диагностики
«Диагностика по данным»

 Данные Х – вектор признаков . Х

 y

Группа испытуемых с известными диагнозами D
болен (D = 0) или здоров (D = 1)  {(Xi, Di)} . Х
 Новый испытуемый Диагноз

 .
с неизвестным диагнозом
 Х
 здоров (D = 1)

 L – разделяющая гиперплоскость
 y – вектор нормали к L
Y = Pry(X) – Вектор Информативных Признаков (ВИП)
 (диагностический биомаркер)
Топологический анализ матриц коннективности в задачах медицинской диагностики
Диагностика по «нелинейным» данным

 Группа испытуемых
 с известными диагнозами {(Xi, Di)}

Методы нелинейной классификации:
- ядерные методы (гильбертовы пространства с воспроизводящим ядром),
- искусственные нейронные сети (включая «глубокие» сети), …

 K X, X1 Y = P(X) - ВИП
K(X, X) – ядро, X  V(X) = ⋯
 K X, Xn D(Y) - нелинейная решающая функция
+ PCA
Топологический анализ матриц коннективности в задачах медицинской диагностики
Снижение размерности вектора признаков

X ∈ Rp - исходный вектор признаков
Z = h(X) ∈ Rq - вектор признаков меньшей размерности содержащий «всю
 необходимую информацию»

Нахождение размерности q и преобразования h по выборке векторов {Xi}

 Метод главных компонент(PCA) :
 L – наилучшее q-мерное линейное «аппроксимирующее»
 подпространство
 Z – координаты в L проекции PrL(X)
Топологический анализ матриц коннективности в задачах медицинской диагностики
Нелинейное снижение размерности

 Manifold Learning – технология анализа данных в
 предположении что данные лежат на неизвестном
 низкоразмерном Многообразии данных меньшей
 размерности (или вблизи него):
 • оценивание внутренней размерности множества
 данных,
 • параметризация Многообразия данных (снижение
 размерности),
 • оценивание Многообразия данных,
 • решение различных задач для manifold-valued data
 (регрессии, классификации, …),
 • и др.
Топологический анализ матриц коннективности в задачах медицинской диагностики
Структура алгоритмов «диагностики по данным»

 Машинное обучение
 Снижение размерности
 {(Zi = h(Yi), Di)}
 {(Xi, Di)}
 Данные ВИП Классификация:
 
 Х Y = P(X) решающая функция
 {(Yi = P(Xi), Di)} D(h(P(X)))
 «Качество» процедур

Качество (достоверность) процедур классификации (чувствительность,
специфичность, точность, площадь под ROC-кривой, …):
• выбор Вектора Информативных Признаков
• выбор процедур машинного обучения
Топологический анализ матриц коннективности в задачах медицинской диагностики
О чем доклад
 Данные
 МРТ/фМРТ Машинное обучение
 для задач диагностики
 • Здоровые (H) vs Депрессия (D)
 • Здоровые (H) vs Эпилепсия (E)
 ВИП из
 • Здоровые (H) vs Шизофрения (S)
 МРТ/фМРТ • D vs DE
 данных • E vs ED, …
Топологический анализ матриц коннективности в задачах медицинской диагностики
О чем доклад (+ немного)
 Данные
 ЭЭГ ВИП из Машинное обучение
 данных для задач диагностики
 ЭЭГ Здоровые (H) vs Депрессия (D)

 Данные ВИП из Локализация
МРТ/фМРТ МРТ/фМРТ нейрональных зон мозга
 данных перед операцией

 Rs-fMRI Tb-fMRI Rs&Tb-fMRI
Пример: информативные признаки в МРТ данных
 • парцелляция: мозг может быть разбит на
 Данные МРТ
 регионы в соответствии с выбранным
 анатомическим атласом
 • существуют программные пакеты для
 парцелляции

FreeSurfer© toolbox (для выбранного
анатомического атласа):
• разбивает все воксели 3D МРТ-изображения Harvard-Oxford
 ( ~ 140 000) на группы вокселей относящихся к cortical/subcortical
 различным регионам мозга, atlas
• вычисляет морфометрические характеристики
 (объем, площадь поверхности, толщина, кривизна,
 …) для каждого региона
Морфометрическиепризнаки в МРТ данных

FreeSurfer© toolbox (Desikan-Killiany atlas):

• разбивает МРТ-изображение на 109 регионов
• 7 – 9 морфометрических характеристик в каждом регионе
• 894-мерный вектор морфометрических характеристик

 Данные МРТ

 894-мерный вектор морфометрических характеристик
Матрица структурной коннективности (трактография)

 Anatomical/structural connectivity
 = presence of axonal connections

 Сканы DTI Метрики диффузионной
 Тензор Матрица структурной
(диффузионно- анизотропии
 диффузии коннективности
тензорная МРТ) (фракционная анизотропия)
Информативные признаки в МРТ/фМРТ данных

 Данные Последовательно
МРТ/фМРТ применяемые процедуры
 Предобработка и
 очистка данных
 ВИП из
 Парцелляция МРТ/фМРТ
 данных
 Выбор временных рядов
 в регионах мозга

 Построение матриц/графов
 связей между регионами

 Выбор характеристик матриц/графов
 (спектральных, топологических, …)
Информативные признаки в МРТ/фМРТ данных

• на каждом этапе происходит преобразование данных
• для каждого этапа существуют различные альтернативные алгоритмы
• результаты каждого этапа могут рассматриваться как информативные
 признаки

• в Сколтехе разработаны программные библиотеки, содержащие
 альтернативные алгоритмы для каждой процедуры
• библиотеки размещаются на платформе CoBrain Analytics
 разработанной в Проекте COBRAIN (Национальный исследовательский
 проект по расширению ресурсов мозга человека, НТИ «НЕЙРОНЕТ»)
Информативные признаки в МРТ/фМРТ данных

 Последовательно
 применяемые процедуры
 Предобработка и
 очистка данных

 Парцелляция

 Выбор временных рядов
 в регионах мозга

 Построение матриц/графов
 связей между регионами

 Выбор характеристик матриц/графов
 (спектральных, топологических, …)
Предобработка и очистка данных

  пространственная корегистрация изображений
  пространственная нормализация
  очистка от артефактов движения,
до 80-90% шума в сырых данных  преобразование из входного формата DICOM в
источники шума: формат BIDS (общепринятый стандарт для
• Не связанные с физиологией хранения, аннотирования и описания данных
  Тепловой шум нейровизуализационных экспериментов).
  Негомогенность поля
  Неточности во временах РЧ • программа FMRIPREP (Стенфордский Центр
 импульса, и др. Воспроизводимых Результатов в Нейронауках)
• Физиологические • программа Предобработка и очистка данных
  Сердцебиение
 фМРТ покоя (Сколтех)
  Дыхание
• Движения головы

Выход: 4D-тензор: совокупность временных
рядов (для каждого вокселя)
Информативные признаки в МРТ/фМРТ данных

 Последовательно
 применяемые процедуры
 Предобработка и
 очистка данных

 Парцелляция

 Выбор временных рядов
 в регионах мозга

 Построение матриц/графов
 связей между регионами

 Выбор характеристик матриц/графов
 (спектральных, топологических, …)
Парцелляция временных рядов
Нейровизуализационые пакеты:
• выбранный анатомический атлас
• совокупность всех временных рядов разбивается на группы временных рядов (каждая
 группа состоит из временных рядов для вокселей соответствующего региона)

 Регион 1 Регион 2 … Регион N

 …

• Пакет NiLearn (Automated Anatomical Labeling atlas) - 116 регионов
• Пакет CONN - 164 региона
Информативные признаки в МРТ/фМРТ данных

 Последовательно
 применяемые процедуры
 Предобработка и
 очистка данных

 Парцелляция

 Выбор временных рядов
 в регионах мозга

 Построение матриц/графов
 связей между регионами

 Выбор характеристик матриц/графов
 (спектральных, топологических, …)
Выбор временных рядов в регионах мозга

 Регион i Регион j Как процессы в Регионе i влияют на
 процессы в Регионе j?
Зачем:
 Выберем в каждом регионе m
 временных рядов и будем искать
 ответ анализируя статистические
 связи между этими двумя наборами
 Векторы
 V1 mT матрица временных рядов
 V2 Т
 М
 …
 VM
 m TSM
М – число вокселей Т – длина
 временного ряда
 в регионе
Выбор временных рядов в регионах мозга

Алгоритмы:
• усреднение «региональных» временных рядов  Т
 T-мерный вектор (временной ряд длины Т)
 Т
• применение PCA к М T-мерным векторам {Vj} 
 m главных компонент (m временных рядов длины Т) m
 обычно m = 1

• применение алгоритма снижения размерности к Т
 Т
 М-мерным векторам {Wj} (столбцам MT матрицы) 
 Т векторов меньшей размерности m (число m одинаково М
 для всех регионов)  m временных рядов длины Т
 W1 W2 … WT-1WT
Информативные признаки в МРТ/фМРТ данных

 Последовательно
 применяемые процедуры
 Предобработка и
 очистка данных

 Парцелляция

 Выбор временных рядов
 в регионах мозга

 Построение матриц/графов
 связей между регионами

 Выбор характеристик матриц/графов
 (спектральных, топологических, …)
Построение матриц/графов связей между регионами

Алгоритмы вычисления матриц коннективности:
• Correlation: (m = 1): вычисление NN матрицы корреляций
 R = между выбранными временными рядами»

• CCA: вычисление симметричной NN матрицы RCCA = , где Rij - максимальный
 коэффициент корреляции между всевозможными линейными комбинациями m
 выбранных временных рядов в i-м и j-м регионах
 (CCA - Канонический Корреляционный Анализ)

 Симметричная NN матрица корреляционной коннективности
Причинно-следственные связи между регионами мозга

 Симметричная матрица корреляций:
 • статистические (корреляционные) зависимости между сигналами, снятыми в разных
 регионах мозга (разные группы вокселей фМРТ)
 • функциональные связи в человеческом мозге (коннектомы) отражающие
 синхронизацию между работой макроскопичесикх участков мозга

• Корреляционный характер связей не учитывает «причинно-следственную» природу
 взаимодействий между участками мозга и «порождают» много ложных зависимостей.
• Причинно-следственные (каузальные) связи более точно отражают функциональную
 архитектуру мозга (эффективную коннективность), но они сложно оцениваются по
 экспериментальным данным (особенно, по фМРТ-данным с малым количеством
 временных отсчетов).
Информативные признаки казуальной коннективности

 ??
 Казуальные признаки
 нейрональных сетей
 Несимметричная матрица
 казуальной коннективности
Анализ линейных/нелинейных динамических систем
(Dynamic Causal Modelling, DCM):

Генеративные Экспериментальные
 модели данные
Информативные признаки: анализ временных рядов

 Анализ выделенных временных рядов в регионах X и Y:
степень «влияния» региона X на регион Y: насколько знание «прошлой» динамики
региона X помогает лучше предсказывать будущую динамику региона Y.
Алгоритмы основаны на:
 казуальное
• «корреляции» с лагом взаимодействие

• причинности по Грейнджеру (Granger Causality),
• метриках теории информации (трансферная энтропия,
 условная взаимная информация, и другие).
Матрицы эффективной (казуальной) коннективности

 Модели типовой сети состояния покоя (DMN)
 (в среднем, по группе людей)
Матрицы эффективной (казуальной) коннективности

 Результат работы всех алгоритмов:
матрицы эффективной (казуальной) коннективности
Пространственная коннективность
• Correlation/Time: вычисление TT матрицы корреляций «по пространству»
 по транспонированной Матрице Временных Рядов TSM
 Матрица корреляций между
 TSMТ T m-мерных векторов
 «пространственными» векторами
 (строки матрицы TSMT) для разных моментов времени
 m m T

 T TSMТ T T

Topological Data Analysis of Functional MRI Connectivity in Time and Space Domains,
“We found that temporal vs. spatial functional connectivity can encode different aspects of cognition and
personality. Topological analyses using persistent homology show that persistence barcodes are significantly
correlated to individual differences in cognition and personality, with high reproducibility” (2018)
Информативные признаки в МРТ/фМРТ данных

 Последовательно
 применяемые процедуры
 Предобработка и
 очистка данных

 Парцелляция

 Выбор временных рядов
 в регионах мозга

 Построение матриц/графов
 связей между регионами

 Выбор характеристик матриц/графов
 (спектральных, топологических, …)
Выбор характеристик матриц/графов

 Данные Симметричная (несимметричная) матрица
 фМРТ корреляционной (казуальной) коннективности

 Симметричная матрица
 «пространственных» корреляций

 Данные Данные
 ЭЭГ трактографии
 (диффузионно-тензорная МРТ)

 Симметричная матрица корреляционной
 структурной коннективности
Выбор характеристик матриц/графов

Алгоритмы Снижения размерности/Машинного обучения «могут работать» с:
• 4D-тензорами «всех» временных рядов,
• векторами морфологических характеристик,
• «векторизованными» матрицами коннективности (верхними полуматрицами в
 симметричном случае), и др.

Методы построения векторов информативных признаков по матрицам
коннективности:
• спектральные,
• теоретико-графовые,
• топологические.
Спектральные характеристики матриц

Вход: симметричная NN матрица А = aij , aij  1

Алгоритмы (для симметричных матриц):
 Spectrum: вектор собственных чисел (1, 1, … , N) матрицы;
 Spectrum/Newton: вектор значений последовательности полиномов Ньютона от
 собственных чисел матрицы {Newtonk(1, 1, … , N), k = 1, 2, …},
• Spectrum/Incidence: вектор собственных значений матрицы инцидентности Ah
 (взвешенной матрицы инцидентности Ah,w)
При заданном пороге h: A  матрицу инцидентности Ah = ( > ) или

взвешенную матрицу инцидентности Ah,w = − × ( > )
Спектральные характеристики матриц

 Spectrum/Laplacian: вычисляется вектор из собственных значений матрицы
 Лапласа Lh (или взвешенной матрицы Лапласа Lh,w)

Lh = Dh - Ah (или Lh,w = Dh,w - Ah,w), где Dh (или Dh,w) – диагональная матрица с
диагональными элементами равными суммам элементов в соответствующих строках
матрицы Ah (или матрицы Ah,w)

• Spectrum/Normal_Laplacian: вычисляется вектор из собственных значений
 − / − / 
 нормализованной матрицы Лапласа LNh = × × (или взвешенной
 − / − / 
 нормализованной матрицы Лапласа LNh,w = , × , × , )
Спектральные характеристики матриц

 Диагностика депрессии

Специфичность: вероятность правильно установленного отсутствия заболевания у здоровых людей
Чувствительность: вероятности правильно установленного диагнозов у больных пациентов
Точность: линейная комбинация (у нас полусумма)
Теоретико-графовые характеристики матриц

Вход: при заданным пороге h, построенные по симметричной NN матрице
А = aij , aij  1, неориентированный граф Г(h) (взвешенный граф Гw(h)) с N
вершинами и единичными ребрами (i, j) при aij > h (с весом (1 - aij)).
 Матрица Граф
коннективности коннективности

 Здоровый Больной
Теоретико-графовые характеристики матриц

Алгоритмы:
• Graph: для графа Г(h) (взвешенного графа Гw(h)) вычисляется вектор теоретико-
 графовых характеристик включающий в себя:
  степени всех вершин графа (degree),
  степени «посредничества» вершин (betwenness centrality),
  коэффициенты кластеризации всех вершин графа (clustering coefficient),
  средние степени окрестностей всех вершин графа (average neighborhood degree),
  «глобальные характеристики графа», и др.

Граф с N = 164 вершинами (пакет CONN): вектор теоретико-графовых характеристик
имеет размерность 941
Числа Бетти последовательности графов

• Graph/Betti: для выбранного набора порогов 0 < h1 < h2 < … < hn < 1, вычисляются
 n-мерные векторы
 B0 = (0(Г(h1)), 0(Г(h2)), … , 0(Г(hn))) и B1 = (1(Г(h1)), 1(Г(h2)), … , 1(Г(hn)))
 где
 0(Г) – число связных компонент в графе Г (нулевое число Бетти),
 1(Г) – число циклов в графе Г (первое число Бетти).
Теоретико-графовые характеристики матриц

 Диагностика депрессии
Обнаружение выбросов

 Кривые 1(Г(h)), 0 < h < 1,
 построенные по 100 ФМРТ
 изображениям пациентам
 (с разными патологиями).

 Пациенты 51, 55, 64 – «подозрительные» Пациент 64
Обнаружение неоднородности выборок

 Три выборки пациентов
 • 100 человек
 • 28 человек,
 • 52 человека
 состоящие из 4 подгрупп
 (H, E, D, ED)
Топологические характеристики матриц

 Симметричная матрица Несимметричная матрица
 коннективности А эффективной коннективности А

 Неориентированный Ориентированный граф
 граф коннективности Г(h) эффективной коннективности Г(h)

симплициальный кликовый
 клеточный кликовый
 комплекс XS(h)
 комплекс XC(h)
Топологические характеристики матриц

Алгоритмы:
• Topology/Betti: для выбранного набора порогов 0 < h1 < h2 < … < hn < 1
 вычисляется n-мерный вектор Bk(X) = (k(X(h1)), k(X(h2)), … , k(X(hn))),
 где k(X) – k-е число Бетти* кликового комплекса X, k > 0 – размерность к-й группы
 гомологий.

 *для направленных графов вычисляются числа Бетти комплекса
 направленных клик
Топологические характеристики матриц

• Topology/Persistency: векторизованная гистограмма средних/максимальных
 значений времен жизни к-х классов гомологий комплекса (вычисленных «по Риману»
 и «по Лебегу»), k > 0.

• Topology/Persistency/Entropy: вектор энтропий значений времен жизни к-х
 классов гомологий комплекса , k > 0.
Топологические характеристики симметричных матриц

 Диагностика депрессии

 * 1 класс гомологий комплекса
Топологические характеристики симметричных матриц

 Диагностика депрессии у больных с эпилепсией
 DE vs E
Топологические характеристики несимметричных матриц
Текущие исследования по применениюТопологического анализа
 данных к анализу матриц коннективности

Алгебраическая топология: Пуанкаре (1895)
Торическая топология: Бухштабер, Панов (1998)
– новые алгебро-топологические инварианты
Другие направления исследований по построению
информативных признаков в МРТ/фМРТ изображениях
 для биомедицинских приложений
Локализация функциональных областей мозга для предоперационного
 картирования (по данным МРТ/фМРТ покоя)

Картирование - локализация функциональных областей мозга (речевых,
моторных, зрительных, …) – делается при планировании операции

 Данные фМРТ покоя:
 • показывают все сети покоя
 • нас интересует одна конкретная
 • локализация функциональных зон у здоровых людей известна
Функциональные зоны у здоровых людей

У здоровых людей можно определять функциональные зоны по фМРТ покоя
(Tavor et al., Human Connectome Project (2016).
 Предсказанные активации Реальные активации
Анализ независимых компонент

 Пространственная карта

 Для различных функциональных зон,
 по данным фМРТ покоя здоровых
 людей можно строить паттерны в
 независимых компонентах

 временные ряды

 спектр
Предоперационное планирование у пациентов с глиомами

Анализ Независимых Компонент с ограничениями: по изображению фМРТ
покоя пациента, ищутся воксели, независимые компоненты которых «похожи»
на выявленные паттерны определенных функциональных зон
Картирование для выделения очагов эпилепсии

 Ищутся информативные признаки, позволяющие находить
 на изображениях структурной МРТ очаги эпилепсии

 Локализация очагов эпилепсии (фокальной
 кортикальной дисплазии)
 по морфометрическим признакам
 (аномальная толщина коры, размытие границ между
 серым и белым веществом)
Планирования и предсказания исхода терапии

 Данные трактографии
 (диффузионно-тензорная МРТ)

 Данные структурной МРТ

 Информативные признаки
для планирования и предсказания исхода
 восстановительной терапии после
 ишемического инсульта
Президент РАН Александр Сергеев (День российской науки, 2019):
• в России масштабного проекта по исследованию мозга нет. Наша страна
 значительно отстала в этой области
• чтобы ликвидировать отставание в нейронауках, сосредоточиться на тех
 направлениях, в которых Россия традиционно сильна (математика,
 теоретическая физика, информатика, медицина)
• инициатива: запустить в 2019 году национальный проект по изучению мозга
Заключение

• По нейровизуализационным данным (МРТ/фМРТ/ДТ-МРТ, ЭЭГ) полученным
 при сканировании мозга человека с использованием разных методов и
 программных пакетов строились различные «математические объекты»
 (тензоры, временные ряды, матрицы, графы, комплексы, и др.)

• Для построенных математических объектов был получен ряд характеристик
 (информативных признаков, биомаркеров) с использованием которых
 решались разные прикладные биомедицинские задачи (диагностики,
 локализации «зон интереса», предсказания, и др.) – следовательно,
 найденные характеристики отражают процессы объективно происходящие в
 мозге человека
Заключение

• Методы построения объектов/выявления характеристик реализованы в
 программных инструментах используемых в прикладных биомедицинских
 исследованиях

• Исследования проводились в рамках Биомедицинской Инициативы Сколтеха
 (проект «Машинное обучение и распознавание образов для создания
 диагностического и клинического предсказательного инструментария в
 психиатрии, пограничных состояниях и неврологии», 2017-2019)

• Использовалась Информационно-аналитическая система (платформа)
 CoBrain-Аналитика
СПАСИБО ЗА ВНИМАНИЕ
Вы также можете почитать