Научные рецепты для улучшения вашего продукта с помощью машинного обучения

ФПГ и ЭКГ известны давно и применяются в медицине для проверки пульса и аритмий, а также для диагностики патологий сердца. Но эти методы применялись в основном в клиниках и требуют помощи квалифицированных медицинских работников. Методы получили новое дыхание за последние пять лет по двум причинам: появление этих технологий в носимых устройствах, таких как умные часы, и развитие AI/ML, которые значительно расширили спектр приложений и автоматизированной диагностики. ЭКГ обладает всеми возможностями ФПГ и предоставляет дополнительные. Однако ЭКГ менее доступна для использования, так как требует непосредственного участия пациента — либо аппарата с несколькими электродами, либо необходимо прикосновение рук к измерительным электродам. PPG уже давно используется в смарт-часах и фитнес-браслетах. В последние несколько лет смарт-часы от нескольких производителей, таких как Apple и Samsung, начали измерять ЭКГ.

В этой статье мы попытались сделать простой обзор научных работ, в которых обсуждается использование ИИ/МО для анализа и интерпретации ФПГ и ЭКГ, обратив ваше внимание на разнообразие приложений.

Что такое ФПГ и ЭКГ?

Фотоплетизмография (ФПГ) — это простой оптический метод, используемый для обнаружения объемных изменений крови в периферическом кровообращении. Колебания объема крови соответствуют сердечным сокращениям. Электрокардиограмма (ЭКГ или ЭКГ) — это график зависимости напряжения от времени электрической активности сердца, измеренный с помощью электродов, размещенных на коже. Эти электроды обнаруживают небольшие электрические изменения, возникающие в результате деполяризации сердечной мышцы, за которой следует реполяризация во время каждого сердечного цикла (сердечного сокращения). Изменения в нормальной картине ЭКГ происходят из-за многочисленных сердечных аномалий, включая сердечные аритмии и сердечные приступы. Если вам трудно понять, как отличить ЭКГ от ФПГ, мы рекомендуем подробно изучить следующие ресурсы:

ФПГ и ЭКГ обладают набором ценных функций, используемых для диагностики как терапевтами, так и моделями машинного обучения. Основным из них является частота сердечных сокращений (ЧСС), но более информативной является вариабельность сердечного ритма (ВСР). ВСР – это физиологический феномен изменения временного интервала между ударами сердца. См. Обзор показателей и норм вариабельности сердечного ритма. Существует до 30 различных характеристик ВСР, которые можно разделить на три группы: индексы во временной области, частотные области и нелинейные измерения. Другая группа признаков, специфичных для ЭКГ, — комплекс PQRST. Все зубцы на записи ЭКГ и интервалы между ними имеют предсказуемую продолжительность, диапазон допустимых амплитуд (вольтажей) и типичную морфологию. Изменения в структуре сердца и его окружения (включая состав крови) меняют паттерны этих четырех сущностей. Любое отклонение от нормальной кривой указывает на потенциальную патологию и, следовательно, имеет клиническое значение.

Бустер № 1: нарушения сердечного цикла

Автоматическая диагностика ЭКГ с использованием глубокого обучения

В этой статье предложена архитектура классификации, основанная на сверточных нейронных сетях (CNN), которые в последнее время получили некоторый ажиотаж. База данных состояла из более чем 4000 сигналов ЭКГ. Матрица путаницы, полученная в результате тестирования набора данных, показала точность 99% для нормального класса. Для класса предсердная экстрасистолия сегменты ЭКГ были правильно классифицированы в 100% случаев. Наконец, для класса преждевременное сокращение желудочков сегменты ЭКГ были правильно классифицированы в 96% случаев. В целом, средняя точность классификации составила 98,33%. Чувствительность (SNS) и специфичность (SPC) составляли 98,33% и 98,35% соответственно.

В этой статье авторы представляют неконтролируемый алгоритм обнаружения аномалий временных рядов. Он учится с помощью повторяющихся сетей с долговременной кратковременной памятью (LSTM), чтобы предсказывать нормальное поведение временных рядов. Расстояние Махаланобиса используется как индикатор аномального поведения сигнала временного ряда. В алгоритме LSTM-AD точки с расстоянием Махаланобиса, превышающим указанный порог аномалии, будут помечены как отклоняющиеся. Метод был проверен с помощью хорошо известной ЭКГ MIT-BIH и сопоставлен с современными детекторами аномалий (NuPic, ADVec). Средний показатель F1, который представляет собой гармоническое среднее положительной прогностической ценности и чувствительности для обнаружения аномалий, составил 0,83.

Обнаружение аритмии на уровне кардиолога с помощью машин и глубокого обучения

В Apple Heart Study алгоритм фотоплетизмографического мониторинга Apple Watch был оценен у 419 297 участников и продемонстрировал уровни точности 0,84 и 0,71 и отзыв для фибрилляции предсердий (ФП) соответственно. Но наверняка они не раскрывают используемые алгоритмы AI/ML.

В аналогичном исследовании, проведенном в Китае, скрининг ФП с использованием технологии фотоплетизмографического мониторинга браслета и наручных часов Huawei был оценен у 187 912 человек. А точность и полнота были 0,87 и 92 соответственно.

«В этой статье автоматизированная классификация 12 различных ритмов на уровне кардиолога была получена с помощью модели глубокого обучения с использованием 91 232 ЭКГ в одном отведении от 53 549 пациентов. Средний балл F1 для DNN (0,837) превысил средний балл кардиологов (0,780). Эти результаты демонстрируют, что сквозной подход к глубокому обучению может классифицировать широкий спектр различных аритмий по ЭКГ с одним отведением с высокой диагностической эффективностью, аналогичной эффективности кардиологов.

Бустер № 2: стресс и восстановление

DeStress: глубокое обучение для выявления психического стресса у пожарных

Новая тенденция 2019 года — использование неконтролируемого глубокого обучения для классификации психического стресса, связанного с ВСР, с использованием автокодировщиков. Эта работа использует традиционную кластеризацию K-средних с инженерными функциями во временной и частотной областях, сверточные автокодировщики и автокодировщики с долговременной кратковременной памятью (LSTM). Было продемонстрировано, что кластеры, созданные сверточными автоэнкодерами, последовательно и успешно стратифицируют напряженные и нормальные образцы. Было показано, что существует значительная разница между средним значением RMSSD и отношением LF-HF для кластеров, закодированных с помощью сверточных автоэнкодеров.

Биосигналы в виртуальной реальности (метавселенной?)

Другие авторы применили машину экстремального обучения на основе ядра (K-ELM) для правильной классификации уровней стресса, вызванных задачей VR, на основе фотоплетизмограммы (PPG), электродермальной активности (EDA) и температуры кожи (SKT), чтобы отразить пять различные уровни стресса: исходный уровень, легкий стресс, умеренный стресс, сильный стресс и восстановление. В результате средняя точность классификации превысила 95 %.

Немного более общий обзор пересечения стресса и биосигналов вы можете найти в этой работе.

Бустер №3: фитнес и выносливость

Обнаружение усталости

Используя два типа биосигналов, новый подход обнаруживает начало утомления, сочетая безразмерный глобальный дескриптор усталости (GFD) и поддержку классификатора векторной машины (SVM). Основываясь на девяти основных комбинированных функциях, система обеспечивает характеристики классификации режимов усталости 0,82 ± 0,24, обеспечивая успешную превентивную оценку при достижении опасных уровней усталости.

Бустер № 4: качество сна

Использование частоты сердечных сокращений и последовательных моделей для мониторинга стадий сна

Целью данного исследования было создание доступного и объективного метода мониторинга стадий сна. Стадия сна определялась по рассчитанным значениям характеристик ВСР по ЭКГ. В этом исследовании в качестве классификаторов для определения стадии сна использовались рекуррентная нейронная сеть (RNN), скрытая марковская модель (HMM), нейронная сеть (NN), метод опорных векторов (SVM) и случайный лес (RF). Максимальная скорость распознавания 72 % была достигнута при использовании RNN и HMM с использованием данных о временных рядах наблюдаемых значений.

Использование глубокого обучения с данными ВСР

Сеть с долговременной кратковременной памятью (LSTM) предлагается в качестве решения для моделирования информации об архитектуре долговременного сердечного сна. Это было проверено на всеобъемлющем наборе данных о 292 участниках, 584 ночах, 541 214 аннотированных 30-секундных сегментах сна, включая широкий диапазон возрастов и патологических профилей. Аннотировано в соответствии со стандартом аннотации Rechtschaffen and Kales (R&K). Было показано, что модель превосходит современные подходы, которые часто ограничивались невременными или краткосрочными рекуррентными классификаторами. Модель обеспечивает коэффициент Коэна 0,61 ± 0,15 и точность 77,00 ± 8,90 % для всей базы данных.

Фрактальное свойство ВСР с пониженным шумом и классификация стадий сна

Это исследование было направлено на изучение отличительных признаков, связанных со стадиями сна (бодрствование, легкий сон, глубокий сон) по вариабельности сердечного ритма (ВСР), и оценку их полезности для классификации стадий сна. Авторы изучили последовательность DFA alpha1 (DFSeq), в которой значения DFA (анализ колебаний без тренда) рассчитываются для каждой точки R сигнала ВСР с течением времени. Модель прогнозирования отличала стадию бодрствования от других стадий сна на основе NR-DFAseq и получила чувствительность 77% и специфичность 73%.

Бустер № 5: распознавание эмоций

Аффективные звуки и реакция вариабельности сердечного ритма

В этой статье сообщается, как можно эффективно распознавать эмоциональные состояния, вызванные аффективными звуками, используя исключительно вариабельность сердечного ритма (ВСР). Аффективные звуки были сгруппированы по четырем уровням возбуждения (интенсивности) и двум уровням валентности (неприятные и приятные). 17 признаков ВСР, показывающих значительные изменения между измерениями возбуждения и валентности, были использованы в качестве исходных данных для системы классификации для распознавания четырех классов возбуждения и двух классов валентности. Результаты показали, что квадратичный дискриминантный классификатор смог достичь точности распознавания 84,72 % по валентности и 84,26 % по возбуждению.

Частота сердечных сокращений и распознавание 4 эмоций

Другая статья посвящена исследованию того, можно ли использовать сигналы HR для классификации четырех классов эмоций с помощью модели эмоций Рассела в среде виртуальной реальности (VR), методе опорных векторов. (SVM), K-ближайший сосед (KNN) и случайный лес (RF). Для внутрипредметной классификации все три классификатора, SVM, KNN и RF, достигли 100% как наивысшая точность, в то время как межпредметная классификация достигла 46,7% для SVM, 42,9% для KNN и 43,3% для RF.

Объединение данных ЭКГ и пульсации пальцев для распознавания эмоций

И последнее, но не менее важное: это исследование было направлено на классификацию эмоциональных реакций с использованием простой техники динамической обработки сигналов и структур слияния. Электрокардиограмма и пульсовая активность пальцев у 35 участников были записаны в состоянии покоя и когда испытуемые слушали. к музыке, предназначенной для возбуждения определенных эмоций. Четыре категории эмоций включали счастье, печаль, умиротворение и страх. Оценивая вариабельность сердечного ритма (ВСР) и вариабельность частоты пульса (ВСР), извлекали 4 индекса Пуанкаре в 10 лагах. Для классификации эмоций использовался классификатор опорных векторов. Были рассмотрены схемы слияния как на уровне функций (FL), так и на уровне решений (DL). В обоих случаях скорость классификации улучшилась до 92 % (с чувствительностью 95 % и специфичностью 83,33 %).

Вместо заключения

Этот обзор был направлен на то, чтобы дать вам представление о том, как приложения AI/ML для уже ставшего классическим анализа биосигналов могут открыть возможности продукта. Это стало реальностью с быстрым развитием вычислений ИИ и ориентированного на человека Интернета вещей. Новые функции продуктов, полученные из носимых биосигналов, обладают большим потенциалом для улучшения ваших решений для мониторинга здоровья, благополучия и безопасности.

Neurons Lab строит тесное сотрудничество с продуктовыми компаниями и стартапами, опираясь на глубокие знания в области передовых технологий HealthTech, разработки искусственного интеллекта и дизайнерского мышления. Мы воплощаем ИИ в реальность для наших партнеров, начиная с исследований и стратегии продукта и заканчивая сбором средств, от разработки и запуска продукта до развития опыта компании в области ИИ.

Вы можете связаться с нами по адресу [email protected] или связаться с Полом, автором этой статьи и управляющим директором и партнером Healthcare Practice, напрямую по адресу [email protected].