Исследование: Новейшая ИИ-модель Apple определяет состояния здоровья с точностью до 92 %

Новое исследование при поддержке Apple утверждает, что ваши данные о поведении (движение, сон, физические нагрузки и т. д.) часто могут быть более сильным сигналом о состоянии здоровья, чем традиционные биометрические показатели, такие как частота сердечных сокращений или уровень кислорода в крови. Чтобы доказать это, исследователи разработали базовую модель, обученную на данных о поведении, собранных с носимых устройств, и она показала удивительно хорошие результаты. Вот подробности.

Этот препринт, «Beyond Sensor Data: Foundation Models of Behavioral Data from Wearables Improve Health Predictions» (Базовые модели поведенческих данных с носимых устройств улучшают прогнозы здоровья), является результатом Исследования Apple Heart and Movement Study (AHMS). Они обучили новую базовую модель на более чем 2,5 миллиардах часов данных с носимых устройств, продемонстрировав, что она может соответствовать (и даже превосходить) существующие модели, построенные на данных датчиков низкого уровня.

Новую модель они называют WBM, что означает Wearable Behavior Model (Модель поведения носимых устройств). И хотя предыдущие базовые модели, связанные со здоровьем, в основном полагались на необработанные потоки данных от датчиков, таких как датчик сердечного ритма Apple Watch (PPG, или фотоплетизмограф) или его электрокардиограф (ЭКГ), WBM учится непосредственно на поведенческих показателях более высокого уровня: подсчет шагов, стабильность походки, подвижность, VO₂ max и так далее. Все это Apple Watch производит в изобилии.

Но если у Apple Watch есть эти датчики, зачем нужна новая модель?

Отличный вопрос. И ответ содержится в исследовании:

«Потребительские носимые устройства, такие как смарт-часы и фитнес-трекеры, предоставляют богатую информацию по различным областям здоровья (…). Важным аспектом мониторинга здоровья является определение статичного состояния здоровья — например, имеет ли кто-то историю курения, поставлен ли диагноз гипертонии в прошлом или принимает ли он бета-блокатор. Другая критически важная проблема — определение преходящего состояния здоровья, такого как качество сна человека или факт беременности. Ключевым свойством данных, необходимых для таких прогнозов, является то, что они обычно имеют временное разрешение человеческого поведения (например, дни и недели), а не временное разрешение низкого уровня (например, секунды), на котором собираются необработанные данные датчиков с носимых устройств (…).

Хотя большинство прошлых работ рассматривали моделирование необработанных данных датчиков (или простых признаков из них), поведенческая информация более высокого уровня от носимых устройств, такая как физическая активность, сердечно-сосудистая подготовка и показатели подвижности, является естественным типом данных, помогающим решать эти задачи. В отличие от необработанных датчиков, эти поведенческие метрики более высокого уровня рассчитываются с помощью тщательно проверенных алгоритмов, полученных из необработанных датчиков. Эти метрики намеренно выбраны экспертами, чтобы соответствовать физиологически значимым величинам и состояниям здоровья. Важно отметить, что эти данные чувствительны к поведению человека, а не обусловлены исключительно физиологией. Эти характеристики делают поведенческие данные особенно перспективными для таких задач обнаружения состояний здоровья. Например, показатели подвижности, характеризующие походку и общий уровень активности, могут быть важными поведенческими факторами, помогающими выявить меняющееся состояние здоровья, такое как беременность.»

Другими словами, хотя Apple Watch собирает необработанные данные с датчиков, эти данные могут быть зашумленными, чрезмерными и не всегда совпадать со значимыми событиями, связанными со здоровьем.

В то время как метрики, используемые WBM, основаны на этих данных датчиков, данные обрабатываются для выделения реального поведения и тенденций, связанных со здоровьем. Они более стабильны, легче интерпретируются и лучше структурированы для моделирования долгосрочных тенденций в области здоровья.

На практике WBM учится на закономерностях, обнаруженных в обработанных поведенческих данных, а не полагается напрямую на необработанные сигналы датчиков.

Технические подробности

WBM была обучена на данных Apple Watch и iPhone от 161 855 участников AHMS. Вместо необработанных потоков модели было предоставлено 27 понятных человеку поведенческих метрик, таких как активная энергия, темп ходьбы, вариабельность сердечного ритма, частота дыхания и продолжительность сна.

Данные были разбиты на еженедельные блоки и переданы новой архитектуре, построенной на Mamba-2, которая лучше подходит для этого случая использования, чем традиционные Трансформеры (основа GPT).

При оценке на 57 задачах, связанных со здоровьем, WBM превзошла сильную модель на основе PPG в 18 из 47 задач прогнозирования статических состояний здоровья (например, принимает ли человек бета-блокаторы) и во всех, кроме одной, динамических задач (например, определение беременности, качества сна или респираторной инфекции). Исключением стал диабет, в котором PPG показал лучшие результаты.

Еще лучше: объединение данных WBM и PPG дало наиболее точные результаты в целом. Гибридная модель достигла впечатляющих 92 % точности в определении беременности и показала стабильный прирост в задачах, связанных с качеством сна, инфекциями, травмами и сердечно-сосудистыми заболеваниями, такими как определение мерцательной аритмии (Afib).

В конечном итоге исследование не пытается заменить данные датчиков с помощью WBM, а скорее дополнить их. Такие модели, как WBM, улавливают долгосрочные поведенческие сигналы, в то время как PPG улавливает краткосрочные физиологические изменения. Но вместе они лучше выявляют значимые изменения в состоянии здоровья на ранней стадии.

Если вы хотите узнать больше об исследовании Apple Heart and Movement Study и других исследованиях, мы вас осветили.

Скидки на AirPods на Amazon