Депрессия - одно из самых распространенных психических заболеваний. Около 280 миллионов человек во всем мире страдают от этого заболевания, именно поэтому исследователи из Каунасского технологического университета (KTU) разработали модель искусственного интеллекта (ИИ), которая помогает выявлять депрессию на основе как речи, так и нейронной активности мозга. Этот мультимодальный подход, объединяющий два различных источника данных, позволяет проводить более точный и объективный анализ эмоционального состояния человека, открывая путь к новому этапу диагностики депрессии.
"Депрессия - одно из самых распространенных психических расстройств, имеющее разрушительные последствия как для личности, так и для общества, поэтому мы разрабатываем новый, более объективный метод диагностики, который в будущем может стать доступным для всех", - говорит Ритис Маскелюнас, профессор КТУ и один из авторов изобретения.
Ученые утверждают, что в то время как большинство диагностических исследований депрессии традиционно основывались на одном типе данных, новый мультимодальный подход может предоставить более полную информацию об эмоциональном состоянии человека.
Впечатляющая точность при использовании данных о голосе и мозговой активности
Такое сочетание данных о речи и мозговой активности позволило достичь впечатляющей точности в диагностике депрессии - 97,53%, что значительно превосходит альтернативные методы. "Это связано с тем, что голос добавляет к исследованию данные, которые мы пока не можем извлечь из мозга", - объясняет Маскелюнас.
По словам Мусияба Юсуфи, аспиранта КТУ, который участвовал в разработке изобретения, выбор данных был тщательно продуман: "Хотя считается, что выражения лица могут больше рассказать о психологическом состоянии человека, но эти данные довольно легко фальсифицируются. Мы выбрали голос, потому что он может тонко передать эмоциональное состояние, а диагноз влияет на темп речи, интонацию и общую энергетику".
Кроме того, в отличие от электрической активности мозга (ЭЭГ) или голосовых данных, по лицу можно напрямую определить степень тяжести состояния человека до определенной степени. "Но мы не можем нарушать конфиденциальность пациентов, к тому же сбор и объединение данных из нескольких источников является более перспективным для дальнейшего использования", - говорит профессор факультета информатики КТУ (IF).
Маскелюнас подчеркивает, что использованный набор данных ЭЭГ был получен из мультимодального открытого набора данных для анализа психических расстройств (MODMA), поскольку исследовательская группа КТУ представляет компьютерные науки, а не медицинскую науку.
Данные ЭЭГ MODMA собирались и записывались в течение пяти минут, пока участники бодрствовали, находились в состоянии покоя и с закрытыми глазами. В аудиовизуальной части эксперимента пациенты участвовали в сеансе вопросов и ответов, а также в нескольких упражнениях, направленных на чтение и описание картинок, чтобы передать свой естественный язык и когнитивное состояние.
ИИ должен будет научиться обосновывать свой диагноз
Собранные ЭЭГ- и аудиосигналы были преобразованы в спектрограммы, позволяющие визуализировать полученные данные. Были применены специальные шумовые фильтры и методы предварительной обработки, чтобы данные не зашумлялись и были сопоставимы, а для выявления признаков искажения изображений использовалась модифицированная модель глубокого обучения DenseNet-121. Отраженный сигнал на каждом изображении меняется со временем. ЭЭГ показывала сигналы мозговой активности, а звук - распределение частот и интенсивности.
Модель включала пользовательский уровень классификации, обученный разделять данные на классы здоровых людей и людей, страдающих депрессией. Была проведена оценка успешной классификации, а затем была оценена точность применения.
В будущем эта модель искусственного интеллекта может ускорить диагностику депрессии или даже сделать ее удаленной, а также снизить риск субъективных оценок. Для этого необходимы дальнейшие клинические испытания и усовершенствования программы. Однако Маскелюнас добавляет, что последний аспект исследования может вызвать некоторые трудности.
"Основная проблема этих исследований заключается в недостатке данных, поскольку люди, как правило, не разглашают информацию о своем психическом здоровье", - говорит он.
Еще одним важным аспектом, упомянутым профессором кафедры мультимедийной инженерии КТУ, является то, что алгоритм необходимо усовершенствовать таким образом, чтобы он был не только точным, но и предоставлял медицинскому работнику информацию о том, что привело к такому результату диагностики. "Алгоритму еще предстоит научиться доходчиво объяснять диагноз", - говорит Маскелюнас.
По словам профессора КТУ, в связи с растущим спросом на решения в области искусственного интеллекта, которые напрямую влияют на людей в таких областях, как здравоохранение, финансы и правовая система, подобные требования становятся все более распространенными.
Вот почему объяснимый искусственный интеллект (XAI), цель которого - объяснить пользователю, почему модель принимает те или иные решения, и повысить его доверие к ИИ, сейчас набирает обороты.
Комментарии