Искусственный интеллект катализирует исследования по активации генов и раскрывает редкие последовательности ДНК

  • Пользователь Алексей Коровин опубликовал
  • 22 мая 2023 г., 19:01:16 MSK
  • 0 комментариев
  • 53 просмотра
Биологи использовали машинное обучение, разновидность искусственного интеллекта, для идентификации "синтетических экстремальных" последовательностей ДНК со специально разработанными функциями активации генов. Они протестировали 50 миллионов последовательностей ДНК и обнаружили синтетические последовательности ДНК с активностями, которые могли бы быть полезны в биотехнологии и медицине.

Искусственный интеллект стремительно распространился по нашим новостным лентам, а ChatGPT и связанные с ним технологии искусственного интеллекта стали объектом пристального внимания широкой общественности. Помимо популярных чат-ботов, биологи находят способы использовать искусственный интеллект для изучения основных функций наших генов.

Ранее исследователи Калифорнийского университета в Сан-Диего, которые исследуют последовательности ДНК, включающие гены, использовали искусственный интеллект, чтобы идентифицировать загадочный фрагмент головоломки, связанный с активацией генов, фундаментальным процессом, участвующим в росте, развитии и болезнях. Используя машинное обучение, разновидность искусственного интеллекта, профессор Школы биологических наук Джеймс Т. Кадонага и его коллеги обнаружили нижележащую область промотора ядра (DPR), "шлюзовой" код активации ДНК, который участвует в работе до трети наших генов.

Основываясь на этом открытии, Кадонага и исследователи Лонг Во Нгок и Торри Э. Теперь Rhyne использовала машинное обучение для идентификации "синтетических экстремальных" последовательностей ДНК со специально разработанными функциями активации генов. Публикация в журнале Гены и развитие исследователи протестировали миллионы различных последовательностей ДНК с помощью машинного обучения (ИИ), сравнив элемент активации гена DPR у людей и плодовых мушек (Дрозофила). Используя искусственный интеллект, они смогли найти редкие, специально подобранные последовательности DPR, которые активны у людей, но не у плодовых мушек, и наоборот. В более общем плане, этот подход теперь можно было бы использовать для идентификации синтетических последовательностей ДНК с активностями, которые могли бы быть полезны в биотехнологии и медицине.

"В будущем эта стратегия может быть использована для идентификации синтетических экстремальных последовательностей ДНК с практическим и полезным применением. Вместо сравнения людей (условие X) и плодовых мушек (условие Y) мы могли бы протестировать способность препарата A (условие X), но не препарата B (условие Y) активировать ген", - сказал Кадонага, заслуженный профессор кафедры молекулярной биологии. "Этот метод также может быть использован для поиска специально подобранных последовательностей ДНК, которые активируют ген в ткани 1 (условие X), но не в ткани 2 (условие Y). Существует бесчисленное множество практических применений этого подхода, основанного на искусственном интеллекте. Синтетические экстремальные последовательности ДНК могут быть очень редкими, возможно, одна на миллион - если они существуют, их можно было бы найти с помощью искусственного интеллекта".

Машинное обучение - это отрасль искусственного интеллекта, в которой компьютерные системы постоянно совершенствуются и обучаются на основе данных и опыта. В новом исследовании Кадонага, Во Нгок (бывший постдокторант Калифорнийского университета в Сан-Диего, ныне работающий в Velia Therapeutics) и Райн (штатный научный сотрудник) использовали метод, известный как регрессия опорных векторов, для "обучения" моделей машинного обучения с 200 000 установленными последовательностями ДНК на основе данных реальных лабораторных экспериментов. Это были цели, представленные в качестве примеров для системы машинного обучения. Затем они "скормили" 50 миллионов тестовых последовательностей ДНК системам машинного обучения для людей и плодовых мушек и попросили их сравнить последовательности и идентифицировать уникальные последовательности в двух огромных наборах данных.

В то время как системы машинного обучения показали, что последовательности человека и плодовой мушки в значительной степени совпадают, исследователи сосредоточились на основном вопросе о том, могут ли модели искусственного интеллекта идентифицировать редкие случаи, когда активация генов очень активна у людей, но не у плодовых мушек. Ответом было громкое "да". Моделям машинного обучения удалось идентифицировать специфичные для человека (и плодовой мушки) последовательности ДНК. Важно отметить, что предсказанные искусственным интеллектом функции экстремальных последовательностей были проверены в лаборатории Кадонаги с использованием обычных методов тестирования (влажная лаборатория).

"Прежде чем приступить к этой работе, мы не знали, достаточно ли "умны" модели искусственного интеллекта, чтобы предсказать активность 50 миллионов последовательностей, особенно выделяющихся "экстремальных" последовательностей с необычной активностью. Итак, это очень впечатляет и весьма примечательно, что модели искусственного интеллекта смогли предсказать активность редких экстремальных последовательностей, встречающихся один раз на миллион", - сказал Кадонага, который добавил, что было бы практически невозможно провести сопоставимые 100 миллионов лабораторных экспериментов, которые технология машинного обучения проанализировала после каждого мокрого эксперимента. завершение лабораторного эксперимента заняло бы почти три недели.

Редкие последовательности, идентифицированные системой машинного обучения, служат успешной демонстрацией и закладывают основу для других применений машинного обучения и других технологий искусственного интеллекта в биологии.

"В повседневной жизни люди находят новые приложения для инструментов искусственного интеллекта, таких как ChatGPT. Здесь мы продемонстрировали использование искусственного интеллекта для создания индивидуальных элементов ДНК при активации генов. Этот метод должен иметь практическое применение в биотехнологии и биомедицинских исследованиях", - сказал Кадонага. "В более широком смысле биологи, вероятно, находятся в самом начале освоения возможностей технологии искусственного интеллекта".

Комментарии

0 комментариев