Балансирование обучающих данных и человеческих знаний заставляет ИИ действовать больше как ученый

  • Пользователь Алексей Коровин опубликовал
  • 11 марта 2024 г., 16:45:31 MSK
  • 0 комментариев
  • 15 просмотров
Когда вы учите ребенка решать головоломки, вы можете либо позволить ему разобраться в этом методом проб и ошибок, либо дать ему несколько основных правил и советов. Аналогичным образом, включение правил и подсказок в обучение ИИ, таких как законы физики, могло бы сделать их более эффективными и в большей степени отражающими реальный мир. Однако помочь ИИ оценить ценность различных правил может оказаться сложной задачей.

Когда вы учите ребенка решать головоломки, вы можете либо позволить ему разобраться в этом методом проб и ошибок, либо дать ему несколько основных правил и советов. Аналогичным образом, включение правил и подсказок в обучение ИИ, таких как законы физики, могло бы сделать их более эффективными и в большей степени отражающими реальный мир. Однако помочь ИИ оценить ценность различных правил может оказаться сложной задачей.

Исследователи сообщают об этом 8 марта в журнале Связь что они разработали структуру для оценки относительной ценности правил и данных в "моделях информированного машинного обучения", которые включают в себя и то, и другое. Они показали, что, поступая таким образом, они могли бы помочь искусственному интеллекту учитывать основные законы реального мира и лучше ориентироваться в научных задачах, таких как решение сложных математических задач и оптимизация экспериментальных условий в химических экспериментах.

"Внедрение человеческих знаний в модели искусственного интеллекта потенциально может повысить их эффективность и способность делать выводы, но вопрос в том, как сбалансировать влияние данных и знаний", - говорит первый автор Хао Сюй из Пекинского университета. "Наш фреймворк может быть использован для оценки различных знаний и правил, чтобы повысить прогностические возможности моделей глубокого обучения".

Модели генеративного искусственного интеллекта, такие как ChatGPT и Sora, основаны исключительно на данных - моделям предоставляются обучающие данные, и они обучаются сами методом проб и ошибок. Однако, имея для работы только данные, эти системы не имеют возможности изучать физические законы, такие как гравитация или гидродинамика, и им также трудно работать в ситуациях, которые отличаются от их тренировочных данных. Альтернативным подходом является информированное машинное обучение, при котором исследователи предоставляют модели некоторые базовые правила, помогающие управлять процессом обучения, но мало что известно об относительной важности правил по сравнению с данными для определения точности модели.

"Мы пытаемся обучить модели искусственного интеллекта законам физики, чтобы они могли лучше отражать реальный мир, что сделало бы их более полезными в науке и инженерии", - говорит старший автор Юньтянь Чен из Восточного технологического института в Нинбо.

Чтобы повысить производительность информированного машинного обучения, команда разработала структуру для расчета вклада отдельного правила в точность прогнозирования данной модели. Исследователи также изучили взаимодействие между различными правилами, поскольку большинство моделей информированного машинного обучения включают в себя несколько правил, а слишком большое количество правил может привести к сбою моделей.

Это позволило им оптимизировать модели, изменяя относительное влияние различных правил и полностью отфильтровывая избыточные или мешающие правила. Они также определили некоторые правила, которые работали синергетически, и другие правила, которые полностью зависели от присутствия других правил.

"Мы обнаружили, что правила имеют различные виды взаимосвязей, и мы используем эти взаимосвязи, чтобы ускорить обучение модели и получить более высокую точность", - говорит Чен.

Исследователи говорят, что их система имеет широкое практическое применение в инженерии, физике и химии. В статье они продемонстрировали потенциал метода, используя его для оптимизации моделей машинного обучения для решения многомерных уравнений и прогнозирования результатов экспериментов по тонкослойной хроматографии и, таким образом, оптимизации будущих условий экспериментальной химии.

Далее исследователи планируют превратить свой фреймворк в инструмент-плагин, который может использоваться разработчиками искусственного интеллекта. В конечном счете, они также хотят обучить свои модели таким образом, чтобы модели могли извлекать знания и правила непосредственно из данных, а не использовать правила, выбранные исследователями-людьми.

"Мы хотим сделать это замкнутым циклом, превратив модель в настоящего ученого в области искусственного интеллекта", - говорит Чен. "Мы работаем над разработкой модели, которая может напрямую извлекать знания из данных, а затем использовать эти знания для создания правил и самосовершенствования".

Это исследование было поддержано Национальным центром прикладной математики Шэньчжэня, Шэньчжэньской ключевой лабораторией гидратов природного газа, Научно-исследовательским институтом новых энергетических технологий SUSTech - Qingdao и Национальным фондом естественных наук Китая.

Комментарии

0 комментариев