Способствуя использованию больших данных! Разработка новых методов изучения данных для искусственного интеллекта

  • Пользователь Алексей Коровин опубликовал
  • 2 февраля 2023 г., 13:51:26 MSK
  • 0 комментариев
  • 36 просмотров
Исследовательская группа разработала новый метод обучения для искусственного интеллекта, который сочетает в себе эффективность классификации данных с несколькими метками и способность постоянно извлекать уроки из данных. Численные эксперименты с реальными данными с несколькими метками показывают, что новый метод превосходит традиционные подходы. Простота этого алгоритма позволяет легко интегрировать его с другими алгоритмами для разработки новых.

Достижения в области технологий Интернета вещей позволили нам легко и постоянно получать большие объемы разнообразных данных. Технология искусственного интеллекта привлекает все больше внимания как инструмент для использования этих больших данных.

Традиционное машинное обучение в основном имеет дело с проблемами классификации по одной метке, в которых данные и соответствующие явления или объекты (информация о метке) находятся во взаимосвязи "один к одному". Однако в реальном мире данные и информация о ярлыках редко имеют однозначную взаимосвязь. Поэтому в последние годы внимание было сосредоточено на проблеме классификации с несколькими метками, которая касается данных, имеющих отношение "один ко многим" между данными и информацией о метке. Например, одна пейзажная фотография может содержать несколько меток для таких элементов, как небо, горы и облака. Кроме того, чтобы эффективно извлекать уроки из больших объемов данных, которые постоянно получаются, также требуется способность учиться с течением времени, не разрушая то, что было изучено ранее.

Исследовательская группа, возглавляемая адъюнкт-профессором Наоки Масуямой и профессором Юсуке Нодзимой из Высшей школы информатики Столичного университета Осаки, разработала новый метод, который сочетает эффективность классификации данных с несколькими метками и возможность постоянного обучения с использованием данных. Численные эксперименты с реальными наборами данных с несколькими метками показали, что предлагаемый метод превосходит традиционные методы.

Простота этого нового алгоритма позволяет легко разработать усовершенствованную версию, которая может быть интегрирована с другими алгоритмами. Поскольку лежащий в основе метод кластеризации группирует данные на основе сходства между элементами данных, ожидается, что он станет полезным инструментом для непрерывной предварительной обработки больших объемов данных. Кроме того, информация о метках, присвоенная каждому кластеру, постоянно изучается с использованием метода, основанного на байесовском подходе. Путем изучения данных и изучения информации о метках, соответствующей данным, отдельно и непрерывно, так что достигается как высокая эффективность классификации, так и возможность непрерывного обучения.

"Мы считаем, что наш метод способен к постоянному обучению на основе данных с несколькими метками и обладает возможностями, необходимыми для искусственного интеллекта в будущем обществе больших данных", - заключил профессор Масуяма.

Комментарии

0 комментариев