Новый метод выявления симметрий в данных с использованием байесовской статистики

  • Пользователь Алексей Коровин опубликовал
  • 23 декабря 2022 г., 14:08:46 MSK
  • 0 комментариев
  • 99 просмотров
Ученые разработали метод выявления симметрий в многомерных данных с использованием байесовских статистических методов. Байесовская статистика в последние годы находится в центре внимания благодаря повышению производительности компьютеров и ее потенциальному применению в области искусственного интеллекта. Однако этот статистический подход требует сложных вычислений интегралов, которые часто считаются только приближениями. В своем новом исследовании исследовательская группа успешно вывела новые точные интегральные формулы. Их результаты способствуют повышению точности методов выявления симметрий данных, возможно, расширяя их применение в более широких областях, представляющих интерес, таких как генетический анализ.

Симметрии в природе делают вещи красивыми; симметрии в данных делают обработку данных эффективной. Однако сложность выявления таких закономерностей в данных всегда ставила исследователей в тупик. Ученые из Столичного университета Осаки и их коллеги сделали важный шаг к обнаружению симметрий в многомерных данных, используя байесовскую статистику. Их выводы были опубликованы в Анналы статистики.

Байесовская статистика в последние годы находится в центре внимания благодаря повышению производительности компьютеров и ее потенциальному применению в области искусственного интеллекта. Байесовская статистика - это статистический подход, который, даже когда данных недостаточно, определяет вероятность наступления события, сначала устанавливая априорную вероятность, а затем, при получении новой информации, вычисляя апостериорную вероятность - обновление априорной вероятности - того, что событие произойдет. Вычисление апостериорных вероятностей требует сложных вычислений интегралов и поэтому часто рассматривается только как приближение.

Международная команда, включающая профессора Хидеюки Иши из Столичного университета Осаки, профессора Петра Грачика из Университета Анже, профессора Бартоша Колод-Зейека из Варшавского технологического университета и покойного профессора Элен Массам из Йоркского университета (Торонто), преуспела в получении новых точных интегральных формул и в разработке метода поиска симметрий в многомерных данных с использованием байесовских статистических методов.

Когда объем обрабатываемых данных увеличивается, оптимальный шаблон должен быть выбран из огромного числа шаблонов, что затрудняет точное решение проблемы. Решая эту проблему, команда также разработала эффективный алгоритм для получения приблизительного решения даже в таких случаях.

По словам профессора Иши, "Симметрии в данных повсеместны в самых разных моделях. Как только симметрии определены, количество параметров, необходимых для отображения структуры данных, и количество выборок, необходимых для определения параметров, может быть значительно сокращено. Ожидается, что в будущем результаты этого исследования внесут вклад в генетический анализ, обнаружив хромосомы, которые выполняют одну и ту же функцию в разных местах".

Комментарии

0 комментариев