Максимально использовать совсем немного: улучшение обучения ИИ для временных рядов пограничных датчиков

  • Пользователь Алексей Коровин опубликовал
  • 23 декабря 2022 г., 13:50:51 MSK
  • 0 комментариев
  • 57 просмотров
Инженеры продемонстрировали простой вычислительный подход для улучшения способа обучения классификаторов искусственного интеллекта, таких как нейронные сети, на основе ограниченных объемов данных датчиков. Появляющиеся приложения интернета вещей часто требуют периферийных устройств, которые могут надежно классифицировать поведение и ситуации на основе временных рядов. Однако данные для обучения получить сложно и дорого. Предлагаемый подход обещает существенно повысить качество обучения классификаторов практически без дополнительных затрат.

Инженеры Токийского технологического института (Tokyo Tech) продемонстрировали простой вычислительный подход для улучшения способа обучения классификаторов искусственного интеллекта, таких как нейронные сети, на основе ограниченных объемов данных датчиков. Появляющиеся приложения интернета вещей часто требуют периферийных устройств, которые могут надежно классифицировать поведение и ситуации на основе временных рядов. Однако данные для обучения получить сложно и дорого. Предлагаемый подход обещает существенно повысить качество обучения классификаторов практически без дополнительных затрат.

В последнее время перспектива наличия огромного количества датчиков Интернета вещей (IoT), тихо и усердно отслеживающих бесчисленные аспекты человеческой, природной и машинной деятельности, получила все большее распространение. По мере того, как наше общество становится все более и более нуждающимся в данных, ученые, инженеры и стратеги все больше надеются, что дополнительная информация, которую мы можем извлечь из этого всеобъемлющего мониторинга, улучшит качество и эффективность многих производственных процессов, что также приведет к повышению устойчивости.

Мир, в котором мы живем, невероятно сложен, и эта сложность отражается в огромном множестве переменных, для мониторинга которых могут быть разработаны датчики Интернета вещей. Некоторые из них являются естественными, такими как количество солнечного света, влажность или движение животного, в то время как другие являются искусственными, например, количество автомобилей, пересекающих перекресток, или нагрузка, приложенная к подвесной конструкции, такой как мост. Общим для всех этих переменных является то, что они развиваются с течением времени, создавая так называемые временные ряды, и ожидается, что в их постоянных изменениях будет содержаться значимая информация. Во многих случаях исследователи заинтересованы в классификации набора заранее определенных условий или ситуаций на основе этих временных изменений, чтобы уменьшить объем данных и облегчить их понимание. Например, измерение частоты возникновения конкретного состояния или ситуации часто берется за основу для обнаружения и понимания происхождения неисправностей, увеличения загрязнения и так далее.

Некоторые типы датчиков измеряют переменные, которые сами по себе изменяются очень медленно с течением времени, такие как влажность. В таких случаях возможно передавать каждое отдельное считывание по беспроводной сети на облачный сервер, где происходит анализ больших объемов агрегированных данных. Однако все больше и больше приложений требуют измерения переменных, которые изменяются довольно быстро, таких как ускорения, отслеживающие поведение животного или повседневную активность человека. Поскольку часто требуется много показаний в секунду, передача необработанных данных по беспроводной сети становится непрактичной или невозможной из-за ограничений доступной энергии, платы за передачу данных и, в удаленных местах, пропускной способности. Чтобы обойти эту проблему, инженеры по всему миру уже давно ищут умные и эффективные способы перенести аспекты анализа данных из облака в сами сенсорные узлы. Это часто называют пограничным искусственным интеллектом или пограничным ИИ. В общих чертах идея состоит в том, чтобы отправлять по беспроводной сети не необработанные записи, а результаты алгоритма классификации, выполняющего поиск конкретных условий или ситуаций, представляющих интерес, что приводит к гораздо более ограниченному объему данных с каждого узла.

Однако предстоит столкнуться со многими проблемами. Некоторые из них являются физическими и обусловлены необходимостью разместить хороший классификатор в том, что обычно является довольно ограниченным пространством и весом, и часто заставляют его работать на очень небольшом количестве энергии, чтобы обеспечить длительное время автономной работы. "Хорошие инженерные решения для удовлетворения этих требований появляются каждый день, но реальная проблема, сдерживающая многие реальные решения, на самом деле заключается в другом. Точность классификации часто просто недостаточна, и обществу требуются надежные ответы, чтобы начать доверять технологии", - говорит доктор Хироюки Ито, руководитель подразделения наноразведки, где проводилось исследование. "Многие примеры применения искусственного интеллекта, такие как самоуправляемые автомобили, показали, что то, насколько хорош или плох искусственный классификатор, в значительной степени зависит от качества данных, используемых для его обучения. Но чаще всего данные временных рядов датчиков действительно требовательны и дороги для получения в полевых условиях. Например, рассматривая мониторинг поведения крупного рогатого скота, для приобретения ИТ-инженерам необходимо проводить время на фермах, настраивая отдельных коров и заставляя экспертов терпеливо комментировать их поведение на основе видеоматериалов", - добавляет соавтор доктор Коркут Каан Токгоз, ранее работавший в том же исследовательском подразделении, а теперь в Университете Сабанчи в Турции.

Вследствие того факта, что обучающие данные настолько ценны, инженеры начали искать новые способы максимально использовать даже довольно ограниченный объем данных, доступных для обучения передовых устройств искусственного интеллекта. Важной тенденцией в этой области является использование методов, известных как "увеличение данных", при которых к записанным данным применяются некоторые манипуляции, которые считаются разумными на основе опыта, чтобы попытаться имитировать изменчивость и неопределенность, с которыми можно столкнуться в реальных приложениях. "Например, в нашей предыдущей работе мы смоделировали непредсказуемое вращение ошейника, содержащего датчик ускорения, вокруг шеи контролируемой коровы и обнаружили, что дополнительные данные, сгенерированные таким образом, действительно могут улучшить эффективность классификации поведения", - объясняет г-жа Чао Ли, докторант и ведущий автор исследования. исследование [1]. "Однако мы также поняли, что нам нужен гораздо более общий подход к увеличению временных рядов датчиков, который в принципе можно было бы использовать для любого вида данных и не делать конкретных предположений об условиях измерения. Более того, в реальных ситуациях на самом деле существуют две проблемы, связанные, но разные. Первая заключается в том, что общий объем обучающих данных часто ограничен. Во-вторых, некоторые ситуации или условия возникают гораздо чаще, чем другие, и это неизбежно. Например, коровы, естественно, проводят гораздо больше времени в отдыхе или размышлениях, чем в питье. Тем не менее, точное измерение менее частых форм поведения весьма важно для правильного определения социального статуса животного. Корова, которая не пьет, наверняка сдастся, даже если учесть, что точность классификации питья может оказать незначительное влияние на общепринятые подходы к обучению из-за его редкости. Это называется проблемой дисбаланса данных", - добавляет она.

Вычислительное исследование, проведенное исследователями Токийского технологического института и первоначально нацеленное на улучшение мониторинга поведения крупного рогатого скота, предлагает возможное решение этих проблем путем объединения двух очень разных и взаимодополняющих подходов. Первый известен как выборка и состоит из извлечения "фрагментов" временных рядов, соответствующих условиям, подлежащим классификации, всегда начиная с разных и случайных моментов времени. Количество извлекаемых фрагментов тщательно настраивается, гарантируя, что в итоге всегда получается примерно одинаковое количество фрагментов для всех классифицируемых поведений, независимо от того, насколько они распространены или редки. Это приводит к более сбалансированному набору данных, который определенно предпочтительнее в качестве основы для обучения любого классификатора, такого как нейронная сеть. Поскольку процедура основана на выборе подмножеств фактических данных, она безопасна с точки зрения предотвращения генерации артефактов, которые могут возникнуть в результате искусственного синтеза новых фрагментов, чтобы компенсировать менее представленное поведение. Второй метод известен как суррогатные данные и включает в себя очень надежную числовую процедуру для генерации из любого существующего временного ряда любого количества новых, которые сохраняют некоторые ключевые характеристики, но полностью некоррелированы. "Эта добродетельная комбинация оказалась очень важной, потому что выборка может привести к большому дублированию одних и тех же данных, когда определенные модели поведения слишком редки по сравнению с другими. Суррогатные данные никогда не бывают одинаковыми и предотвращают эту проблему, которая может очень негативно повлиять на процесс обучения. И ключевым аспектом этой работы является то, что расширение данных интегрировано с процессом обучения, поэтому различные данные всегда представляются сети на протяжении всего обучения", - объясняет г-н Джим Бартельс, соавтор и докторант подразделения.

Суррогатные временные ряды генерируются путем полного скремблирования фаз одного или нескольких сигналов, что делает их полностью неузнаваемыми при рассмотрении их изменений с течением времени. Однако распределение значений, автокорреляция и, при наличии нескольких сигналов, перекрестная корреляция прекрасно сохраняются. "В другой предыдущей работе мы обнаружили, что многие эмпирические операции, такие как обращение вспять и рекомбинация временных рядов, на самом деле помогли улучшить обучение. Поскольку эти операции изменяют нелинейное содержание данных, позже мы пришли к выводу, что линейные характеристики, которые сохраняются во время генерации суррогата, вероятно, являются ключевыми для производительности, по крайней мере, для применения распознавания поведения коров, на котором я фокусируюсь", - далее объясняет г-жа Чао Ли [2]. "Метод суррогатных временных рядов происходит из совершенно другой области, а именно из изучения нелинейной динамики в сложных системах, таких как мозг, для которых такие временные ряды используются, чтобы помочь отличить хаотическое поведение от шума. Объединив наш различный опыт, мы быстро поняли, что он может быть полезен и для этого приложения", - добавляет доктор Людовико Минати, второй автор исследования, а также сотрудник Nano Sensing Unit. "Однако необходима значительная осторожность, поскольку не бывает двух одинаковых сценариев применения, и то, что справедливо для временных рядов, отражающих поведение коров, может оказаться неверным для других датчиков, отслеживающих различные типы динамики. В любом случае, элегантность предлагаемого метода заключается в том, что он весьма существенен, прост и универсален. Таким образом, другим исследователям будет легко быстро опробовать его на своих конкретных проблемах", - добавляет он.

После этого интервью команда объяснила, что этот тип исследований будет применен в первую очередь для улучшения классификации поведения крупного рогатого скота, для чего он изначально предназначался и по которому подразделение проводит междисциплинарные исследования в партнерстве с другими университетами и компаниями. "Одна из наших главных целей - успешно продемонстрировать высокую точность на небольшом недорогом устройстве, которое может контролировать корову на протяжении всей ее жизни, позволяя своевременно выявлять заболевания и, следовательно, действительно улучшать не только благополучие животных, но и эффективность и устойчивость ведения сельского хозяйства", - заключает доктор Хироюки Ито. Методология и результаты описаны в недавней статье, опубликованной в журнале Датчики IEEE [3].

Комментарии

0 комментариев