Думка гостей: Протягом останніх кількох десятиліть відео технологія пройшла довгий шлях, не в останню чергу через прогрес у відео -аналітиці, і AI, що робить це можливим. Однак, хоча прогнозується, що ринок AI досягне уваги до 2030 року на 1,3 трлн дол. Так звані синтетичні дані можуть бути відповіддю.
Піонерська робота так званих «хрещених батьків AI», лауреатів премії 2018 року Йошуа Бенсіо, Джеффрі Хінтон та Янн Лекун, разом із створенням Фей-Фей Лі, допомагали закласти основу для сучасного AI, особливо в комп’ютерному баченні (CV). Це особливо актуально для датчиків, які створюють дані про зображення, такі як відео, і він розблокував безліч нових можливостей для підвищення безпеки наших міст, транспорту, роздрібних магазинів тощо.
Через ШІ, організації тепер можуть отримати глибші уявлення, щоб інформувати свої стратегії та приймати кращі рішення щодо того, де побудувати нову дорогу, яку продукцію розміщувати на певній полиці магазину та як планувати графіки технічного обслуговування чи прибирання. Це справді сміливий новий світ, перетворений поєднанням відео та AI.
Точний AI вимагає великих наборів даних про навчання
Однак, щоб зробити ці моделі AI максимально точними, потрібні тренування з величезними наборами даних. Набори даних, що використовуються для підготовки моделей AI, повинні бути репрезентативними, різноманітними для забезпечення точності та справедливості, а також юридично отримано для поважних прав власників даних. У міру розвитку AI потреба у цих великих (частково) анотованих наборах даних стає більш натисканням, а отримання цих даних не завжди просто. Особливо при роботі з такими датчиками, як камери, які можуть зібрати багато особистої чи конфіденційної інформації. Безпека, конфіденційність та практичні обмеження можуть обмежувати кількість та якість даних, з якими можна навчити ШІ.
Тут синтетичні дані вступають у відкриття нових можливостей.
Рішення, пропоноване синтетичними даними
Синтетичні дані стосуються штучно генерованих або доповнених наборів даних, що імітують умови реального світу. Використовуючи ці дані, розробники AI можуть навчати моделі на величезну кількість різноманітної та репрезентативної інформації, при цьому пом'якшуючи етичні та юридичні проблеми, пов'язані з конфіденційністю та згодою. Більше того, синтетичні дані можуть зберегти ключові характеристики в реальному світі, гарантуючи, що моделі навчаються з реалістичного середовища, не потребуючи піддавати людей ризику-і це готове до використання джерела, яке може прискорити час розвитку алгоритму.
Більше того, синтетичні дані можуть допомогти зменшити зміщення в моделях AI. Традиційні набори даних часто формуються за допомогою упереджень, присутніх в оригінальному процесі збору даних, що може перекосити результати прийняття рішень AI. Розробляючи процеси збору синтетичних даних, розробники можуть мінімізувати упередження, що виникають, покладаючись на історичні набори даних.
Нарешті, синтетичні дані масштабовані та економічно ефективні. Це дозволяє розробникам AI швидко та доступно створювати величезні, різноманітні набори даних, що особливо корисно для завдань, які потребують конкретних високоякісних даних, які недоступні.
Виїзд у дії: Захист датських гавань
Потенційна роль синтетичних даних у поліпшенні безпеки та збереження життя можна побачити в дослідницькому проекті в Данії, де моделі AI, що використовуються для виявлення когось, що потрапляють у гавань, пройшли навчання на різних наборах даних, включаючи синтетичні дані.
На жаль, датські гавані протягом багатьох років були свідками численних випадків утоплення, а 1647 життів втратили між 2001 та 2015 роками у датських водах, а чверть цих трагедій, що відбуваються в самих гаванах.
В одному з найпотужніших портів Данії, аалборг-гавань, дослідники створили найбільший на відкритому повітрі термічний набір даних для відео-аналітики, щоб забезпечити відеокамери, обладнані AI, для виявлення різних типів об'єктів у термічній установці. Щоб покрити випадки падіння, добровольців попросили впасти у воду. Однак це було занадто небезпечно, щоб попросити людських волонтерів зробити це. Більше того, стрибки в гавань відрізняється від того, що хтось випадково втрачає основу та потрапляння. Дослідникам також потрібен був репрезентативний набір даних для покриття користувачів інвалідних візків, велосипедистів та скейтбордистів.
Розігріті манекени використовувались для імітації людських тіл, але знову ж таки, не могли повністю захопити повну складність людини, що потрапляє в гавань. Тому найкращим рішенням були синтетичні дані, які могли моделювати більш хитру поведінку та різноманітні сценарії падіння.
Використовуючи синтетичні дані, проект розширив свій навчальний набір даних без порушення безпеки чи етичних проблем. Модель AI, розроблена за допомогою цього процесу, показує перспективні результати для попередження рятувальних груп, якщо і коли людина потрапила в гавань, збільшуючи шанси на виживання, мінімізуючи час відгуку та зменшуючи вплив холодної води.
Ширші програми для синтетичних даних
Відео -аналітика є всюдисущою в декількох галузях, і те саме стосується синтетичних даних, з якими він навчається. Подальші випадки використання включають виготовлення, де синтетичні моделі AI-підготовки AI можуть забезпечити правильне функціонування автоматизованих виробничих ліній. AI може виявити аномалії у виробництві або потенційному збої обладнання. Збір великої кількості кадрів виробничої лінії може бути ризикованим, враховуючи конфіденційну інформацію про виробничі методи та компоненти.
Синтетичні дані також можуть бути корисними в умовах охорони здоров’я, де конфіденційність пацієнта є першорядною, а збору даних про навчання для таких сценаріїв, як падіння, може бути занадто складним. Це може допомогти навчити моделі виявити, коли пацієнт з деменцією втрачається і блукає по залах лікарні, або, наприклад, попередити персонал, коли пацієнт з догляду за доглядом випало з ліжка.
Зростаюча можливість
Оскільки ми свідками більше використання AI у відео та інших програмах, так і ми можемо очікувати зростання використання синтетичних даних. Забезпечуючи безпечне, етичне та масштабоване джерело даних, ці дані можуть бути найкращим варіантом у деяких ситуаціях. Таким чином, кожен, хто працює з даними та відео, повинен усвідомлювати можливості, які синтетичні дані приносять до точності, представництва та загальної ефективності.