И не тот, который смотрит, сколько раз вы посмотрели картинки с Сырно (и сколько раз на трио её соперниц). А тот, который через камеру видеонаблюдения не только бы наблюдал, но и понимал, что люди делают. Танцуют, гуляют, и так далее.
Именно такой придумали в Вирджинии, США. ИИ, анализирующий по видеотрансляции, что происходит. Сейчас это уже не так удивительно, учитывая, какой общий скачок проявили нейросети - от картинок до музыки и продвинутых DeepFake-ов.
Система SMAST (Семантическая Движение-Осознанная Пространственновременная Преобразующая сеть, СДОПП), может улучшить работу видеонаблюдения, увеличения безопасности и даже работать со сложными условиями перемещения автомобилей в трафике.
Система опирается на два ключевых компонента для обнаружения и понимания сложного поведения человека.
Первый - многофункциональная модель избирательного внимания, которая помогает ИИ сосредоточиться на наиболее важных частях сцены, к примеру, человек или объект, игнорируя при этом ненужные детали. Это повышает её точность (понимать, что бросают мяч, а не двигают руками).
Второй компонент - алгоритм 2D-позиционного кодирования с учетом движения, который помогает ИИ отслеживать, как объекты движутся с течением времени. Без него нейросеть будет видеть постоянно меняющиеся картинки и расположение объекта на них. Проще говоря, как тот древний мем с Baka Mitai, но если бы лица героев перекашивались бы во все стороны, потому что с течением времени ИИ не мог бы отслеживать, куда какая часть лица должна двигаться.
Система искусственного интеллекта уже может распознавать и различать такие действия, как бегун, переходящий улицу; врач, выполняющий точную процедуру; или даже угрозу безопасности в людном месте.
#Cirno #Science #IT@cirno_nb
Мы в VK: https://vk.com/cirno_nb
