监控视频现在无处不在,研究人员正在努力让它变得越来越智能。最新的发展是构建-或“幻觉”的问题-一个人的完整图像来自机器学习ML术语中的部分或遮挡照片。
当您想要查看的对象或对象被插入的对象或对象部分覆盖时,就会发生遮挡。纽约时代广场表示,在拥挤的公共区域,监控摄像头很少能一眼看到感兴趣的人。
结果
你可以通过一些重构来判断他们的成功——从他们论文中包含的测试数据集。
我印象深刻。
怎么样
在论文中,作者指出他们对这个问题采取了一种新的方法。通过集成最先进的神经网络架构,即U-net和GAN,以及判别属性分类网络,以及专门为去除人体形状而设计的架构。
定义是有序的。U-net是一种卷积网络架构,旨在快速准确地分割生物医学图像。GAN(生成对抗网络)用于无监督机器学习,其中两个神经网络在零和博弈的框架下相互竞争。判别分类网络充当质量检查员,消除它可以确定为伪造的生成图像,只留下欺骗AI的图像。
如上图所示,这种组合非常有效。