周一麻省理工学院的研究人员宣布了一种相反方向的人工智能方法:它需要一些真实的东西,并使其变得人为。该应用程序有些令人惊讶,需要复制的针织服装。该系统研究服装的图片并计算一系列缝线以给予自动针织机。
根据好奇的标题“ 神经逆编织:从图像到制造说明 ”,本文描述了如何拍摄针织服装的图像,并使用卷积神经网络或CNN,以及生成对抗网络(GAN)来制作平面图或蓝图,指定服装中的每个点应使用十七种不同的针迹类型。该论文由亚历山大·卡斯帕尔,Tae-Hyun Oh,Liane Makatura,Petr Kellnhofer和麻省理工学院的Wojciech Matusik撰写。
该研究结合第二篇论文“ 编织骷髅:用于针织服装成型和图案化的计算机辅助设计工具 ”,其中Kaspar,Makatura和Matusik介绍了一个软件程序,可以轻松布置针迹图案一件衣服。
MIT-神经编织数据 - 组 - examples.png
深层针织管道,从左边的服装和地面真实标签的真实照片到右侧网络产生的推断针迹图案。
MIT
第二篇论文的想法是一种软件工具,这使得没有针织经验的人可以非常容易地为自动编织机生产说明书。自动编织机已经激增,例如Shima Seiki的系统。但是他们通常需要一些领域专业知识才能进行编程,因此Kaspar及其同事希望通过简化设计流程为新手提供一种方法。这与“增材制造”的情况非常相似,人们可以将他们的设计上传到云中的3D打印机。在这里,麻省理工学院的作者希望推进“针织即服务”,就像他们所说的那样。
这有助于避免针织机的“机器编码”,但仍然需要做大量工作来指定服装中的所有针迹。这就是机器学习变得有趣的地方。他们提出了一种自动生成机器可理解针迹模式的算法。
另外:Nvidia的神话般的假货打开了黑盒子的AI
“在整个服装编织机的操作过程中,他们执行一个定制的低级程序来制造每个纺织品,”他们在“神经逆向针织”中解释道。
“通常,生成与每个设计相对应的代码是一个困难而繁琐的过程,需要专业知识。”
神经逆编织网络,具有结合真实照片和服装合成照片的“精炼者”,以及输出机器可读针迹指令的程序生成器。
MIT
因此,需要使用机器学习来开发从样衣服装开始自动计算出这样的机器指令的能力,你可以称之为“计算编织”。
如在包含补充材料的论文中详细描述的那样,神经网络必须计算两个不同的东西:它必须首先计算所讨论的服装的理想表示,然后它必须计算所涉及的针脚。
对于第一部分,神经网络被送入两种样本,即作者从头开始编织然后拍摄的针织服装的真实照片; 并合成由他们的设计软件生成的服装图像。后者,合成图像,比真实世界的照片更清洁,因此它们将用于清理现实世界中的图像。
另外:麻省理工学院提高了一个AI来教另一个人的赌注
使用生成对抗网络或GAN的“精炼者”模块融合真实和合成图像,并通过根据编织图案的理想化,正则化合成图像对其进行变换来清理真实图像。
正如作者所描述的那样,它们正在扭转GAN的典型用途,GAN试图将虚假的东西“映射”到真实的东西,以产生令人信服的传真。在这里,他们反而希望用模拟的东西简化和澄清现实世界的混乱。
他们写道:“之前的方法已经研究过生成逼真的图像。” “我们学会通过从真实数据到合成外观数据的映射来中和现实世界的扰动。” 通过消融研究,他们表明,与仅仅使用针织物品的真实照片相比,在计算所涉及的针迹时,真实和合成图像的组合会更好。
作者从头开始编织了一些样品并将它们拉伸在金属棒上,这样他们就可以拍摄它们来构建真实世界图像的数据集来训练神经网络。
第二部分称为“Img2Prog”,用于从真实和合成图像的混合中导出针迹。两组图像都标有“地面实况”标签,表示在图像中看到17个针迹图案中的哪一个。通过优化地面实况标签和神经网络输出之间的“交叉熵”损失,神经网络计算在数千个示例图像中表示的17种不同针脚的统计模式。
机器学习,任务自动化和机器人技术已经广泛应用于商业领域。这些和其他人工智能技术即将繁衍,我们将研究组织如何最好地利用它们。
所有这些都与机器学习的其他领域有一些有趣的联系。作者写道,他们正在做的事情类似于“语义分割”,其中机器学习算法被训练以挑选场景中的对象。“这类似于每像素多类别分类问题的语义分割,”他们写道,但有一个重要的区别:“语义分割对于人类来说是一项简单而繁琐的任务,而解析编织指令则需要大量的专业知识或者逆向工程。”
更具挑衅性的是作者断言他们的工作类似于“程序综合”,其中神经网络用于构建计算机程序。
“在返回明确的可解释程序方面,我们的工作与程序综合密切相关,这是一个具有挑战性的持续性问题,”他们写道。
“我们的任务有可能扩展该领域的研究范围,因为它与程序综合的任何其他先前任务的不同之处在于:1)当程序综合解决方案采用序列生成范例时,我们的输入 - 输出对类型是2D程序地图,2)新开发的领域专用语言,适用于实用编织。“
你有它:从可区分的针织帽和手套到可区分的计算机代码。