拍摄高质量的照片可能是一项具有挑战性的任务,因为它通常需要找到理想的位置、角度和照明条件。虽然艺术照片到目前为止主要是由人类摄影师拍摄的,但近年来,一些研究人员开始研究使用机器人自动拍照的可能性。
为此,普渡大学(PurdueUniversity)和Adobe Research的一个研究团队最近开发了一个新框架,允许机器人自动捕捉人类的照片,特别是肖像。这个框架是在arxiv上发表的论文中提出的,它让机器人跟随人类用户到一个理想的地方,然后拍摄它们的照片。
LEROP是研究人员开发的框架,专门设计为拍摄人类受试者的室内肖像。首先,框架将机器人引导到有利的或期望的位置用于拍照,然后它使用照片评估模型来提出最佳视图,以及深度增强学习(DRL)模型来调整机器人的位置和方向以确保最佳的照明条件。
研究人员在论文中写道:“当合成被激活时,机器人试图调整其位置,形成与给定模板图像最匹配的视图,并最终拍摄一张照片。”模板图像可以由框架使用现成的照片评估模型动态预测,也可以从用户预定义的集合中手动选择。
LEROP是一个交互框架,因为用户可以将其编程为跟随一个目标到她希望捕获照片的地方。一旦用户到达该位置,机器人就开始搜索最佳视图以捕获。LEROP的DRL组件最终允许它基于它如何匹配模板图像来调整其视点。
研究人员决定为机器人配备一台360度摄像机和一台高质量的主相机,因为这样它就可以随时对周围环境进行全面的观察,而不需要不断地旋转或切换到不同的视角。有趣的是,该框架具有模块化结构,这意味着它的所有模型都可以根据用户的需要进行替换或调整。
该小组在3个室内场景的各种试验测试中评价了勒罗普,将其集成在一个名为Turtlebot的简单机器人中。机器人在这三个设置中的每一个中拍摄了20张人类用户的照片,10具有预定义的模板,10使用它动态生成的模板。
机器人对预定义模板和动态生成模板的平均调整次数分别为11.20次和12.76次。此外,利用研究人员的框架,机器人可以使用预定义的模板在平均22.11秒的时间内拍摄照片,用动态生成的模板拍摄22.40秒。
勒洛普框架可能是朝着创建一个高效的机器人摄影系统迈出的第一步,该系统可以快速、自动地拍摄高质量的肖像。然而,研究人员开发的系统仍然有一些局限性,可能会阻止它被大规模采用。例如,到目前为止,它的车载计算能力有限,因此只能在强大的远程计算机上工作。
此外,到目前为止,研究人员只将其集成到Turtlebot中,Turtlebot是一个简单的、自由度很小的机器人。在他们的下一步工作中,他们想要在一个更复杂、更多自由度的机器人上测试他们的系统。
"我们的系统目前仅支持单人肖像,"研究人员写道."新政策需要重新培训,以更好地支持拍照。在今后的工作中,我们还希望对不同的照片评价美学模型进行测试,并将工作扩展到户外场景。"