李使用照片作为正在进行的大型研究的一部分,以了解东非3000多头长颈鹿的出生,死亡和移动情况。他和他的团队拍摄了每只动物独特而不变的斑点模式的数码照片,以便在他们的一生中识别它们。但是在通过模式识别软件处理图像以识别个体之前,研究团队必须手动裁剪每张照片或描绘感兴趣的区域。Lee与来自微软的科学家合作,他们提供了一种新的图像处理服务,使用部署在Microsoft Azure云上的机器学习技术自动完成这一重要且耗时的过程。
使用计算机算法进行对象检测,Microsoft团队使用已经手工注释的现有照片训练了一个识别长颈鹿躯干的程序。该程序使用主动学习过程进行迭代改进,其中系统向可以快速验证或校正结果的人显示新图像上的预测裁剪方块。然后将这些新图像反馈到训练算法中以进一步更新和改进程序。由此产生的系统以非常高的精度识别长颈鹿躯干在图像中的位置,即使长颈鹿是图像的一小部分或其躯干部分被植被阻挡。
“系统实现了对长颈鹿躯干的近乎完美的认可,而没有昂贵的硬件要求,如专用的高性能图形处理单元,”Lee说。“Azure团队如何自动完成我们工作中的这个繁琐方面,这真是太好了。过去我们花了一周的时间来处理调查后的新图像,现在只需几分钟即可完成。这个系统使我们更接近全自动动物识别从照片。“
新系统将大大加速李氏对长颈鹿种群的研究,由于栖息地丧失和非法杀死肉类,长颈鹿种群在非洲迅速下降。
“长颈鹿是大型动物,它们覆盖了很远的距离,所以我们自然而然地利用大数据来了解它们在哪些方面表现良好,它们不在哪里以及为什么,因此我们可以保护和连接对长颈鹿保护很重要的区域,”李。“我们需要新工具来实现这一目标,并且与Azure技术的谐波相结合,使我们的工作成为可能。”
这个过程对于研究具有独特识别模式的其他动物的研究人员也很有用 - 包括一些野猫,大象,火蜥蜴,鱼,企鹅和海洋哺乳动物。可以训练该系统以识别照片并将照片裁剪到这些物种特有的感兴趣区域。