据Data61称,对Data Airlock的兴趣已扩展到内政部,新南威尔士州警察局和澳大利亚健康与福利研究所(AIHW)。
因此,Data61的研究人员正在努力使该计划适应他们的特定需求。
在接下来的12个月内,Data61表示计划为Data Airlock配备加密和差异隐私算法,以提高其在包括医疗保健在内的领域的可用性。
Data Airlock的想法来自于法新社的高级数字法医检查员Janis Dalins,他曾在蒙纳士大学攻读博士学位,在他的研究中遇到了问题。他需要让他的主管访问他正在分析的数据。
Dalins找到Data61帮助他开发一个解决方案,让他的主管可以访问他正在分析的数据,但也可以由AFP使用。
Data61在扩大主动权时表示,在儿童剥削调查案件中,法新社官员通常需要花费几天的时间查看大量材料,然后才向法院报告成功定罪。
该组织在一篇博客文章中解释说:“原始方法要求官员查看数千张图像,比较照片文件以识别相似之处。”
在2018年,引入了称为感知散列的方法,其使用算法来寻找图像内容之间的相似性,留下数字水印以识别各种形式的材料。
尼泊尔说:“感知哈希措施反复出现相似性,以预测潜在结果,在这种情况下,如果材料是由同一个人创造的或包括同一个人,”尼泊尔说。
“旧方法缺乏预测性分析。当图像中存在少量失真时,例如更改像素,可能会改变整个散列。这意味着两个图像在感知上相似,无法再被检测到。 “
Data Airlock提供了一个孤立和安全的环境,人们可以将他们的算法和模型放入其中,根据数据执行它们,然后进行研究。
“这些数据永远不会离开数据所有者的数据隔离环境,因此所有者始终可以完全控制数据,”尼泊尔继续说道。
根据Data61,该设计使研究人员能够使用模型到数据(MTD)范例,针对敏感数据开发新算法,而不会暴露于数据。该组织表示,这可以将信息保存在安全的保险库中,并且只允许手动审查算法在隔离的“气闸”环境中对数据进行操作。
尼泊尔说:“拥有敏感数据的组织希望大学或研究人员参与分析他们的数据,但与此同时,他们不希望向他们发布数据。”
“我们提供了一个环境,通过与大学的研究人员合作,无需他们访问数据,就可以创造出新的创新。”