亚马逊旗下子公司Alexa Internet于2014年开发了一款智能喇叭,取名为Echo,Alexa是该设备上搭载的语音识别系统,用户只需喊一声“Alexa”,Echo就会被唤醒,并应用户命令,帮助他们完成通话、查找资料、点外卖、叫车等生活琐事,象是一个永不嫌累的私人管家。
不过,这个管家的“嘴巴”可能不太牢靠。七名曾经参与过Alexa语音识别系统改进项目的员工透露,Echo会自动录制用户的部分对话,并在用户不知情的情况下发送到亚马逊设立在海外的多个工作站。员工会对系统无法自动识别的模糊语音进行人工识别,对存在歧义的指令进行解析并标记,以提升系统对用户语音的识别度,更好完成用户命令。
亚马逊曾描述Alexa“生活在云端,不断变得更加智能”,但从未披露过Alexa语音技术中存在人为干扰的事实。
Alexa的危险之处还在于,为了能有效识别唤醒指令,Echo的七个喇叭可能随时都在捕捉对话内容。彭博社引述消息人士的话表示,员工在监听录音的过程中,曾听到女人在洗澡时放声高歌,有的听到孩子尖叫寻求帮助,甚至还有性侵案现场的录音。员工听到这些让人困扰的录音常不知所措,报告情况后公司却指“事不关己”,所以员工只能在聊天群中倾诉解压。
亚马逊发言人解释称,可能用户的对话中有的词听起来像“Alexa”,Echo因此被唤醒。Echo官方常见问题解答中提到,系统只会在检测到唤醒词的情况下进行录音或发送至云端。但消息人士透露,他们所监听到的录音中,很多音频文件以噪音开始,并未出现有效的唤醒词。
据报亚马逊在全球僱用了数千人进行Alexa语音识别系统改进项目,团队中既有合同工也有正式员工,工作地点位于波士顿、哥斯达黎加、印度和罗马尼亚等。员工在入职时都会签署一份保密协议禁止公开讨论该项目。他们每天工作9小时,每班解析1000多条音频。
尽管这些员工彼此可以互相交流所监听到的内容,但好在亚马逊所收集到的音频相关信息中并不包括用户的真实姓名及地址,仅有Echo设备序列号等基本信息。
亚马逊也承认员工的监听行为,但坚称会全力保护用户私隐。彭博社引述亚马逊发言人的话称,只有极小部分的录音样本会被拿去标记,目的也是为了优化用户体验。该发言人强调,所有的信息都是高度机密的,公司使用身份验证来限制别人的访问、采用服务加密以及审计公司的控制环境来保护所有人的私隐。
不仅是Alexa,苹果的Siri、谷歌的智能助手,以及中国的许多智能喇叭产品,都不仅通过海量数据进行机器学习,背后还需人工帮助填补算法空白。根据苹果安全白皮书,员工负责评估Siri对用户命令的解读是否符合真实情况。根据苹果安全白皮书,Siri的录音会被加密,并且不含个人帐号信息,存储半年后会被移除,但也有部分被存储更久