您当前位置:主页 > 498888王中王开奖结果 >

498888王中王开奖结果Class teacher

智能音箱必须通过“窃听”改善性能?

2019-08-11  admin  阅读:

 

 

  据英国研究公司Juniper预测,2023年智能语音助手的使用量将达到80亿。然而,智能语音助手市场的疯狂增长离不开海量用户数据的“喂养”,隐私问题也随之滋生。

  智能语音助手必须通过“窃听”来改善性能吗?有专家向南都记者表示,就现阶段来说,人工监听和分析是必须的,并且将在弱人工智能时代持续相当一段时间。

  为什么亚马逊、谷歌、苹果这三大科技巨擘明明在其他涉及隐私的问题上谨言慎行,却唯独在承认人工监听语音指令行为时如此“爽快”?

  这是因为,就目前的语音识别技术来说,人工监听和分析是必须的——在业内,这已经是公开的秘密,只不过大多用户并不知情。

  中国科学院自动化研究所听觉模型与认知计算团队副研究员徐爽告诉南都记者,目前主流的人工智能技术基于深度学习,善于从海量训练数据中发现统计规律,能够更好的刻画数据分布特点,但还不能像人类一样“举一反三”,不能很好地通过无监督的学习适应复杂的环境变化。

  有业内人士向南都记者透露,不止上述三家公司,所有开发智能语音助手的公司都有这样的团队,区别仅仅在于这个团队属于公司内部还是第三方承包商。

  2016年,AlphaGo一战成名,在自我对弈和深度学习中超越了人类的智能预期。围棋领域的这次成功尝试,让人们看到了大范围实现人工智能无监督学习的一丝曙光。

  但在徐爽看来,智能语音处理领域对人工干预的需求“还将持续一段时间”,而且“不是短时间”。

  她指出,尽管当下人工智能领域已取得很大成功,但其发展水平还处在初级阶段。从专业角度来说,人工智能可以分为两种:专用人工智能和通用人工智能,而目前的人工智能发展还处在专用人工智能阶段,也就是人们通常所说的“弱人工智能”。

  徐爽说,专用人工智能解决特定的智能问题,在部分专用领域有效,而通用人工智能则要达到人类通用智能水平,具有自我认知和复杂环境的自适应能力。

  因此,无论是在语音识别,还是文本、图片、视频等其他领域,人工的数据标注、监听分析都是必不可少的。事实上,数据标注已经伴随人工智能的发展成为了一种新兴职业。

  有观点认为,数据标注是人工智能的入门级岗位。打比方来说,光靠机器自己是无法识别任何语音指令的,必须要先给它一段语音指令,上面标注出这个指令的意思,然后机器通过学习大量类似语音中的特征,才能理解这个指令的意思,并给出正确的回应。

  南都记者搜索招聘网站发现,仅在北京,招聘“数据标注员”的公司就有不少,员工规模大部分在500个以下,有的会直接标注是为哪家大型互联网公司服务的。职位要求包括学历大专以上,做事认真细致有耐心,熟练使用电脑,但对经验和专业没有硬性要求。

  有业内人士预测,在未来人工智能发展良好的前提下,数据的缺口一定是巨大的,因此3-5年内,数据标注员的需求会一直存在。

  7月26日,英国《卫报》报道称,苹果会雇佣外部人员监听和分析用户对Siri发出的语音指令,达到识别Siri是否被意外唤醒、指令是否被正确处理等目的,以改善用户体验。

  这些录音中不乏医生与病人的谈话、掩盖在引擎噪音之下的疑似毒品交易、性行为信息等极其私密的个人信息。

  对此,苹果回应称,人工监听的录音占比不到Siri日激活量的1%,而且大部分的录音时长都只有几秒,此外,人工监听工作是受到苹果严格的保密协议约束的。

  今年4月,亚马逊的一位合同工向彭博社爆料,称为了改进Alexa语音助手,亚马逊在世界各地雇佣了数千名员工“窃听”用户的真实录音。这些员工还被要求签署保密协议,不能公开谈论该项目。

  不久前,谷歌的智能语音助手Google Assistant也“沦陷”了——来自谷歌雇佣的人工监听团队的爆料人向比利时荷兰语国家广播电视台(VRT)提供的1000条对线条都是在Google Assistant被意外唤醒的情况下录制的。

  密歇根大学助理教授Florian Schaub曾表示,人们也许并不会留意到,自己跟语音助手说的小秘密可能会被其他人听到,而是以为这些设备都在自发进行神奇的机器学习。

  目前人工智能产业界使用的基本上还是监督学习的技术,存在过于依赖大数据、算法本身具有不可解释性等突出问题,而人工的介入,在某种程度上把用户的隐私置于危险的境地。

  据南都记者了解,以隐私保护严格而著称的欧盟数据保护监管机构已经行动起来了。

  8月1日,德国汉堡数据保护和信息自由委员会发表声明称,已对谷歌启动行政程序,禁止其员工或第三方机构对智能语音助手Google Assistant收到的用户录音进行评估,限期三个月,旨在保护数据主体的隐私权。

  该委员会专员Johannes Caspar评论道,语音助手系统必须是透明的,以便获得用户的知情同意,信息的充分透明对于那些注重语音指令处理过程,以及意外唤醒频率和风险的人来说尤其重要。

  中国信息安全研究院副院长左晓栋认为,仅从合规的角度来讲,如果公司清晰告知了用户录音会被如何使用和用于什么目的,则不能视为违规。

  一位专注于数据保护实务的律师表示,智能语音助手开发公司应该对从事人工监听和分析工作的员工或第三方承包商的数据合规能力进行审核,并通过合同条款约束。11822品特轩高手之家