欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

跟智能机器人谈感情 选谁配音很重要

程序员文章站 2022-05-08 09:29:35
人工智能助理未来将并不仅限于“助理”的角色,甚至能够成为未来的“爱人”钱童心在近期风靡全球的《西部世界》(Westworld)和《真实的人类》(Huma...

人工智能助理未来将并不仅限于“助理”的角色,甚至能够成为未来的“爱人”

钱童心

在近期风靡全球的《西部世界》(Westworld)和《真实的人类》(Humans)等一系列美国科幻剧中,人工智能正在成为主角。

在现实生活中,虽然人工智能只是在特定领域使用,但是它正在以语音助理等方式出现在我们身边,并久而久之让人们依赖它们。很多人都有和Siri交谈的经历,甚至有网友用尽手段要求Siri演唱爆款神曲PPAP(“笔-菠萝-苹果笔”),自己在一边偷着乐。

“高德地图因为用了林志玲的配音,用户下载数量大增。”上海威盛电子语音交互部门研发总监张*对第一财经记者表示,“我们曾经调查过用户对于声音的喜好,品味区别很大。这就好比‘百里挑一’。”

而脸书(Facebook)最新通过网络投票选出了新的人工智能助手Jarvis配音者——好莱坞著名男演员摩根·弗里曼。人机交互专家认为,弗里曼在《冒牌天神》中扮演天神的角色,并为自然纪录片《帝企鹅日记》作旁白配音,他的声音和Jarvis此前的配音者小罗伯特·唐尼(RobertDowneyJr.)非常不同,能给用户带来新鲜感。虽然也有人质疑弗里曼的声音“太老了”,不像“助理”反而像“爷爷”。

美国媒体调侃说,这或许是因为扎克伯格害怕使用女声会冒犯了他的太太。

温柔体贴的“萨曼莎”

一个有趣的例子是,若言(化名)一直把他的任天堂WiiFit语音助手设置成女性的声音,结果不料一天他开机的时候系统却自动蹦出了男性声音,并在开始指导他做运动前说:“你平时的教练今天请假了。”若言对此感到非常不适应。

这在某种程度上说明,我们与人工智能间无意之中建立起来超越人与机器的亲密关系。

女性机器人的声音总是被赋予比较特别的挑衅力,尤其在当下社会的文化氛围中。一个最典型的例子就是斯派克·琼斯执导的电影《她》(Her)。由斯嘉丽·约翰逊(ScartletJohnson)配音的人工智能系统OS1的化身萨曼莎拥有迷人的声线,温柔体贴而又幽默风趣,这让主人公西奥多与萨曼莎很快发现他们如此的投缘,而且存在双向的需求与欲望。

这也是为什么从苹果iPhone的Siri再到GPS导航系统,人工智能开发者大多选用女声作为智能助理。微软最新的人工智能助手微软小娜(Cortana)和亚马逊的Alexa也都是女声。其中,苏珊·贝内特(SusanBennett)是苹果虚拟助理Siri最知名的声优,已经帮助数百万iPhone用户找到了最近的熟食店,虽然在iOS7中她已经被取代。而微软小娜的声音则来自简·泰勒(JenTaylor)。

使用女声一方面是因为她们“恭谦有礼,适合于传统服务者的角色”,另一方面也是因为女声更能够吸引男性的注意力。要知道,人工智能助理的使用者大多数为男性,而且他们还倾向于“调戏”智能助力。此外,苹果、Google、Facebook和亚马逊等公司人工智能开发部门超过70%的员工都是男性。

不难发现,使用名人的声音也是这些科技企业在为人工智能助手选择声音时首要考虑的。比如为数不多的使用男声的Facebook的人工智能助手Jarvis之前的配音就是钢铁侠的演员小罗伯特·唐尼。美国媒体调侃说,这或许是因为扎克伯格害怕使用女声会冒犯了他的太太。在很多时候,男性使用女声助理,会引起伴侣的不满。

事实上,用明星的声音俘获用户已经成为人工智能助理创新的要素。人们总是倾向于听到熟悉而且有名的声音,而不是冷淡的机器发声。最好的例子就是,“嗲妹妹”林志玲为高德带来了更多使用者。

芝麻科技创始人、CEO朱智告诉第一财经记者,语音交互系统声音的选择最近引起业内广泛的讨论。他说:“虽然众口难调,不同人的喜好不一样,但是我想可以有一个分类的方式,比如说根据用户标签分类,白领和小资用一种声音,妈妈或者孕妇用另一种声音,当然也可以提供多个声音版本让用户自己选择。”

机器将变成“爱人”

人工智能助理声音悦耳动听可以为用户带来精神上的愉悦是一方面,但是更重要的是,富有亲和力的声音能够提高人机交互的效率。当人们喜欢上人工智能助理的声音,不仅能够对他们助理的错误更加包容,而且更有意愿去和他们的助理互动交流。在“调戏”机器人的过程中,却能够帮助机器获取更多数据,从而起到培训机器学习的作用。

不过,也并非所有的科技公司都有Facebook、亚马逊、高德这样的资金实力去请明星配音。出门问问创始人CEO*飞对第一财经记者表示:“我们会请声音清甜、普通话标准的口模来对人工智能系统进行配音。大明星花费高,但是好处是人们喜欢听到自己熟悉的声音。”

一些小的初创公司认为,目前更应该把钱投入到研发中。张*向第一财经记者表示:“目前人机交互的主要技术还是在于语音合成技术,比如如何正确断句、如何控制语调等。英文相对简单很多,只有问句才会用到声调,但中文每个字都有调。”

张*所说的语音合成技术,是一种能够逼真模拟人声的技术。今年9月谷歌的DeepMind实验室刚刚公布在这一领域的新突破。DeepMind的WaveNet语音合成系统能够模仿人类的声音,生成的原始音频比现有的技术和人类声音的差异缩小了一半。不过谷歌的研发人员表示,这种语音交互系统需要更加强大的计算能力,近期还不会被应用到真实世界中。

当科技褪去冰冷的面纱,被赋予高度人性化和活色生香的情趣时,人类与机器人的关系就变得更加微妙。人类已经能够实现与机器*交谈的梦想,未来人与机器的关系还有可能“更近一步”:人工智能助理未来将并不仅限于“助理”的角色,甚至能够成为未来的“爱人”。在近期另一部电影《机械姬》(ExMachina)中,女性机器人艾娃(Ava)向她的人类爱人提出了一个情人普遍感兴趣的问题:“当我们不在一起时,你想我吗?”她的眼睛闪着泪光,“有时在晚上,我想知道你是否在通过摄像头看我,我希望你是。”

人工智能专家里维(DavidLevy)预测,人机交互技术的发展将使人类在未来一年左右能够与交互式机器人发生性行为,此后人类将能与机器人相爱,并且到2050年人类有望与机器人结婚。

与此同时,好莱坞正在努力抓住现实生活中人机交互的技术。在视频网站Netflix上映的英国反乌托邦系列电视剧《黑镜子》,其中一集就探索了让人们通过社交媒体上的记录来重建人的声音和想法,以此来继续与死去的爱人沟通。这让人联想到初创公司Eternime,其口号是“让你获得虚拟永生”。