主题演讲2:有情感的人工智能 - FT中文网
登录×
电子邮件/用户名
密码
记住我
请输入邮箱和密码进行绑定操作:
请输入手机号码,通过短信验证(目前仅支持中国大陆地区的手机号):
请您阅读我们的用户注册协议隐私权保护政策,点击下方按钮即视为您接受。
特别策划

主题演讲2:有情感的人工智能

【Maja Pantic】:(翻译室没有声音)所以机器能够有能力去做相应的反应,我们也管它叫做人工智能,首先来看人脸的识别,其实我们也是看到,当你看到一些人的时候,你通过它脸部的一些特征来去识别它,同时要看到年龄、性别、是否长的很漂亮,甚至可以通过人脸一些特征判断一些它的特点。这里我们可以看到是我们自己大脑里面去识别的,可以看到它的态度,看到人的特征。

这是在人脑中来进行一个处理,我们可以看到这种人脸一个识别,它的意义是什么?我们完全可以用到知识,用到很多的方面。我们可以知道人们在反应中,尤其对各种刺激有不同的反应。

我们其实在这方面做了很长时间的学习和研究,我们也取得了一些进步,尤其就这个人脸识别方面。我们希望能够进行一个交换,例如说可以和车、机器人进行交互,任何一个机器人可以进行时时的交互。我们可以看到这些结果,它可能是相当的复杂。

正是我们目前做的这些工作,人的这些表征,我们其实过去二十年做这方面的研究,你可以看到我们有不同的方式可以做人脸的识别,最先进一个技术,我们能够去识别人们的人脸的图片。同时得到一些相应的信息,并且我们可以看到这样一个配比率可以达到98%。同时最难的是这样的行为模式,也就是说你通过识别人脸一些特征识别它的性格,这个是很难。你可以任何一个人脸的表述,可以知道它的喜好,我们怎么样人工智能提高这方面的准确率,这也是要求相应一个技术,你可以我们在这里,包括像一些面具的测试。我们可以看到有不同的结果反馈和不同的教会,有不同的特征去进行验证。

我们可以看到这里人脸识别(图片),首先你能够在屏幕中锁定这个人脸,你可以看到它的一些特征,尤其是显著特征。比如说我们可以看到像脸、眉毛、鼻子特征,我们可以看到其他的特征,如果想进入深入学习,你可以看到它的一些额外的细节的捕捉,你追踪所有的特征,你可以看到这些特征有什么变化,尤其做不同表情的时候,我们分类这些所有的表情的变数。

我们可以看到这些不同步骤,我们追踪了很长时间,这是不同的追踪器,这是最成功的应用。可以看到右边这块,通过追踪器,它能够在不同的光线下面,也能够去识别人类的表情。那么我们在左边这个角落,这个是非常受欢迎的,你可以看到它的应用很广泛。你可以看到最右边下面是我们最准确地一步,它现在也上市了。你可以看到它的追踪器和我们的摄影机是相连的,你可以用到很多方面。

那么,这样我们要把追踪谱或者这些变化把他们应用起来,我们喜欢的方法就是说,我们对他们的脸部肌肉进行捕捉,有43种动作单元,我们可以脸部肌肉可以生成42种动作,比如说额头上有一个长肌肉,你让中部激活,我们称为动作一,它会造成我们的眉毛上扬,实际上你对这个肌肉外部进行激活,你会看到你的外部眉毛上扬,把整个肌肉激活让你造成1+2这个动作。问题在于我们有一万多种表情,这是我们的面部表情,实际上每天用到上千种表情。比如说从一万到七千种表情,降到42个动作组合,实际上把这些动作,它的强弱程度加到系统当中去,我们就会生成复杂的系统。

比如说在每一个表情当中,我们都可以生成面部表情编码系统,这个是我们对表情自动识别系统隐性的方法。左边是动作一,它是针对内部眉毛,你看到在很多情况下,这种惊讶,或者是我们想强调的时候,我们可以用上内部眼毛的肌肉,还有下巴上扬,我们在怀疑的时候,欧洲人怀疑的时候会抬起下巴。另外是4号这个动作,这个就是皱毛,就是生气的时候有的表情,而且有压力,我们也会用眉毛动作表现出来。

我们用两种方法来识别自动表情识别系统,比如说通用型这种表达。我们有人类学家告诉我们,这个世界上每个人展现出同样的表情,而且另外一个人在全球都能普遍出表情,但是实际上有人说,在不同文化背景来的人,他们识别表情方式是不一样的。比如说拿南欧人,北欧人也有差异,更不用说亚洲人,欧洲人表情差异。我们常用的两种方法就是这个表情是正面的,还是负面的,另外一个维度它是否激动。

我们把这些表情放在维度上面,你可以看到多出这些表情,一般来说都是占了维度的四分之一。那么就是说生活当中,还是表现出各种各样的表情,但是你可以看到表情集中这里面的四分之一。

我们为了识别这些表情,我们需要用表情判断他们的行为。一个就是我们的这种兴趣的唤起,比如说当判断人们如何对一种故事作出反应的时候,我们会用这种兴趣表情来进行判断,你可以看到左边的视频,就是说我们可以时时去分析一种冲突,或者冲突的升级。在这里面我们有三个政客在讨论一个问题,他们都有自己很鲜明的观点,你可以看到一开始的时候,一个人在说话,后来他的声音越来越响,然后开始做一些表情,其他政客开始作出了反应,他们开始同时说话,一般来说这就是冲突很明显的表现。

实际上这里有很多的应用环境,一个非常成功的应用环境就是市场分析。比如说我们和一个公司合作了一个项目,这个想法就是用表情判断这个产品或者人们对这个产品的反应,就是说我们有这个大市场的分析,我们把这个产品呈现给不同的人,我们在观察这些人对产品的反应,一般来说80%情况下,一般来说他们就没有什么反应,但是在20%情况下,你会看到有一些反应。这些就是给我们带来好的销量这样一个机会。我看一下这里的20%的机会,这就是给我们带来销量的机会。

另外一个项目关于研究人们兴趣,我们在线上进行医生和病人之间一种远程的诊疗。他们讨论病人病情。因为这是我们的远程诊疗,我们用摄象头来拍病人的表情,也拍下病人额外的表情,比如说痛苦,女士可能是肩膀疼,医生问他,你能不能把胳膊抬起来,想看看肩膀多疼,他想这么做,我们就可以去平衡,我们可以测量痛苦的程度,还有就是抑郁症。西方国家有很严重的抑郁症的问题,尤其是老年当中,抑郁症甚至影响35%老年人口。还有更大问题是工作人口,在西方国家实际上给我们带来上千亿美金的损失。一般大家不愿意讨论自己的抑郁的病情。

比如说我们老年人口比较多,接下来二十年当中,老年人他们痴呆也是越来越严重,我们用这个系统帮助我们应对这些老年人的病情。我们想用对他们表情的判断他们的病情,这种判断比人类自己判断准的多。偶然差多在每一秒可以观察到18到20贞这样一些信号,很多是微妙的信号。我们通过微妙信号判断他们的抑郁,或者是痴呆病情。有时候看他们微笑的质量而不是数量,一般来说他们往往微笑完了之后,一般来说他们微笑面孔突然耷拉下来,我们就是用耷拉机会拿来分析他们的病情。实际上这种系统可以做到非常准确地判断。

说到对痴呆的判断,我们一般会观察他们眼睛的变化。我们人眼是观察不到细微信号。我们就是用摄象头来拍下人们眼部的变化。我们在每一秒可以观察到40贞微妙的信号,当然有的时候看网速。

你可以看到CBS在伦敦,这是我们另外做的工作,你可以看到我们之间分析他们脸部特征,我们研究他们的表情,我们可以看到他们在老年人家中,让他们照顾年幼的孩子,看到他们的反应,通过我们这样一个软件,可以客观分析他们的反应,同时通过这种客观的分析,我们让他们先去看,可以看到他们的结果,我们可以看到基本上,我们的准确率可以达到90%。这个是做了三个星期,我们可以看到两位年老人士他们的反应,我觉得他们的表情还是比较明显的。

你可以看到有一个是有抑郁症,另外个是没有的。你可以看到下面这位女士是有抑郁症?,上面这个是抑郁症吗?这两个女士哪一个有抑郁症?上面的女士反应比较消极,他们看有意思的影片,他们的表情告诉我们他们的状况。这是我们做的另外一个项目,这是关于发展孩子的艺术天赋,你可以看到鉴别特别特征和反应的时候,我们去分析,我们通过机器和软件能够去教他们,其实我们所有的软件是很稳定的。当我们看到这些孩子很开心的时候,尤其挥动他们的手的时候,他们就是表达他们很开心。我们可以看到他们很开心。这个时候表情是笑的,我们能够去强调它这样表贞的变化,像头的动作,或者眉毛的动作,都能够预测你的表情。这些表情是脸上各个部位共同去运作,不光眉毛能够表达一种表情,我们通过这些机器人就能够教这些孩子特定的表情和表述。

我们现在目前有不少项目,这个是来针对手机一些数据,你可以看到拿着手机做脸部的识别,我们还有不同的这些条件分析,你可以看到有反光,包括可能有一些噪音的数据。

这些都是很难的,我们希望解决这些问题。另外一个就是自动嘎是得应用。我们知道在特斯拉里面,实际上有很多外部的传感器,但是车内没有传感器,因为实际上我们想要至少要知道驾驶员是不是看着路,实际上我们目前内部并没有传感器能够捕捉到这些信息,去年特斯拉请我们给他们提供这样一种在车内使用的识别技术。这个是也是非常重要的。

就是基于摄象头这种咨询,我们可以用在很多环境下,比如说培训人们谈判技术,面试的时候也可以使用这样的技术,我们对会议进行分析,我们觉得这个报告很重要。就是亲密关系的识别或者友好关系的识别非常重要。我们知道75%病人,他们在投诉医生的时候主要是投诉医生对他们不够友好,因此这种和谐友好关系的识别也很重要。

【提问】:你的这个演讲非常有意思,作为一个外行,我特别喜欢看电视,我想起了电视《对我说谎》,我觉得这种识别技术很重要应用环节就是执法,警察想知道你是不是在说谎,或者说实话,这个会影响一些法律的问题,你们这个研究有没有达到这个层面,有没有考虑执法方面使用?

【嘉宾】:大家都想知道对方是不是在说谎,我们并没有这样的数据,我们也不会有这样的数据。问题在于人类,实际上专家可以判断对方是不是在说谎,它的判断准确率才是60%,还有就是生理层面,我们判断这个人是不是说谎话或者准确率,从生理层面才有70%,我不想在这个领域进行开发,因为准确率是不太高的。谢谢!

版权声明:本文版权归FT中文网所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。

令人大开眼界的时间测量新科学

在科罗拉多州没有窗户的实验室里,摆放着20台原子钟,全世界都在用它们来计时。它们几乎跟不上。

特朗普政府财政部长之争的内幕

贝森特在当选总统的宫廷内部经过激烈的影响力争夺战后获胜。

比特币和香蕉成为新的炫耀性消费品

两者都加入了无用物品的精英世界,价格越高越受欢迎。

Bluesky趁X用户流失迅速崛起,Threads未能抓住机会

在X遭遇大量用户流失之际,Meta旗下的Threads却将机会让给了只有20个员工的Bluesky。

拜登希望通过卸任前的政策突击保护自己的政治遗产不被特朗普破坏

即将离任的总统为乌克兰进行最后的推动,并寻求新的司法任命和制造业补贴。

高盛因投资北伏而损失9亿美元

这家美国银行是本周申请破产保护的瑞典电池制造商的第二大股东。
设置字号×
最小
较小
默认
较大
最大
分享×