听你声音6秒,AI就能推断你长啥样了!| 技术前沿洞察

大家好,本周的技术前沿又跟大家见面了!就在大家震惊加水就能跑的汽车时候,本周北美高校乃至全球高校都有一些让小探震惊不已的新研究成果......

比如,AI 能够通过你的声音,推测出你长啥样!(当然,现在好像亚洲人还无法做到......); 只需要一滴唾液或者汗液,就能诊断你的压力有多大...(老板,请你一定要看到这条,说明我请假不是假的……)

到底是怎样发生的?硅谷洞察赶紧带你来看!

MIT:听音辨别人的长相

近日,麻省理工学院人工智能实验室(MIT CSAIL)发布了一项令人惊讶的研究——只需要听6秒的声音片段,AI就能推断出说话者的容貌。

其实,从声音推断一个人的长相并不是玄学,平时我们在打电话时会根据对方的声音脑补出相貌特征,这是因为年龄、性别、嘴巴形状、面部骨骼结构等,都会影响人发出的声音。此外,语言、口音、速度通常会体现出一个的民族、地域、文化特征。

AI 正是根据语音和相貌的关联性做出推测。为此,研究人员提取了几百万个 YouTube 视频,通过训练,让深度神经网络学习声音和面部的相关性,找到说话的人一些基本特征,并还原出相貌。在这个过程中,不需要人类标记视频,由模型自我监督学习。

当然,该研究也有翻车的时候。例如让一个亚洲人分别说英语和中文,结果分别得到了一张西方人面孔和一张中国人面孔。还例如变声期之前的儿童,也会导致模型误判性别发生错误。

不知有没国内的高校在做中文版的?

感兴趣的同学可以查看论文地址:

https://arxiv.org/pdf/1905.09773.pdf

辛辛那提大学:仅需一滴体液,这个荷尔蒙追踪传感器就能检测出压力水平

在当今快节奏的生活下,被称作“沉默杀手”的压力,越来越对人们的身心健康产生破坏性影响。最近,美国辛辛那提大学的科学家们开发了一种压力测量仪,可以根据血液、汗液、尿液或唾液中的应激生物标志物水平来检测患者的压力水平以至健康状况,并且只需一滴液体即可。

该设备的工作原理是,传感器可以测量液体样本的皮质醇水平。皮质醇是一种对不断上升的压力做出反应的激素,只需一滴液体,就能测量与压力相关的荷尔蒙水平,如血清素、多巴胺、去甲肾上腺素和神经肽等等。该仪器通过紫外光谱跟踪这些生物标记物的光学吸光度来实现这一功效。

现在,该团队正在探索传感器的商业可能性,并致力于将其变成一个简单的家庭测试工具,这样人们就可以用它轻松地检查他们的压力荷尔蒙。

感兴趣的可以点击原文查看:

https://newatlas.com/stress-test-home-hormones/59863/

匹兹堡大学和卡内基梅隆大学研发自主机器人创伤护理系统

美国匹兹堡大学医学院和卡内基梅隆大学与美国国防部签订总共超过720万美元的四年合约,开发了一个可装入背包的自主创伤护理系统,用于治疗在偏远战场受伤的士兵。

这套系统的名字叫做 TRACIR(TRAuma Care in a Rucksack),旨在用 AI 实现医疗干预,延长伤员治疗的“黄金时段”时间,提升伤员运送途中的生存率。

(图自:卡内基梅隆大学官网)

嵌入在这个设备中的监视器将评估伤员的伤情,AI 算法将指导如何给伤员进行紧急治疗,并自动给伤员实施一些治疗手段,如静脉输液和药物治疗。

来自匹茨堡大学医学院急诊医学、外科手术、重症监护和肺部医疗等领域的研究人员和临床医生的多学科团队将提供丰富的来自真实经验的创伤治疗数据并开发医疗算法,来自 CMU 的机器人专家和计算机科学家将基于这些数据和医疗算法,开发机器人软硬件。

感兴趣的可以点击原文查看:

https://www.cs.cmu.edu/news/pitt-and-cmu-create-autonomous-robotic-trauma-care-system

英美高校:靶向分子马达像电钻一样杀死癌细胞

美国的莱斯大学、达勒姆(英国)大学和北卡罗来纳州立大学的化学家们已经升级了他们用靶向分子马达杀死癌细胞的技术。靶向分子马达,就像一种可被光驱动的电钻一样附着在细胞上,当被近红外光照射时,每秒旋转 300 万次并钻透细胞膜,在几分钟内破坏癌细胞

这项研究可能最适用于皮肤、口腔和胃肠癌细胞。与最初用于驱动“电钻”的紫外线不同,新技术使用近红外光,不会损坏相邻的健康细胞。

据报道,目前“电钻”精度约为200纳米,除了破坏细胞膜外,它们还可以穿透染色质和病变细胞的其他成分,这有助于减缓癌细胞的转移。

感兴趣的可以点击原文查看:

http://news.rice.edu/2019/05/28/chemists-build-a-better-cancer-killing-drill-2/

南加大:开发的技术可帮助聋儿更好地学习手语

更早接触语言,对于儿童的语言发展至关重要。有趣的是,这个道理也适用于手语,它实际上刺激了与口语相同的大脑区域。

对于聋哑宝宝来说,在更小的时接触手部信号与手语是至关重要的。然而,这种接触通常很难实现,特别是因为大多数聋哑宝宝是由听力正常的父母所生,他们面临着很快学习手语的压力。

(南加大研究员在给患儿使用RAVE设备,版权属于南加大)

由南加大研发的 RAVE 设备就很好的解决了这个问题。它由屏幕上的模拟人,多个传感设备和有形的 3D 机器人组成。机器人长得非常可爱有趣,可以吸引听力受损婴儿的注意力,它还会通过身体运动将婴儿引导看向屏幕,然后热成像相机会扫描孩子的脸部以增加其兴趣,而面部跟踪软件会确定婴儿最有可能与屏幕交互的时间。最后,屏幕上的模拟人会使用手语,表情,肢体语言等与婴儿交流。

根据实验,所有婴儿被做手语的模拟人吸引了超过四分钟。对于一个4个月大的婴儿来说,这是很长一段时间。

感兴趣的可以点击原文查看:

https://viterbischool.usc.edu/news/2019/05/robotics-and-american-sign-language/

MIT:这双手套让双手拥有“视觉”

MIT 本月29号在 《nature》杂志发文,介绍一种新的、装满了传感器的手套。传感器输出的数据通过 AI 系统的计算,使得这种手套可以通过触摸识别物体。

(图片来自www.csail.mit.edu/news)

研究人员将这种低成本的针织手套称为“可伸缩触觉手套”(STAG),每只手套上配备了约 550 个微型传感器。当人们戴着手套以各种方式与物体相互作用时,每个传感器都能捕获到一定的压力信号。神经网络会将这些信号根据不同的对象形成不同的数据集,并加以学习和分类,从而做到仅通过触感就预测出物体是什么、重量是多少,而不用通过 “看到物体” 再判断物体的类型和重量——从此能做饭能拿刀的双手,也能拥有视觉了呢!

在试验中,研究人员使用 STAG 手套对包括汽水罐、剪刀等 26 种常见物体进行了测试,能“摸出”物体是什么的准确度高达 76%!

此外,该手套还可以预测大约 60 克内的大多数物体的正确重量。研究人员表示,这种“拥有视觉”的手套可用于帮助机器人识别和操纵物体,并可辅助假肢的设计

感兴趣的可以点击原文查看:

https://www.csail.mit.edu/news/csail-smart-glove-can-identify-objects-touch

麻省理工学院这周的新动作可是不断啊,再来一条 MIT 的新发现!

MIT让机器人通过模仿可以与人类协作

我们人类非常擅长合作。比如两人一起合作抬起沙发这样的重物时,我们会本能地协调彼此的动作,不断地重新校准以确保物品能被水平地被抬起。但是,要让机器人与人类如此顺畅地合作,仍然是个难题。

麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究人员最近表明,通过他们开发的新系统可以实现让机器人通过监测合作者(人类)的肌肉运动从而更平稳地与人类协作,完成合力抬起重物等任务。

这个名为 RoboRaise 的系统将肌电图(EMG)传感器放在合作者的肱二头肌和肱三头肌上来监测肌肉活动,并通过算法不断检测合作者手臂水平的变化,以及合作者可能做出的上下手势,从而让机器人实现更精细的电机控制。

该研究团队表示,在试验中团队已经使用该系统执行了包括拾取和组装模拟飞机部件等一系列任务,机器人对人类动作的反应准确度约为70%。

感兴趣的可以点击原文查看:

http://news.mit.edu/2019/robots-help-you-lift-objects-looking-your-biceps-0522

马里兰大学:制造蜘蛛毒素迅速杀灭蚊子

疟疾每年杀死超过 40 万人,想要灭掉疟疾就需要阻止蚊子,因为它是这种致命疾病的主要传播者。

最近,美国马里兰大学的研究人员就对一种真菌进行了基因改造,以产生一种可迅速杀死蚊子的蜘蛛毒素。

这种蜘蛛毒素是来自澳大利亚蓝山的蜘蛛毒液,对真菌的基因进行了基因改造注入的就是这种毒素。然后,该团队在一个模拟西非村庄的封闭环境中进行了测试,效果惊人:蚊子数量减少了99%以上,45天内蚊子数量就会全部消失。

这也是有史以来第一次用转基因方法在实验室环境之外进行对抗疟疾的测试。但是该团队对基因工程的争议使用,使得有科学家担心这种方法对现实世界来说太危险了。担心真菌会无意中杀死其他生物,如其他昆虫,破坏脆弱的生态系统。

感兴趣的可以点击原文查看:

https://www.npr.org/sections/goatsandsoda/2019/05/30/727884309/scientists-genetically-modify-fungus-to-kill-mosquitoes-that-spread-malaria

更多精彩,敬请关注硅谷洞察官方网站(http://www.svinsight.com

原文地址:https://blog.51cto.com/14311113/2404254

时间: 2024-10-10 01:26:40

听你声音6秒,AI就能推断你长啥样了!| 技术前沿洞察的相关文章

【ZT】在微信上有哪些高情商的说话方式 | M周刊(听语音需要60秒,看文字只需10秒)

https://baijiahao.baidu.com/s?id=1590547145580792217&wfr=spider&for=pc https://yuedu.baidu.com/hybrid/column/78adfd69b207e87101f69e3143323968011cf4e9; 在微信上有哪些高情商的说话方式 | M周刊 晓报告 01-26 订阅 复杂的商业世界,听吴晓波就够了 点击上图▲成为会员 加入超45万人的财经知识社群 文/巴九灵(微信公众号:吴晓波频道) 小

听硬盘声音。闻声识好坏。【一】

在实施修复前,工程师需要做一项非常重要的事情,就是要对硬盘进行检测,就像医生对病人望闻问切一样.由于硬盘的高密性,不可拆解盘体,听声音来判断硬盘的问题,就尤其重要了. http://www.hddup.com/upload/video/201705/1494556177660021.mp4 固件坏声音  个别磁头坏声音  磁头全坏声音 正常声音 http://www.hddup.com/upload/video/201705/1494399098186499.mp4

百度MP3+图片+文字:生成结果文件;(声音58秒,视频59秒,同步性需要进一步优化)

import os os_sep = os.sep this_file_abspath = os.path.abspath(__file__) this_file_dirname, this_file_name = os.path.dirname(this_file_abspath), os.path.abspath(__file__).split(os_sep)[ -1] f_mp3 = '{}{}{}'.format(this_file_dirname, os_sep, 'auido.mp3

(二)仅仅通过Application监听用户行为及App的在线状态和在线时长

先要实现功能,还是先从API去找.看看有没有你想要的.这里其实就是监听App内activity的状态.怎么办? 给个API所在地址:http://www.android-doc.com/reference/android/app/Application.html 看到没?这里有个方法registerActivityLifecycleCallbacks ,这不是监听吗?看看回调了啥东西,点进去再看看. 我去,这服务不要太好呀.要啥有啥.看到没?所有activity的生命周期都能获取到.所以.怎么用

AI佳作解读系列(五) - 目标检测二十年技术综述

计算机视觉中的目标检测,因其在真实世界的大量应用需求,比如自动驾驶.视频监控.机器人视觉等,而被研究学者广泛关注. 上周四,arXiv新出一篇目标检测文献<Object Detection in 20 Years: A Survey>,其对该领域20年来出现的技术进行了综述,这是一篇投向PAMI的论文,作者们review了400+篇论文,总结了目标检测发展的里程碑算法和state-of-the-art,并且难能可贵的对算法流程各个技术模块的演进也进行了说明,还深入到目标检测的特定领域,如人脸检

【X240 QQ视频对方听不到声音】解决方法

[X240 QQ视频对方听不到声音]解决方法: win7为例: 右键点击右下角的"小喇叭"图标,点击"录音设备",显示如下图: 点击,上图中的"麦克风",再点击右下角的"属性"按钮,显示如下图: 对方听不见声音的原因是 下图中"小喇叭"是静音状态. 设置成如下图所示,对方就能听到你的声音了. 测试方式:见下图,点击"语音测试向导",按照提示测试即可.

2020年这些职业将逐渐被AI(人工智能)取代

耳熟能详的人工智能 深蓝Deep Blue是美国IBM公司生产的一台超级国际象棋电脑,重1270公斤,有32个大脑(微处理器),每秒钟可以计算2亿步."深蓝"输入了一百多年来优秀棋手的对局两百多万局. Siri是一款内建在苹果iOS系统中的人工智能助理软件.此软件使用自然语言处理技术,使用者可以使用自然的对话与手机进行互动,完成搜寻资料.查询天气.设定手机日历.设定闹铃等许多服务. 在全球四大语音助手中,微软的Cortana和苹果Siri目前处于落后水平,谷歌助手和亚马逊Alexa已经

Swift - 制作一个录音机(声音的录制与播放)

1,技术介绍 (1)AVFoundation.framework框架提供了AVAudioRecorder类.它可以实现录音功能. (2)而使用该框架的AVAudioPlayer类,可以实现声音的播放. 2,下面制作一个录音机样例 (1)按住录音按钮则开始录音,松开则停止录音.录音文件保存在用户文件夹下. (2)录音过程中会实时显示声音的音量大小(这个可以用来做声音脉冲图,获得更好的展示效果) (3)点击播放录音则可播放录制的声音文件. 3,效果图如下: 4,代码如下: 1 2 3 4 5 6 7

【转载】程序猿转型AI必须知道的几件事!

历史上AI火过两次,但是最终都已销声匿迹作为结束.这次AI大火的原因:AlphaGo 4比1战胜李世石,相对于一些外行人的恐慌和恐惧,其实很多业内人员在这场世纪之战结束后,都为人类点上了一个大大的赞.因为对于了解AlphaGo背后技术的那些人来说,人类有如此的计算能力和宏观把握能力已经很了不起了.但是,就在前不久AlphaGo2.0在乌镇完胜了柯洁.事实还是证明了人类在某些方面还是有一定的缺陷,毕竟万事万物都有它的缺陷,残缺才是自然界真正的魅力.这次AI浪潮激发了国内很多程序猿的兴趣,很多人也在