跳到主要内容

感谢您访问nature.com。您使用的浏览器版本对CSS的支持有限。为了获得最佳体验,我们建议您使用更最新的浏览器(或关闭Internet Explorer的兼容性模式)。与此同时,为了确保继续支持,我们在显示站点时不使用样式和JavaScript。

  • 广告的功能广告主对本文内容负全部责任

人工智能帮助计算机更有效地看和听

在人脸识别方面,人眼的准确率是令人难以置信的,但在2013年,一种算法达到了97%以上的准确率,首次超过了人类的能力。该代码由香港中文大学(中大)多媒体实验室(MMLab)的研究人员设计。

2021年,MMLab与中国内地的上海人工智能实验室合作,成为香港中文大学新成立的跨学科人工智能研究所(IAIRI)的一部分。

林大华是IAIRI的主任,领导MMLab在计算机视觉技术和识别图像和视频特征的人工智能方面的工作。他解释说,计算机视觉现在被用于指导从无人驾驶汽车到x射线分析,以及垃圾的自动分类和回收。

林大华研究计算机视觉。资料来源:香港中文大学

例如,林说,计算机视觉的一个关键用途是帮助医生加快识别医学扫描中的异常。“人类每分钟只能处理一到两张图像,而计算机可以处理数千甚至数百万张图像,”他解释道。“人工智能可以帮助挑选出显示问题的扫描结果,这样医生就可以把宝贵的时间集中在这些患者身上。”

这项技术还可以用于检测工厂装配线上的缺陷产品,而不需要人们单独检查产品。

数字有远见的

林说,MMLab一直致力于扩大计算机视觉的能力。早期的技术一次只能分析10秒的视频片段,但在2018年,林的团队开发了分析软件,能够一次性分析10分钟的视频,识别人物、物体,甚至视频内容。

但林表示,计算机视觉面临的一个主要挑战是,不同的环境需要不同的AI模型。MMLab是众多研究计算机视觉“超级模型”的团队之一,该模型可应用于数百种不同的应用。

中大工程及数据分析专家Helen孟正在开发人工智能技术,通过分析人类语言来检测神经认知障碍,以及评估发音熟练程度。

海伦孟(左)正在开发分析语音的人工智能。资料来源:香港中文大学

孟表示:“创造能够倾听、理解和交谈的人工智能技术已经成为一个非常热门的话题。”她表示,挑战在于教会人工智能检测语言中的情绪和隐藏的含义。

2013年,孟帮助成立了中大何鸿燊大数据决策分析研究中心,至今她仍是该中心的创始董事。她的团队现在开发了一个移动应用程序,使用语音识别来筛查痴呆等认知障碍,为大脑扫描和血液测试提供了一种非侵入性和负担得起的替代方案。

她解释说:“一个健康的人和有轻微认知障碍的人说话有明显的区别。”“持续的停顿、犹豫和选词可能是早期认知衰退的标志。”

孟还致力于针对混乱语音的语音重建技术。她解释说,中风后,人们可能会失去一些与关节相关的肌肉活动能力。她说:“如果我们能帮助把这种‘呼吸困难’的语言转变成听起来更正常的语言,我们就能帮助患有神经运动疾病的患者进行交流。”

孟的实验室也在开发一种人工智能来帮助中国学生提高英语发音。她说:“口音通常是一件好事,因为它能增加语言的质感。”“但有时发音上的偏差会导致沟通错误。”她的团队使用了从中国人学习英语中收集的数千份录音,来训练人工智能技术检测发音错误并提供纠正反馈。

运动医学

由于人工智能在医学上的应用必须经过严格的安全测试,因此在2020年,中大开设了多规模医疗机器人中心,这是一个支持外科机器人开发的临床前研究基地。

“外科医生用自己的双手所能达到的效果是有限的,”外科医生兼中心联席主任菲利普·邱(Philip Chiu)解释说。他说:“机器人可以通过在人体的有限空间提供更好的精确度来提高我们的技能,这将改善手术的结果。”

该中心包括一个模拟手术室、一台磁共振成像机和3D成像仪,可在试验期间提供实时观察。“团队可以来测试他们的手术机器人,并获得关于性能的即时反馈,”Chiu说。

区尚文(右,左)和赵伟立在中大多尺度医疗机器人中心。资料来源:香港中文大学

该实验室使用从附近教学医院收集的手术数据来帮助创建真实的模拟环境。

该中心的另一位联席主任、工程师塞缪尔·欧(Samuel Au)理解开发机器人的挑战。他说:“身体的每个部位都需要不同的工具和灵活程度。”“手术机器人每年已经进行超过100万例手术,但它们大多是在较少受限空间进行的更简单的软组织手术。我们的目标是在此基础上进行扩展。”

该实验室为该地区的初创企业提供了一个可进入的空间,以开发用于更复杂程序的机器人,使其更容易进入市场。然而,Chiu说他们远没有让外科医生提前退休。

“手术机器人只是我们眼睛和手的延伸,”他说。“如果我们能获得足够的数据,在机器人手术中构建人工智能,未来可能会有一些自动化,也许有一天,机器人手术可以通过另一名外科医生的远程协助和指导,在一个地方为患者进行手术。”

简化服务

2019年,香港中文大学的另一名研究员刘澍和他的一些同事开发了一种自学的智能制造检查系统,帮助工厂简化流程,减少对体力劳动的依赖。

刘舒是SmartMore的联合创始人,该公司为制造商提供机器视觉技术。资料来源:香港中文大学

现在,利用尖端的计算机视觉和深度学习,刘先生和他在一个名为SmartMore的中大子公司的团队正在创建智能检测平台,可以简化整个制造周期。

其中一个智能检测平台监控半导体芯片的生产。“有很多工序会影响芯片的质量,”刘解释道。“我们的智能检测平台可以评估哪些工艺组合会导致最少的缺陷,并进行调整,直到我们获得最高的无可挑剔的产品。”

“我们正在研究一种智能的一体化设备,它有点像人体,用于缺陷检测,”刘补充道。“它可以抓取一个产品,从各个角度拍摄它,分析图像,然后决定应该做什么,并采取行动。”

林说,这种进步很快就会成为标准。但这将意味着世界将需要更多的人才来服务使用人工智能的行业,因此该大学非常热衷于在早期教育中促进对人工智能的关注。

他解释说:“通过在年轻时引入人工智能教育,我们将帮助为未来培养一批有才华和见多识广的人才。”林的实验室已经为中学生出版了一本关于人工智能的教科书。

搜索

快速链接

Baidu
map