新浪新闻客户端

《T3未来科技对话》第一期:人机协同的服务机器人离我们有多远

《T3未来科技对话》第一期:人机协同的服务机器人离我们有多远
2022年06月14日 14:43

  数字科技正在加速融入我们经济社会的方方面面,一个智能泛在、虚实共生的时空正逐渐展开。面对疫情冲击、经济发展和大国博弈等多种不确定性,科技无疑是应对变化的一把钥匙,有望为我们开启未来的数字大门。

  腾讯研究院联合腾讯新闻、腾讯院士专家工作站、腾讯投资,腾讯可持续社会价值事业部和腾讯公司各大科技实验室,联合发起了《T3未来科技对话》,希望邀请科学家和行业专家,对话(Talk)科技(Technology)趋势(Trends),捕捉走出实验室的星辰大海。

  2022年6月8日,第一期如约而至,主题是:人机协同的服务机器人离我们有多远?

  机器人被誉为制造业皇冠顶端的明珠。2021年全球服务机器人需求端销售额达146亿美元,增速32.2%,创造了2016年以来的最高峰值。今年,疫情期间的消毒机器人、配送机器人;冬奥会馆内的炒菜机器人、送餐机器人等服务机器人一跃成为新晋网红。特斯拉、戴森等企业也纷纷投身到“人型”机器人的研发与制造中。

  那么,什么是服务机器人?除了视觉和听觉,哪些技术的突破和进展让它们有了走进家庭生活的可能?它们还有哪些挑战需要克服?

  带着这些疑问,腾讯研究院司晓院长邀请到中国科学院院士、华中科技大学机械科学与工程学院教授丁汉;清华大学长聘教授、清华未来实验室主任徐迎庆;香港中文大学(深圳)机器人与智能制造研究院副院长,深圳市人工智能与机器人研究院特种机器人中心主任丁宁教授,以及腾讯首席科学家、RoboticsX实验室及腾讯AI Lab 负责人张正友;腾讯投资董事总经理余海洋,共同解读服务机器人的发展密码。

  一、服务机器人的核心是“服务于人”

  腾讯研究院司晓院长首先请各位嘉宾对服务机器人进行了定义,因为常见的家用扫地机器人,德国在农业种植的、采摘、耕地的也叫机器人,还有外骨骼加强的设备也叫机器人,而且在疫情期间看到更多的消杀机器人和配送机器人走向街头。他们有的是机械性的,有的是有自己的意识和判断的,有很大的差异。

  丁汉院士认为,总体看机器人有3大类,工业机器人、特种机器人和服务机器人。服务机器人一直对各方面的技术突破要求非常高。目前机器人的概念也在演进,机器人可以说是无处不在,包括机械臂,AGV,海陆空机器人,以及情感交流,陪护等人机交互的服务机器人。

  腾讯首席科学家张正友理解,服务机器人要服务于人,所以它必须要能够跟人互动。而工业机器人即流水线上的机械臂不需要跟人互动。因为环境的不定性,所以服务机器人的自主能力至关重要,以此可以来区分服务机器人和其他机器人。从这个角度来看,所谓的炒菜机器人就不归纳成服务机器人了,因为不需要跟人互动,更像是微波炉一样的电器。

  香港中文大学丁宁教授同样认为自主性很重要,否则就是自动化的机器。现在各行业的装备,往后发展都会逐步具备机器人的属性,具有感知、自主和移动的能力。从这个意义来讲,所有的机器人都是为人类服务的,都应该是服务机器人,区别在于服务不同行业的场景。比如在极端的场所,水上水下、包括带电作业和航天操作等专业服务。

  清华大学徐迎庆教授认为,服务机器人要能够帮助人们解决一些生活中的问题。从用户体验来讲,机器人要具备沟通和交流能力,甚至要能听出语言中不同情感的区别。而且要有基本的五感,能够听、能够看、能够抚摸、能够帮扶,包括有嗅觉的能力,能够感知到屋里的气味并做出应对。此外,机器人形态可以是多样的,并不一定要像个人形,只要能完成任务就可以。

  腾讯投资董事总经理余海洋认为,从投资的角度划分机器人通常看是to B还是toC的,对机器人的定义通常更宽泛一些,更关注在一个具体场景中解决了什么核心问题,能否产生比较大的价值。

  二、机器人的五感中,视觉、听觉领先,嗅觉和触觉的探索取得了一定成绩

  丁汉院士认为,机器人目前最主要的感知是视觉。机器人的工业界应用大多涉及到手眼怎么协同;其次是力觉和触觉,触觉需要柔性电子的相关技术。未来随着机器人的发展,这些功能会慢慢随着问题牵引走向成熟。

  腾讯研究院司晓院长认为,类比人的五感(看、听、嗅、尝、触),机器人不仅能和我们对话,也可以绕过障碍物行走,这是听和看的能力,而其他感觉系统大众了解较少。包括现在流行的元宇宙基于设备对五官的欺骗和模拟,现在也是视觉最成熟,比如给大家做VR眼镜,因为人的五官作为信号输入,眼是最有效率的,大脑皮层90%是处理视觉信号的。

  清华大学徐迎庆教授表示:现在人工智能应用最好的两个领域应该在计算机视觉和自然语言处理(NLP)。究其原因,第一,数据量大,因为人工智能说来说去还是基于大数据的处理。第二,跟应用场景很有关系。相比之下,人们对嗅觉和味觉的研究还远远不够,人类可以分辨成千上万种气味,嗅觉对人的感官体验、记忆的认知有重要的影响。例如在家庭的应用当中,比如有时候家里忘记关火,饭菜被烧糊,有了嗅觉就可以自动监控燃气,包括洗碗机,如果没有及时清理会产生味道,可以使用嗅觉技术来检测并提醒用户。另外,现在机器狗可以用在智慧安防方面,在机场很多的安检的地方,警犬仍然起着非常重要的作用,而利用机器狗的嗅觉,TNT的检测效率可以达到5.0ppb以下,成为人类的好帮手。此外,在触觉方面,全世界视力受损人群有2.53亿,其中有3600万是全盲患者,我们国家2019年的数据大概有1763万,其中有很多是儿童或者是青少年,清华大学未来实验室为盲人做了一台盲人专用计算机,配有性价比最好的高分辨触觉终端,可以显示高精度的触感盲文和触觉图像,这个项目也入选了腾讯的技术公益计划。

  香港中文大学丁宁教授认为,在人工智能领域,视觉研究是最多的,这里面也有很多有意思的问题,比如视觉、听觉、触觉有什么关系。触觉是手指头上感知的能力,视觉是对光的感知,视觉背后的视网膜实际上也是一种敏感的皮肤。视觉、听觉、触觉都是对于信号能量的一种感知,如果他们的机理都差不多,多模态的感知机理就有可能统一起来,用一套计算架构做支撑。当前视觉方面也还有一些问题,比如现在都是立体的两个眼睛往前看,为什么脑袋后面不长眼睛,让观察范围更广,也是由生物界进化下来的机制,因为我们有脖子,听到后面有问题以后,会把脖子扭到后面去看,多长一个眼睛处理问题的话,可能生物的代价更大。总之,机器人到最后始终是要干活的,要跟作业对象接触的,是对环境做了感知并且建模,之后要把事情做的好,包括精细的操作,都是需要力的感知和触觉的感知,如果这部分能有巨大的突破,对产业影响是非常大的。

  张正友博士认为:计算机视觉发展好,是因为传感器,即摄像头存在的比较久,而且可以标准化,分辨率越来越高,噪声越来越低,积累了很多的数据,尤其是互联网把很多数据积累起来了,从而去训练图像识别等。但是像触觉,目前传感器还没有一个标准,嗅觉也是一样的,这方面传感器的感知能力目前还是缺乏的,这个必须要往前推进。既要从研究的角度,也要从业界工业的角度,怎么让触觉传感器和嗅觉传感器越来越灵敏、效果越来越好,很多人会投入到AI技术加上新的传感器的能力,这样一结合以后,人机共生会往前推进。

  腾讯投资董事总经理余海洋认为,视觉行业基础和应用,行业做的比较好。很大程度上也得益于半导体和手机产业链的带动,这个产业链里面有大企业,有大量的资金进入,在各方面的资源投入上,都很多,促进了视觉的进步。

  三、人工智能技术与机器人的结合是本世纪的重要命题

  腾讯研究院司晓院长认为,服务机器人要在非结构化复杂环境中,执行比工业机器人更复杂的操作,因此对交互性和自主性更为看重。人工智能在其中扮演了重要角色,例如MIT现在有四足机器人跑得很快,AI训练起到了很大的作用;腾讯Jamoca走的梅花桩,显然有AI驱动在里面的。

  丁汉院士认为, 根据国际上技术走向,如何把AI和机器人结合,可能是本世纪重要的技术突破点。机器人在上世纪是跟汽车的结合,到本世纪是跟AI的结合。需要三个赋予,要赋予机器人新的功能,赋予机器人更高性能,赋予机器人实现以前不能实现的目标。总结起来,AI要能够推动机器人与人共融、与机器人共融、与环境共融。AI是推动机器人技术进步的动力,要赋予机器人新的功能、新的指标,一定要落实到机器人本体上,推动行业进步,例如3C行业,新能源汽车行业是当前非常好的应用点。此外,AI的赋能也不能仅仅仅停留在算法层面。比如机器人磨航空叶片,老师傅的经验能不能移植到机器人上,AI每一点进步对机器人是突破性的,当然也是非常困难的,需要业界共同持续努力。

  张正友博士认为:过去二三十年,AI在机器人领域发挥了决定性的作用,无论是自动驾驶,还是机器狗还是扫地机器人,包括清扫机器人送餐机器人,最重要的是计算机视觉的推动,因为有了视觉才能够让机器人自动地对环境重建,避开障碍物等。总体上看,机器人的核心技术可以用A2G来概括,刚好七个方向和七个技术点:“A”是人工智能AI,因为机器人必须要能看能听能说能思考,“B”是机器人的本体,不同的机器人的本体能够实现不同的能力;“C”是控制control,ABC构成了机器人的基础能力层。在基础之上,要继续往前探讨新方向,比如说“D”是发育学习(英文developmental learning),机器人跟人不一样,人从出生开始就不断尝试各种机械的、学习的、社交的、情感的等等能力,持续升级,服务机器人也希望有一个进阶的过程。“E”是EQ,要理解人的情感并做出相应的反应。“F”是灵巧操控,如果没有灵巧操控,到后面服务机器人很难进入到人机共生阶段的。最后,机器人智能化以后,再加上学习、情感和操控能力,可以跟环境交互、跟互联网交互、跟其他机器人交互、跟人交互,到最后,服务机器人就变成我们的守护天使(G,guardian angel),比如我们离父母很远,如果有一个机器人的话,即使出现什么状况,机器人有时自己可以救助老年人,如果不行可以用合适的方式通知社区的护工或者是医院等。

  同时,张正友博士认为,服务机器将从自动化往智能化发展,可以用“SLAP”来概括。“S”代表感知,“L”代表学习,“A”代表执行,“P”代表规划。机器人的感知和行动之间是紧密相连的,这样就可以实现反应式的自主。整个系统都需要有学习的能力,通过跟环境的交互,能力要不断地提高,从失败中学习,也要从成功当中学习。当机器人可以实现自主或者智能以后,机器人的应用就非常多了,比如复杂工艺的操作,老年人的陪伴护理等。腾讯机器人实验室进一步做了分解,是三个支柱,第一个是灵敏运动,在平整和不平整的路面上,机器人可以稳定地从一个地方运动到另外一个地方。第二是灵巧操作,要能够完成一些物理的任务,比如扶老年人走路、喂老年人吃饭的能力,否则机器人的用处不是很大。第三是智能体,机器人需要能够学习到高效的运动和协作能力,包括怎么针对复杂任务分解。

  四、机器人续航能力提升、常识的学习,以及瞄准用户刚需打透,是解决落地最后一公里的关键

  丁汉院士以康复机器人为例,列举了几大挑战:康复机器人至今很难实用,难点就在于一个是材料很笨重,第二是传感技术不完备,第三个是微小电机等基础零部件还不过关。电机是最伟大的发明,但也笨重;而人没有电机,但做的事都很灵巧。第四,要实现真正的智能也很难,现在餐馆送餐机器人等的应用环境还是比较简单的,非结构化环境的处理能力不强,基本上还是半自主的。此外,如果大规模使用,还需要严格保障安全性,解决能源续航能力的问题,特别是在野外作业的条件下。未来服务机器人很大的增长点,还是跟人相关的康复、老年人护理,以及医疗手术方面,服务机器人研究要么有趣,要么有用。

  丁宁教授介绍了早年做过的输电线路上的机器人,能够借助电磁场从里面获取能源,长期生存在输电上,自己解决“吃饭”的问题。背后的原理是通过磁场,形成了一个机器人跟作业场景的共生关系,其实就是无线充电。

  张正友博士认为,电池的发展没有摩尔定理,相对比较慢。腾讯的Robotics X Max多模态四足机器人足轮一体的设计,很大程度上也是基于节能的考虑。Max在崎岖路面可以走动,平坦路面可以切换到轮子跑得更快,经测算可以省电40%。此外,我们周围有很多的无线电波,尽管能量比较弱,但随着技术的进步,也可能成为一种能量的来源。此外,人机要实现共生,还有一个是做到零部件的轻量化,目前的电机功率密度比以前高了很多了,如果把电机装在机械臂上还是很笨重,怎么让电机轻量化,这是工艺上面需要有突破。另外有没有可能在设计新东西的时候,比如电机,有没有可能跟机械臂整体思考,并不是说这边有人做电机了这边有机械臂加起来就变成机械臂了,如果可以在机械臂上加上一些电机的能力,说不定就可以轻量化了。此外还有问题是,从工业化和商业角度来看,目前机器人的量不够大,就很少人愿意花成本做工艺的创新,但是这个工作必须要做,需要有创新性的硬件和软件,以及软硬结合的系统性的思考。

  腾讯投资董事总经理余海洋认为,从投资的角度来讲,还是非常关注落地和商业化的,是一个需求和供给碰撞的过程。电池的发展很大程度上受益于电动车行业的发展,有很多的资金和人才在里面做研究。

  丁宁教授认为,现在深度学习的算法效果已经很好了,但是对于常识的表述、传承、表达的方法,现在还有挑战。人有很多常识的能力积累下来,比如学校里面贴一个标语“学校食堂开放欢迎新老师生前来就餐”,但是也可以用另外的断句“欢迎新老师,生前来就餐”。但为什么大部分人,会很快把歧义过滤掉?因为人有常识。再举一个例子,假设你们家有服务机器人,你跟他一起帮小孩洗澡,你跟机器人说“洗完澡以后记得把水倒了”。机器人的做法很可能是把小孩洗干净,把盆端起来,连水带里面的小孩一起倒了,因为你跟它沟通的时候漏掉一个重要的信息,把小孩洗完擦干以后,把小孩抱出来,再把水倒了,为什么把关键的信息跳过去?这是常识,默认你知道的。人可以理解小孩和水,以及倒水这个动作的衍生的所有内容,所以会把这些关键信息跳过去,是为了加快效率。这些常识是人理解环境和自然整个运作机理很关键的内容,但怎么让机器理解,是一个挑战,不是简单让它背一个公式就可以的。

  此外,服务机器人的落地,还需要解决最后一公里的问题。腾讯投资董事总经理余海洋讲到,优秀的服务机器人公司,需要对特定的场景有比较深刻的理解。比如商务清洁,要打扫地下停车场的时候,要预设到有地下停车减速带的停车场,机器人怎么通过这些减速带。在广场也好,在商超也好,在办公室也好,在酒店也好,地面和空间的构造,以及需要清洁的污染物其也不一样,这就需要提供不同的打扫的能力,还要跟商超、酒店、广场也好整个管理体系和运营体系做好协作和配合,梳理形成好的流程。

  此外,服务机器人的发展也还需要渐进式的优化。比如老龄化是非常大的需求,但缺乏供给的解决方案,如果可以在供给方面有一点提升,就可以产生比较大的商业价值。要把大的需求切分成小需求,先一个一个解决小的需求,机器人可能没有办法一下代替保姆护工,但是能不能把东西拆分出来看一下,有没有更好的方式实现。人形的设计本身是很有挑战的事情,我们现在看到更多的是四轮的在各个地方跑,无论是在路上跑还是家里跑,在实际过程当中需要考虑需求是什么,需求有多大有多刚需,这个需求能否切出来,从标准化容易做的方面来做,同时要考虑供给方面方案是否对比其他的方案有优势,如果有优势能否形成正向化的产业和滚动,这样可以慢慢在发展过程当中解决问题。我们在实际不同场景当中,看看可以优先解决哪些问题,包括通过资金注入来支持创业者持续迭代优化。

  徐迎庆教授认为用户体验是非常重要的。业界总讲一个笑话,某人手里拿了一把锤子,他看到处都是钉子。这个是不对的。因此,我们要看到用户的刚需是什么。高科技不一定是新科技,某些新科技也不一定是现阶段可以满足我们刚需的东西。

  最后,腾讯研究院司晓院长介绍,通过腾讯新闻做了一个调研,很多网友都关注隐私和就业替代问题。比如之前方仓医院在上海日薪开到1800-2000都招不到人,不得以用了机器人,当服务机器人大范围地进入到我们的生活场景当中时,也会有就业替代。机器人还可以从病人散发的气味能够识别病情,是非接触式的,这在医院场景做检查是OK的,但如果是联网的机器人,就会有隐私问题。这些都需要产业界共同探讨,合理解决。

  人机协同无疑是大势所趋,让机器服务于人,而非替代人,是初心和方向。面对人与机器人的多重互动关系,业界更需要坚持向善向上,让技术变得更可解释、更可信和更安全,让技术去增强人的能力,服务人的需求,共同创造更多人机协作的美好未来。

  (来源:新视线)

责任编辑:于安绪

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2022 SINA Corporation

All Rights Reserved 新浪公司 版权所有