新浪新闻客户端

心理学知识→算法 AI大模型训练也需要“鼓励”

心理学知识→算法 AI大模型训练也需要“鼓励”
2024年05月30日 15:00

  大家一般认为研发AI大模型的都是学人工智能的工程师,而今天我们要认识的是几位学心理学的训练师,他们与大模型之间有着怎么样的故事呢?一起跟随记者去北京中关村的一家科技企业看看。

  当记者来到这家企业时,大模型开发团队正在进行产品的新一轮迭代升级。研发负责人彭菲告诉记者,这个不算大的办公区里集聚了大模型研发的所有核心工作人员。

  汉王科技股份有限公司大模型团队负责人 彭菲:我们最主要有算法工程师,然后还有标注员、产品经理、软件工程师以及AI心理训练师。

  彭菲告诉记者,他们的大模型已经能做到逻辑推理、计算、多语言对话,应用于教育教学、日常办公、法律咨询等领域,这个年轻的AI心理训练师小组,在研发团队中平均学历最高,研究方向是发展心理学、认知理论、心理语言等。面对在电脑里看不见摸不着的AI大模型,他们的工作是做什么呢?

  为解答记者的疑问,王静文特意展示了一个面向中小学生英语交流大模型早期的检测界面。当问到“我游泳的时候需要注意什么呢”,大模型立刻给出了非常完整的回答。

  记者:这个你看答得很不错的。

  王静文:对这个回答是比较完整,但是它其实并没有站在一个小朋友的角度来讲,它现在的表现是一种人格就像是一个专家一样,但是我们希望把它塑造成另一种,是一个亲切的活泼的小朋友。

  记者:想要给它进行纠正,又通过什么样的方式呢?

  王静文:这个时候我们就要跟它强调一下,“请注意表达的内容需要让中小学生理解。”所以这个背后其实蕴含着一个发展心理学的逻辑,来帮助它更好地理解我们希望它变成什么样子。

  大模型像小孩 也需要鼓励

  “请注意表达的内容需要让中小学生理解。”经过AI心理训练师的辅导,大模型对“我游泳的时候需要注意什么呢”这个相同的话题再次进行了回答。它回答的有没有进步?

  记者:我们能够明显地感觉到,它的回复变少了。

  王静文:它现在这个句子其实变得比较简单了。如果你回答了它的一些问题,它还会跟你说“你回答得很不错,真棒”来鼓励我继续和它进行对话。

  AI训练师一次次的训练指令如同对孩子一点一滴的教育,让它不断增强与人沟通的能力,而就像好孩子是夸出来的一样,如果多一些正向的激励,大模型的表现也会更好。

  吴慧媛:请你根据上述要求,尝试重新作答,相信你可以做得出彩,加油。

  记者:你还会给它说这种鼓励的话?

  吴慧媛:对,当我们对它去进行一定的鼓励,并且对它接下来的表现予以期待的时候,它会做得更好。

  记者:其实大模型真的有点像一个人一样。

  吴慧媛:而且很像一个小孩,也是很需要鼓励的。

  助力大模型快速成长

  我们看到,心理训练师们就像老师教育“学生”一样细心培养着大模型。训练师们告诉记者,光靠循循善诱的鼓励远远不够,AI心理训练师和算法工程师们要紧密“捆绑”在一起,将心理学知识转化为算法,才能够成为大模型的核心能力。

  彭菲告诉记者,大模型可以通过学习海量的文本数据,捕捉到数据中的模式和规律,进而理解并生成自然语言,表现出接近人类的交流能力。AI心理训练师给出的文字指令,由算法工程师“翻译”成代码语言,大模型“消化吸收”后能够快速提升学习能力。因此,给大模型提供的数据质量,是直接影响它能力强弱的关键。

  汉王科技股份有限公司大模型团队负责人 彭菲:他们在数据上面会提供更多这种非常高质量的有针对性的数据,对我们的模型提升能力是非常大的,另外他们也会提供一些更高层次的指导的训练方法,它不是一个具体的一个算法,但是它会从理论上给我们一些新的思路,让我们知道哪些方向是可以继续去努力的。

  就这样,在一次次发现问题、解决问题的过程中,大模型经历了上百次的迭代升级,逐渐能够娴熟地在日常应用中对答如流。然而,AI心理训练师团队仍然需要设计各种各样的测试题目,找到并优化隐藏在底层的一些认知盲区。

  AI心理训练师 尉靖超:比方说这个问题,说四个人一块玩扑克牌,一共玩了40分钟,咱们都知道,玩扑克牌背后有一个隐含的假设,就是每个人同时都在玩,但是咱们看一下模型的回答,4个人除以4等于10分钟,所以说一个人玩的应该是10分钟。

  训练师发现,大模型在某些专业领域俨然像一个专家,但是缺失人类从小成长中得到的一些生活常识和认知逻辑。

  AI心理训练师 尉靖超:当它没有这个常识的时候,它又要回答用户的问题,那它就要开始用它的逻辑思维,它就开始想,哦那我给你计算一下,那每个人平均一下,那我算好,它其实是错的。虽然错了,但是很自信。

  记者:那你会怎么给它纠正呢?

  AI心理训练师 尉靖超:我们对它的解释最好是一种能够不仅仅是基于眼前这个题,而是把同一类型的,它应该真正具备的思路和能力,来通过提示词来给它进行强化,让它不要犯规律上的错误。

  就这样,大模型经过反复的指令训练和修正后,终于给出了正确的答案,并且触类旁通地给出了让人意想不到的解释。

  AI心理训练师 尉靖超:你看它说,就像有四个人在同一个房间里,房间里的总时间就是每个人在房间里的时间一样,所以有时候它根据提示词所产生的一些“化学反应”,其实也是很微妙的,当你看到它分析的这种闪光点的时候,还是挺惊艳的。

  跨界融合是人才新趋势

  AI心理训练师为大模型的研发提供了独特的视角和方法,让大模型更加贴近人性,更加智能。这个新兴的职业虽然从业人员还很少,却为推动大模型研发迭代发挥着独特的作用。

  2023年初,“汉王天地”大模型研发团队正式组建。怎样让刚刚起步的大模型尽快成长?心理训练师和算法工程师,两个完全不同专业的人不断地互相碰撞、交融。

  汉王天地大模型团队负责人 彭菲:AI心理训练师会跟我们讲心理学的理论,听的时候觉得特别高深,但是听完之后脑子里没有留下东西,不知道怎么样把心理学理论灌输到大模型的算法里面去,就是要经过磨合和碰撞去探索,训练师们也会去学大模型的技术路线。

  AI心理训练师 吴慧媛:我们会有不清楚方向在哪里,但是大家在不断去探索的这个过程当中思维都是很迸发的,包括发展心理学、教育心理学、认知心理学相关的一些知识等等,把整个心理学史都有可能从头到尾地去捋一遍。

  如同重建一个人的认知,从感觉、知觉、学习、记忆能力的建立,到思维、动机、情感、人格的形成,心理团队和算法工程师们在不断碰撞、磨合中,逐渐摸索到大模型从“智力”到“智能”的成长脉络。这些年轻人在职业新鲜感中不断地迎接着挑战。

  AI心理训练师 尉靖超:你作为一个心理学从业者,当大模型出来之后,你的就业选择可能突然有一种超乎你想象的一种选择,并不是和人打交道,而是来和机器打交道,会发现心理学它是一个始于人但是又不止于人的这样一个学科。

  和办公室里其他工程师们的严谨不同,心理训练师们所处的区域明显多了几分亮色。而这样的跨界融合的职业,也随着新质生产力的推进在不断涌现。

  首都经济贸易大学中国新就业形态研究中心主任 张成刚:这些新职业的发展是建立在这些融合创新的基础上,它对于人才的需求就是一个跨专业的,或者是跨背景的一些人才的需求。所以其实我们反倒看到现在人才的要求是在提高的,特别是有这种跨专业背景的人才,他们可能更加适应我们现在这个新职业的发展。

  (总台央视记者 王琰 李欣 常江 张芊芊 李子国)

  (来源:News快报)

责任编辑:何奎良

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2024 SINA Corporation

All Rights Reserved 新浪公司 版权所有