新浪新闻客户端

“讲卡伤感情,没卡没感情”,沈向洋外滩大会谈大模型:算力、算法、数据是关键

“讲卡伤感情,没卡没感情”,沈向洋外滩大会谈大模型:算力、算法、数据是关键
2024年09月05日 19:31 第一财经网作者:陈杨园

   “真正做大模型的公司,如果你一万张卡都没有,你就根本不要讲自己是在干大模型的公司。”

  通用人工智能时代,我们对大模型应该有怎样的思考?9月5日,在2024Inclusion·外滩大会上,提到人工智能、大模型如何深入产业时,香港科技大学校董会主席、美国国家工程院外籍院士沈向洋抛出了这个问题,探讨未来人工智能、大模型如何才能深入产业。

  在这个问题上,沈向洋认为,最重要的是三件事情:算力、算法、数据。

  “讲卡伤感情,没卡没感情”,沈向洋分享了一组数据,从2012年开始,每年大模型需要的算力都在增长,一开始几年是六七倍的增长,最近几年稳定下来,每年是四倍左右的增长。而随着大模型的参数越来越大,大模型对算力的要求已经由线性增长进化到平方向的增长。如今,算力已经是大模型落地的门槛,“真正做大模型的公司,如果你一万张卡都没有,你就根本不要讲自己是在干大模型的公司。”

  讲起“卡”,沈向洋表示,目前整个计算机芯片行业的发展,从原来的摩尔定律变成了黄氏定律。以前是CPU的增长,摩尔定律是指每18-24个月,计算能力翻倍。现在是GPU的算力一年涨4倍。人类社会的计算能力呈现了一种超级跃进趋势。

  这也突出了数据的重要性。“GPT3刚出来的时候是2个T的token,GPT4刚出来的时候是12个T左右的数据,后来还在不断地加数据训练,现在我们猜GPT4是20T的数据。大家在望穿秋水等GPT5出来,到底要用多少的数据?”沈向洋给出的猜测是200个T的数据,但如今的互联网要挖出200T的数据已经不容易了。沈向洋感慨,互联网40年积累的数据,似乎就是为了一个AI时刻。

  沈向洋认为,大模型的下一章要从语言模型到多模态发展。尽管Sora已经做得不错,但多模态大模型仍不够强大。他强调,大模型未来一定要往具身智能走,往机器人走,自动驾驶就是一种机器人的特别形态。

  随着大模型的发展,沈向洋提出,未来大模型将横扫所有垂直行业。大模型可分为通用大模型、行业大模型、企业大模型和个人大模型。通用大模型大致是万亿参数,万卡训练。行业大模型大致上是千亿参数、千亿卡的训练规模。企业大模型可能只需要100张卡、百亿参数。而个人大模型最被沈向洋期待,比如联想、微软推出的AIPC,苹果号称的Apple Intelligence,利用个性化参数,结合云和端,都被沈向洋视作有意思的尝试。

  同时,沈向洋也强调了AI治理的重要性。他表示,目前AI可能对民众、公司、政府监管乃至社会发展的冲击都在引发大众的担忧,接下来全球各个国家一定要做主权人工智能,主权人工智能背后一定要有一个主权云来支持其发展,通过国家支持人工智能基础设施建设,用符合本国文化和思维方式的数据训练大模型,支持本地产品形成生态系统。

  而对于业内备受关注的AI agent(智能体),沈向洋的观点是,agent从愿景到落地的过程中,需要始终以需求为圆点,深刻理解模型的能力,并构建一个AI深度参与的工作流程。他判断,AI agent时代的到来,不会是一个神奇而强大的模型突然代替了原有的工作流,它涉及技术、工程与市场的不断磨合,最终以超预期的服务呈现给人类。

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2024 SINA Corporation

All Rights Reserved 新浪公司 版权所有