“讲卡伤感情，没卡没感情”，沈向洋外滩大会谈大模型：算力、算法、数据是关键|沈向洋|算法|人工智能

　　 “真正做大模型的公司，如果你一万张卡都没有，你就根本不要讲自己是在干大模型的公司。”

　　通用人工智能时代，我们对大模型应该有怎样的思考？9月5日，在2024Inclusion·外滩大会上，提到人工智能、大模型如何深入产业时，香港科技大学校董会主席、美国国家工程院外籍院士沈向洋抛出了这个问题，探讨未来人工智能、大模型如何才能深入产业。

　　在这个问题上，沈向洋认为，最重要的是三件事情：算力、算法、数据。

　　“讲卡伤感情，没卡没感情”，沈向洋分享了一组数据，从2012年开始，每年大模型需要的算力都在增长，一开始几年是六七倍的增长，最近几年稳定下来，每年是四倍左右的增长。而随着大模型的参数越来越大，大模型对算力的要求已经由线性增长进化到平方向的增长。如今，算力已经是大模型落地的门槛，“真正做大模型的公司，如果你一万张卡都没有，你就根本不要讲自己是在干大模型的公司。”

　　讲起“卡”，沈向洋表示，目前整个计算机芯片行业的发展，从原来的摩尔定律变成了黄氏定律。以前是CPU的增长，摩尔定律是指每18-24个月，计算能力翻倍。现在是GPU的算力一年涨4倍。人类社会的计算能力呈现了一种超级跃进趋势。

　　这也突出了数据的重要性。“GPT3刚出来的时候是2个T的token，GPT4刚出来的时候是12个T左右的数据，后来还在不断地加数据训练，现在我们猜GPT4是20T的数据。大家在望穿秋水等GPT5出来，到底要用多少的数据？”沈向洋给出的猜测是200个T的数据，但如今的互联网要挖出200T的数据已经不容易了。沈向洋感慨，互联网40年积累的数据，似乎就是为了一个AI时刻。

　　沈向洋认为，大模型的下一章要从语言模型到多模态发展。尽管Sora已经做得不错，但多模态大模型仍不够强大。他强调，大模型未来一定要往具身智能走，往机器人走，自动驾驶就是一种机器人的特别形态。

　　随着大模型的发展，沈向洋提出，未来大模型将横扫所有垂直行业。大模型可分为通用大模型、行业大模型、企业大模型和个人大模型。通用大模型大致是万亿参数，万卡训练。行业大模型大致上是千亿参数、千亿卡的训练规模。企业大模型可能只需要100张卡、百亿参数。而个人大模型最被沈向洋期待，比如联想、微软推出的AIPC，苹果号称的Apple Intelligence,利用个性化参数，结合云和端，都被沈向洋视作有意思的尝试。

　　同时，沈向洋也强调了AI治理的重要性。他表示，目前AI可能对民众、公司、政府监管乃至社会发展的冲击都在引发大众的担忧，接下来全球各个国家一定要做主权人工智能，主权人工智能背后一定要有一个主权云来支持其发展，通过国家支持人工智能基础设施建设，用符合本国文化和思维方式的数据训练大模型，支持本地产品形成生态系统。

　　而对于业内备受关注的AI agent（智能体），沈向洋的观点是，agent从愿景到落地的过程中，需要始终以需求为圆点，深刻理解模型的能力，并构建一个AI深度参与的工作流程。他判断，AI agent时代的到来，不会是一个神奇而强大的模型突然代替了原有的工作流，它涉及技术、工程与市场的不断磨合，最终以超预期的服务呈现给人类。

关键字 : 沈向洋算法人工智能