2023年,以ChatGPT为代表的大模型应用掀起新一轮的人工智能革命。GPT从第一代的50亿个参数,逐渐壮大至GPT4.0的万亿级参数,这背后也意味着对芯片算力的需求的不断攀升。在人工智能时代,算力即生产力和资本。根据浪潮和IDC联合发布的《2020全球计算力指数评估报告》指出:计算力与经济增长紧密相关,计算力指数平均每提高1个点,数字经济和GDP将分别增长3.3‰和1.8‰。AI计算的占比正逐年提高,预计到2024年将达到23%。
然而,我国却正在面临着海外高端算力芯片供应受限,且生成式AI芯片“一芯难求”的局面。AI硬件自主可控成为当务之急。在这样的背景下,9月20日,中国领先的互联网平台出海企业昆仑万维宣布将投资控股AI算力芯片企业艾捷科芯,根据昆仑万维公告,合计出资6.8亿元人民币,获得艾捷科芯58%的股权。增资后,艾捷科芯将纳入公司并表范围。
昆仑万维是生成式AI的积极拥抱者,今年4月17日,公司发布了“天工”通用大模型,其推理能力大幅领先GPT3.5和LLaMA2。此次控股艾捷科芯之后,昆仑万维将进一步完善其AI版图,为生成式AI打下坚实的技术基石。此举不仅标志着昆仑万维成功完成了AGI与AIGC全产业链布局,也意味着国内生成式AI赛道中新添一员大将。
艾捷科芯:专注于生成式AI的高性能计算
昆仑万维投资控股的艾捷科芯,是一家专注于AI大算力及配套芯片的研发生产企业,尤其聚焦于生成式AI的智能计算。其核心团队汇集了来自芯片研发、集成电路、人工智能及大型语言模型等领域的顶尖专家和学者。
其中,公司创始人蒋毅敏博士是芯片领域的领军人物。他于1996年毕业于清华大学电子工程系,并在美国马里兰大学取得了电机工程硕士和博士学位。蒋毅敏博士在卫星、无线通信、数字电视、可配置矢量数字信号处理器等领域有重要创新突破。艾捷科芯算是蒋毅敏博士的第二次创业,早在2005年,蒋毅敏博士回国联合创立了半导体设计公司——北京中天联科科技有限公司,并出任首席技术官。凭借卓越的业绩,中天联科于2009年被国际知名评估机构iSuppli公司评为中国集成电路设计行业的领军者。
蒋毅敏博士不仅是一位出色的企业家,还是一位眼光独到的投资家。他是国内多家市值达数百亿元人民币半导体企业的董事(例如安路科技),并主导投资了盛科通信、半导体公司派瑞股份、OLED显示驱动芯片公司云英谷等高科技企业。
「半导体行业观察」独家采访艾捷科芯蒋毅敏博士获悉,艾捷科芯所要打造的首先不是一款DSA(Domain Specific Architecture,领域专用架构)芯片,也不做图形处理,而是旨在开发一款可编程的、具有高性能的NPU产品。在功能上,推理和训练都将会涉猎。在蒋毅敏博士看来,对于生成式AI芯片而言,软件生态的重要性不亚于芯片本身。
自从英伟达的GPU在生成式AI市场上取得巨大成功之后,在国际舞台上,许多企业已经认识到了生成式AI芯片的应用潜力,并投入了大量资源进行研发。其中不乏有传统的AI芯片公司和新进场的初创公司,如Graphcore、Cerebras和SambaNova,都对生成式AI芯片赛道“虎视眈眈”,正在试图通过生成式AI芯片改变现有的竞争格局。不过这个市场不是那么容易,强如英特尔和AMD,在打生成式AI市场上都略显吃力,其难度可想而知。
对此,蒋毅敏博士坦言,生成式AI芯片的研发难度确实很高。与传统AI芯片相比较而言,首先,像ChatGPT这样的AI应用需要大量的模型参数训练,其计算量很大,所需的并行处理能力更强,对算力本身的需求高;其次,它处理的数据量巨大,因此对内存带宽有很高的要求,即数据读取的速度要够快;最后,基于Transformer结构的大模型大量采用了注意力机制,与基于CNN(卷积神经网络)和RNN(递归神经网络)的AI芯片相比,生成式AI芯片中的神经元间连接众多,因此需要强大的扩展(Scale out)能力。
所以,可以看出生成式AI芯片面临的核心挑战主要有三个:一是如何提高计算速度;二是如何优化存储;三是如何有效地进行互联。在解决存储优化这一挑战时,许多当前市面上的主流生成式AI芯片选择采用了HBM技术。例如,英伟达的最新GPU使用的是HBM3,而英特尔的Gaudi2,专为大模型设计,采用的是HBM2。HBM,全称“High Bandwidth Memory”,是一种高效、堆叠式的DRAM技术。与传统的DDR型DRAM(如DDR4和DDR5)相比,HBM为用户提供了更大的数据传输带宽。蒋毅敏博士指出:“HBM的优势在于其高存储密度,例如单颗芯片能达到80G的密度。但它的数据传输速率相对有限,大约可达到1.2~2TB/s,并且功耗较大。所以,在存储密度与读取速度之间,我们需要做出权衡,这正是我们的创新点所在。”为了在技术上实现新的突破,公司正在考虑采纳一系列创新的架构设计。
值得一提的是,为了加速研发和产业化,艾捷科芯还与中国科学院微电子研究所以“产研结合、互利共赢”为宗旨,签署合作意向共建实验室。实验室主要聚焦于高性能计算领域的先进存储、封装技术的研发,以及与高性能算力系统集成的系统技术研发和产业化工作。
昆仑万维完成AGI与AIGC全产业链布局
据官网显示,昆仑万维是中国领先的互联网平台出海企业,深耕海外市场十余载,业务覆盖包括信息分发、社交、 娱乐、元宇宙、游戏及 AIGC 等多个领域。昆仑万维自2020年开始布局AGI,经过三年的积累和沉淀,于今年4月17日发布了“天工”通用大模型,此后,昆仑万维又开始了积极探索大模型的落地。昆仑万维率先从搜索引擎方面突破,于8月23日发布了国内第一款融入大语言模型的搜索引擎——天工AI搜索,助推传统搜索迈入AI时代,成功实现了大模型应用的率先落地。
天工大模型的性能也表现不斐,在9月16日的Benchmark GSM8K测试中,天工以80%的正确率脱颖而出,大幅领先GPT-3.5(57.1%)和LLaMA2-70B(56.8%),即将接近GPT-4。除了推理性能之外,天工大模型在GSM8K、MMLU、C-EVAL、HumanEval四项数据集测试中,天工大模型均获得较高的正确率。如下图所示,其核心性能均达到了国际领先水准。这不仅证明了天工大模型的“聪明”程度,更显示了其出色的通用适用性。
随着对艾捷科芯实现控股,昆仑万维的布局将涵盖大算力、大模型算法、AI应用,进一步完善了其在AGI与AIGC的产业链布局。不仅如此,随着后续生成式AI芯片的推出和算力上的支持,昆仑万维将可以研究、开发并实施更为先进的AI算法和框架,有能力处理更复杂的AI应用,为用户提供即时和更为精确的反馈,从而提高用户体验。这种全产业链的布局有助于昆仑万维进一步推动AI产品的落地。
需要强调指出的是,昆仑万维已经构建起涵盖AI大模型、AI搜索、AI音乐、AI游戏、AI社交、AI漫画等六大AI业务矩阵。因此,除了天工大模型和天工AI搜索之外,昆仑万维将会进一步开拓更广阔的生成式AI市场。蒋毅敏博士也指出,生成式AI市场的需求是多元的。目前市场上已经有许多基于生成式AI的应用,如生成文本、代码、搜索引擎和画图等。除此以外,包括AI游戏中的NPC(非玩家角色)、私有云和数据保护在内的特定垂直领域,国内也会有大量的特定领域的需求。因此,从一个细分市场切入,进行深入研究和开发是比较好的策略。
而对于艾捷科芯而言,在获得昆仑万维投资背书之后,昆仑万维既是股东,又是下游的潜在客户,能够更好的帮助艾捷科芯做好产品定义,是双重助力的体现。
在蒋毅敏博士看来,要想在生成式AI领域中脱颖而出,有四点很关键:“首先,要定义好产品,明确使用场景和主要用例是什么?第二是找对人和团队。再者,技术路线的选择很重要;最后就是拼技术和执行力。”
结语:
从文本语言、图片、视频到各行各业,生成式AI的影响还在不断扩大。而昆仑万维和艾捷科芯这样上下游全产业链的紧密联动,将更有助于国内生成式AI的加速发展,进一步抢占先机,先发制人。
虽然在当下,生成式AI芯片是巨头的天下,但对于定制化和特定应用场景的需求,国内初创公司拥有先天的地理和文化优势,可以更快响应市场并精准定位。结合中国庞大的内需市场和产业链整合能力,国内初创企业有望分得一杯羹。从长远看,生成式AI芯片不仅是硬件升级,更将涉及到底层技术体系的革新,生成式AI芯片将是芯片公司所要攀登的新高地!群雄逐鹿,AI芯片的号角再次吹响。
(来源:News快报)