新浪新闻客户端

企业入局大模型第一关:如何选择适合自己的产品?

企业入局大模型第一关:如何选择适合自己的产品?
2024年10月17日 13:11

  如果说2023年是大模型技术的爆发之年,那么2024年则是大模型走向应用的关键之年。大模型正在千行百业逐步落地,诸多企业希望搭上这趟高速列车,驶入业务增长和商业创新的快车道。Gartner预测,2026年超过80%的企业都会接入生成式AI或大模型。

  一项新技术在实际落地中总会遭遇诸多困难,这是不可避免的阵痛。可以预见,企业在大模型落地过程中也会面临诸多挑战,而如何从琳琅满目的大模型中选择一款更适合自己的产品,成为了企业面临的第一个难题。

  头部基座大模型盘点

  市场上的基座大模型琳琅满目,它们是大型预训练语言模型,通过海量数据训练具备了通用能力,并能通过进一步的微调和增强来适应特定的应用场景。本文围绕长文本能力、结构化和非结构化数据处理能力、理解能力、知识产权属性、部署环境等维度对市场上的主流大模型进行了分析:

  1、LLaMA3

  由Facebook Research开发,包含不同规模的模型,如8B、70B、405B等。

  •   优势:支持多语言,具有良好的多任务学能力,有活跃的开源社区,持续进化速度快。其中大尺寸的模型能够与当前领先的闭源模型如GPT-4、GPT-4o、Claude 3.5 Sonnet等相媲美。

  •   不足:在中文任务上的表现还有提升空间,大尺寸的模型部署成本较高,非自主知识产权。

  2、GPT4

  OpenAI开发的大型语言模型,这一系列包括GPT3、 chatGPT、 GPT-4 Turbo、GPT4、GPT4o、GPT-4o Mini 等等,GPT的尺寸普遍偏大,从到GPT3.5的175B,到GPT4推测的1.76T的参数。

  •   优势:目前在所有的基座大模型中,拥有高的准确率和好的会话体验,拥有非常出色的意图理解能力,有多语言多模态支持,生成能力强大,应用场景广泛。

  •   不足:闭源模型,只能支持远程token调用,无法私有化部署,在国内使用不方便。

  3、ChatGLM

  ChatGLM系列是由清华大学团队开发的开闭源双语对话模型,支持中文和英文的对话理解与生成。模型和尺寸很多,比较有名的有早期的glm6b和glm130b,以及新的GLM-4-Air和GLM-4-9B;其他版本还包括GLM-4V-9B、GLM-4-0520、GLM-4V、GLM-4-AirX和GLM-4-Flash等。

  •   优势:自主知识产权,小尺寸的模型开源,支持工具调用、代码执行等复杂场景,支持在不同硬件上部署,包括手机、CPU、GPU等,特别是能够适配国产GPU。

  •   不足:在特定垂直领域上适配性有待提升,可能需要更多的微调才能达到佳性能,只开源了小尺寸模型,较小的规模限制了它们处理极其复杂的语言任务的能力。

  4、通义

  通义大模型是由阿里巴巴提出并开源的大型预训练语言模型系列,在预训练阶段使用了多达3万亿个token的多语言数据,特别关注中文和英文。通义拥有从1B左右到上百B的多个尺寸模型。

  •   优势:多语言支持,有上下文处理能力(32K),有强大的工具使用和Agent能力。通义作为开源模型,在多个基准测试中表现出色,例如在自然语言理解、数学问题解决、编程等任务上超越了相似规模的基线模型。拥有自主知识产权,支持国产GPU。

  •   不足:在处理图像、视频等非文本数据方面的能力可能不如一些专门用于多模态任务的模型,在一些特定领域或专业任务上,需要额外的微调才能达到佳性能。

  5、Yi

  零一万物是由知名计算机科学家、投资人李开复博士创立的企业,致力于开发大型预训练语言模型。零一万物的Yi模型系列包括不同规模的模型,例如Yi-6B、Yi-9B、Yi-34B等,其中Yi-Large模型在多项评测基准中全球领跑。

  •   优势:自主知识产权,在多项评测基准中全球领跑。在中文能力评测中,Yi-34B-Chat模型在SuperCLUE上排名仅次于GPT4-Turbo。该模型采用了先进的算法和技术,在语言处理、逻辑推理、图像识别等方面均表现出色。

  •   不足:在长上下文处理上存在一些局限,需要社区的持续贡献来进行维护和更新,大规模微调和训练时需要较多的资源。

  6、文心一言

  文心一言是百度全新一代知识增强大语言模型,常见版本包括文心大模型3.0、3.5、4.0和4.0 Turbo。文心一言当前累计用户已达3亿,日调用次数达5亿,参数超万亿。

  •   优势:文心一言具备知识增强、检索增强和对话增强的技术优势,拥有较强的非结构化数据处理能力。依托百度强大的搜索算法和知识图谱,文心一言在语义理解、知识问答方面表现卓越,支持多模态生成,拥有自主知识产权。

  •   不足:文心一言缺乏特定领域的深入分析和推理能力,生成的内容存在准确性问题,不支持私有化部署。

  7、混元大模型

  混元大模型是腾讯推出的多模态大模型,拥有超千亿参数规模,预训练语料超2万亿token,发布虽然相对较晚,但是模型在中文创作能力和复杂语境下的逻辑推理能力已经具备了强劲的优势。腾讯混元大模型‌拥有多个型号,以满足不同用户和场景的需求:高配置版混元-pro‌具有万亿参数规模,在国内率先采用了混合专家模型(MoE)结构;主力型号之一‌混元-standard衡了性能和成本,能够满足大多数企业和个人开发者的需求;轻量级版本‌混元-lite完全免费开放给企业和个人开发者。

  •   优势:混元大模型具备较强的多轮会话能力,支持文学创作、文本摘要、角色扮演等多种文本创作形式,输出流畅、规范、中立、客观,采用格式化思维链技术、“探针”算法和搜索增强技术,混元大模型能够有效解决事实性、时效性问题,提升内容生成效果。

  •   不足:虽然混元大模型在多轮对话、内容创作等方面表现出色,但在严肃场景、工作场景和专业场景中的大面积应用还无法完全胜任,需要进一步的技术迭代和优化。

  8、百川大模型

  百川大模型是百川智能开发的一款基于Transformer架构的深度学模型,专注于自然语言处理任务。‌百川大模型包括Baichuan2-7B、Baichuan2-7B-Base、Baichuan2-13B、Baichuan2-13B-Base、Baichuan2-13B-Chat、Baichuan3、Baichuan-NPC、Baichuan-53B、Baichuan 4等多个版本,服务于不同的应用场景和需求。

  •   优势:开源可商用,相较于其他模型,百川大模型提供低成本的部署方案,针对企业高频场景优化,提升了内容创作、知识问答和角色扮演的能力,同时采用搜索增强技术实现大模型与领域知识、全网知识的链接,支持多种文档格式和网址输入,输出结果准确、专业。

  •   不足:作为初创公司,百川智能在服务响应和售后支持方面可能存在挑战,相较于其他成熟的大模型提供商,百川大模型的系统生态和产品矩阵可能还不够全面,市场的认知度和接受度方面可能也需要进一步提升。

  9、火山方舟大模型

  火山方舟是字节跳动火山引擎推出的一站式大模型服务台,旨在通过提供开放、高效、安全的台服务,加速大模型技术在各行各业的应用,帮助企业实现数字化转型和智能化升级。

  •   优势:火山方舟集成了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等多家AI科技企业及科研院所的大模型,火山方舟台提供模型精调、评测、推理等全方位的服务,同时利用其在个性化推荐算法方面的优势,推动大模型与用户之间更自然的交互形式。目前火山方舟已经在字节跳动内部多个业务团队中得到应用,如抖音、头条等,显示出其在企业级应用中的潜力和效果。

  •   不足:市场上已经有了很多重量级玩家,火山方舟作为新手玩家,需要找到自身的差异化定位;火山方舟虽然集成了多款大模型,但在特定行业或领域的深耕和定制化服务上不如一些专注于特定领域的竞争对手。

  10、盘古大模型

  盘古大模型是华为推出的一系列人工智能预训练模型,涵盖了NLP大模型、CV(计算机视觉)大模型、多模态大模型、预测大模型和科学计算大模型等。新版本盘古大模型5.0包含了不同参数规格的模型:十亿级参数的Pangu E系列、百亿级参数的Pangu P系列、千亿级参数的Pangu U系列、万亿级参数的Pangu S系列。

  •   优势:提供从10亿级到万亿级参数的大模型,以适应端侧到云端不同业务场景的需求,新的5.0在AI算力台的使能训练下,在多模态理解和生成上有了大幅提升,目前模型已在工业领域、气象预报、自动驾驶等场景实现应用,显示了其跨领域的实用性。

  •   不足:依赖特定的硬件优化,这可能限制了模型在其他硬件台上的性能和可用性;在技术细节和可解释性上不够透明,这可能限制了社区的参与和模型的进一步创新。

  11、Kimi

  Kimi由中国初创公司月之暗面推出。

  •   优势:Kimi‌以出色的长文本处理能力而闻名,一次性可以处理高达200万字的文本信息。Kimi拥有较强的非结构化数据处理能力,拥有卓越的中文理解能力和自主知识产权。

  •   不足:Kimi在翻译特定领域内容时输出失败的情况较多,在处理结构化信息和图像中潦草文字的识别方面不尽如人意,在对话连续性和生成能力上也尚未达到完美,且不支持私有化部署。

  凭借海量的语料预训练,基座大模型拥有了强大的推理能力;由于所用的语料涉猎广泛,因此大模型能够在各种应用环境中进行推理和生成文本。

  虽然拥有强大的通识理解能力,但基座大语言模型对具体行业的理解比较有限,难以确保在特定应用场景的高准确度。另外,基座大模型对结构化数据的分析能力也非常有限,即使通过微调和增强可以融入部分行业知识,但其在准确度要求高的场景,例如数据决策分析和智能问答等应用中,仍然难以满足企业的需求。

  数巅企业大模型

  面对以上挑战,数巅企业大模型应运而生。

  数巅企业大模型由数据虚拟化引擎X-Engine驱动,能够将企业内外部结构化和非结构化数据进行融合,对基座大模型进行微调和增强,训练大模型Agent。此外,数巅企业大模型还沉淀了数百种工具,包括意图识别、数据分析、资产查询管理、报告生成、异动归因和数据预测等,让大模型Agent能够通过调用工具准确地执行用户的意图,并根据结果进行进一步的操作。

  数据虚拟化引擎X-Engine可以快速响应各种工具的数据调用需求,为其提供准确的数据,让数巅企业大模型在特定的场景中达到极高的准确率。非技术背景的用户(企业高管、运营、销售和市场等)能够通过自然语言交互来使用数巅企业大模型产品,并在高度精准的场景中完成日常工作和商业决策。

  总体来说,数巅企业大模型通过数据虚拟化引擎X-Engine和RAG(检索增强生成)技术对基座大模型进行二次训练和增强,结合数巅科技大量的工具和行业沉淀,拥有了高准确率和快速的性能,百亿大模型的分析准确度达95%以上,远超千亿大模型GPT4+NL2SQL 70%的准确度。数巅企业大模型让基座大模型能够真正深入地应用到企业的日常业务中,让企业员工能够高效提升业务能力。

  数巅企业大模型从底层存储到上层应用的核心代码全部自研,解决了人工智能和大数据领域的基础软件核心难题,适配多家国产基座大模型,已完成多项国产化硬件兼容性测试,且支持私有化部署。

  当前,数巅企业大模型已经在金融、通讯和制造等多个行业成功落地,帮助中国电信、中国移动、浦发银行和天弘基金等企业成功实现了数据智能升级。

  (来源:点财网)

责任编辑:何奎良

文心

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2024 SINA Corporation

All Rights Reserved 新浪公司 版权所有