2025年03月14日
训练大模型成本高,腾讯等为何选择开源?企业融入大模型面临API调用(数据安全存忧)或自行部署(可降本,获取模型可买但贵、也可开源)的选择,选开源后因通用模型特定场景不佳需精调,腾讯云推出平台助力,企业付资源费,最终企业得定制模型,腾讯获客户与资源,实现双赢,这就是大模型开源逻辑。
训练一个千亿参数规模的大模型,成本极高,往往要耗费数百万乃至数千万美元。然而,像腾讯等公司却选择将历经艰难研发出的大模型免费开源,如腾讯开源了参数量高达3890亿的大模型,免费供所有企业和开发者使用。
这背后究竟藏着怎样的商业逻辑?今天,咱们就以腾讯为例,深入剖析一下。
API 调用:便捷却存隐患
但弊端是大模型部署在他人服务器上,企业与大模型交互产生的数据会传输过去,数据安全令人担忧。
自行部署:安全且可能降本
将大模型部署在自己掌控的服务器上,如同自己在家做饭,虽需亲力亲为,但安全可靠,长远看成本可能更低。
购买:
从大模型公司购买已训练好的模型,价格通常高得惊人。例如,一个千亿参数规模、类似GPT3的模型,每年授权费可能达数百万甚至数千万美元,企业对投入产出存疑,难以承受。
使用开源大模型:
一些公司将训练好的大模型开源,企业认为既然公开接受检验,质量应有保障。在开源大模型中,企业倾向选择参数量最大、效果最好的。
腾讯开源的混元large大模型,是同类型开源大模型中能免费使用且参数量最大的,公开测评在很多指标上得分比国外公认先进的开源大模型拉玛3.1还高,因而受企业青睐。
大模型微调需求与腾讯云解决方案
企业选定开源大模型后,因通用大模型基于公开数据训练,在特定场景表现不佳,需要大模型微调(精调),即使用特定领域、任务数据对其补充训练。
但大模型精调技术要求颇高,涉及数据处理、数据量确定、机器和显卡调度、效果评估等一系列复杂问题。
腾讯云适时推出专门用于模型精调的平台,配备大模型精调与部署所需的所有工具,涵盖从数据处理到模型训练、调试、测评、部署以及加速等各个环节。
企业使用该平台精调,只需按正常市场价支付租用服务器和显卡所产生的数据计算资源费用,这一方式合理且便捷。
双赢局面:开源背后的商业逻辑
最终,企业成功拥有专属定制大模型,腾讯收获企业客户并售出云计算资源,达成双赢。
众多类似企业与腾讯建立合作,这便是阿里、腾讯、meta质朴等公司将耗费巨大成本研发的大模型开源免费供大家使用背后的商业逻辑,企业基于自身需求自愿决策,在这一过程中各取所需。
现在,你应该明白为什么像阿里、腾讯、meta质朴等公司,愿意将耗费巨大成本研发的大模型开源免费供大家使用了吧。
点击蓝字:加微领取小程序报价表功能表