→ 柯加

新贵无名小卒,揭秘火山引成为云核算擎怎么从

2025-07-04 09:22:17 . 阅读: 75943浏览

文|白   鸽。揭秘   。火山核算

编|王一粟 。引擎

AI,从无现已成为火山引擎打破云核算商场格式的卒成一张主力。

2020年6月 ,新贵字节跳动正式推出火山引擎,揭秘2个月后 ,火山核算谭待脱离百度,引擎挑选参加火山引擎 。从无

本年,卒成是新贵谭待掌握火山引擎的第五年 ,也或许是揭秘其最高兴 ,且最沉着的火山核算一年 。

“刚开端面试火山引擎的引擎时分,一些有阅历的朋友跟我说‘字节肯定做不起来’ 。”谭待说道,这也是压力最大的阶段,但“现在他们会跟我说 ,火山做得还挺好。” 。

字节跳动做云核算,比同行晚了10年 ,在我国公有云商场的排名中,也是列归于other系列。也正因而,关于字节跳动做云核算,许多人并不看好。

但现如今的火山引擎,不管是在字节跳动内部  ,仍是在外部职业,都开端支棱起来了。

2025年的火山引擎Force原动力大会(春季),比以往来得更晚一些 ,但却是历年以来参加人数最多的一次,整个国家会议中心二期的场馆中 ,每个展厅都坐满了来参会的人 。

一同 ,字节跳动CEO梁汝波的初次揭露站台 ,也给了火山引擎 ,并表明 :“做好火山引擎,对字节跳动成为一家优异的科技公司、坚持技能竞赛力很重要。” 。

从外部商场来讲 ,火山引擎官方数据显现,上一年12月 ,豆包大模型的日均Tokens调用量是4万亿 ,本年3月份到达12.7万亿。

到5月底,豆包大模型日均Tokens运用量超越16.4万亿,较上一年5月刚发布时增加了137倍。

别的,据IDC陈述显现 ,2024年火山引擎在我国公有云大模型服务调用量上稳居榜首 ,商场份额46.4% ,紧随其后的则是百度智能云和阿里云 。

对此 ,谭待表明,这部分的调用量核算则首要来自外部,而非豆包、即梦等字节内部耗费。

火山引擎的开展到达了史无前例的速度。这全部 ,得益于火山引擎对AI的押注 。

不过,谭待也坦言 :“AI带来了一个新赛道,咱们可以很快做到榜首,但在IaaS等公有云商场的存量赛道中,火山引擎还需求一点点往上走。” 。

上一年,火山引擎营收破百亿,本年预期营收到200多亿,而早在2021年,谭待对火山引擎未来的营收预期是1000亿。这也就意味着 ,火山引擎的万里长征,才刚刚走出榜首步 。

“咱们本年的方针仍是很急进的。”谭待说道,“究竟现阶段职业对AI的需求明晰明晰而巨大。” 。

打赢云核算排位赛 ,不只靠价格战。

在火山引擎之前 ,谭待曾任百度查找、网盘和根底架构首席架构师、T11等级技能专家,乃至有坊间传言 ,他还曾向百度智能云总裁沈抖报告过作业 。

谭待接收火山引擎后 ,对其技能架构进行了更新和晋级。不过,比较于技能体系,彼时的谭待接受的压力  ,首要来自商场拓宽。

据弗若斯特沙利文数据显现,2021年上半年 ,我国公有云商场格式根本已定 ,排名前五厂商占有了全体83.8%的商场份额 ,阿里云 、华为云 、腾讯云三分全国 ,运营商云中的天翼云排名第四,彼时火山引擎还仅仅边际玩家 。

也正是这一年,谭待给火山引擎设立了,未来8-10年要完结营收1000亿的方针。

彼时谭待为火山引擎开辟的商场增加空间 ,则来自多云商场趋势的开展。

但于火山引擎来说 ,多云战略的运用仅仅使其取得了参加这场游戏的资历 ,却并未使其在这个竞赛剧烈的商场中取得优势,更不用说改动整个商场格式 ,乃至也一向未成为我国第四朵云。

不过 ,在刚开端树立的前三年,火山引擎一边在拼命追逐根底设施的建造,一边尽力寻觅差异化 ,企图在高度老练和内容的职业中 ,杀出一片天空 。

时机总是留给有预备的人。

2023年头,AI大模型迸发,这给火山引擎带来了新的增加引擎。

面临一个新鲜事物 ,全部的新老玩家  ,简直都处于同一同跑线上。这对本来起步晚的火山引擎 ,现已很好了。

“这几年AI快速遍及 ,我觉得仍是挺走运 。”谭待直言 ,“AI公司的需求不小,但要求很高。许多公司挑选火山,不是因为咱们有卡,而是因为咱们可以安稳地把模型练习出来 。”。

前期火山引擎的方舟渠道,也是集成多种干流大模型,为客户供给模型练习 、布置等服务 。

不过 ,自上一年5月火山引擎发布字节自研基座大模型豆包之后 ,火山引擎在对外推进AI落地的进程中,更多是以豆包大模型为主。

一同 ,以豆包为根底 ,火山引擎首先敞开大模型价格战,让大模型定价进入厘年代。

而用价格换规划,契合互联网大厂过往的一向打法 。这一行为 ,也一度引发谭待和前领导沈抖之间的隔空骂战。紧随火山引擎之后,我国云厂商纷繁开打大模型价格战。

价格战带动了Token耗费 ,也就带动了云上算力的出售。对云厂商们来说 ,水面之上 ,打的是AI和价格战,水面之下  ,做的却仍然是算力的生意。

本年,火山引擎的价格战仍然继续 ,但此次不再是粗犷的一刀切 ,而是依据影响模型本钱最要害的输入输出长度来定价 ,详细来说  :

输入区间在32k-128k规划,豆包1.6价格是输入1.2元每百万Tokens,输出16元每百万Tokens;在输入区间128K-256K规划内,豆包1.6价格是输入2.4元 ,输出24元。关于绝大部分企业运用会集的0-32K规划  ,经过技能优化,豆包1.6价格是每百万Tokens 输入0.8元,输出8元。

“关于Agent而言 ,其需求处理许多杂乱使命,对Tokens的耗费量十分巨大。”谭待对光锥智能说道,“因而咱们这次立异做了区间定价 ,能会集把企业用最多的区间本钱下降63%,相当于只需求曾经三分之一的价格 ,就可以取得平等模型才能 。”。

但此次火山引擎对豆包1.6的定价 ,并未像上一年相同,与职业定价摆开很大的距离 ,“贱价仅仅刚开端对咱们有协助 ,现在咱们的定价都差不多。”谭待也直言道 。

贱价在短期内可以招引一些用户体会,但关于B端企业用户来说 ,愈加重视模型的终究落地作用 ,对产品的容错率十分低。

也正因而,对火山引擎来说 ,环绕豆包大模型构建ToB服务体系,带来两个长处 :

一是豆包大模型源于字节跳动内部研制,尽管其纷歧定是职业现在最强的基座大模型 ,但火山引擎更懂它的长处  ,让客户终究的体会更好 。

“豆包很灵敏 ,言语大模型才能也比较老练,全体客户体会感比较好。”一位AI玩具代工厂的相关负责人对光锥智能说道 ,“咱们也同步测了国内外其他干流大模型产品 ,但全体下来 ,仍是豆包这一套体会比较好,响应速度也比较快。” 。

事实上,在抢占商场中 ,字节跳动不吝下血本 ,除掀起大模型降价,还免费给许多硬件公司装上大模型。“咱们在商场开辟期,会免费给客户接入豆包大模型,还会做1对1的调试和服务。”一位字节跳动旗下的智能体渠道纽扣的研制人员对光锥智能表明 。

此次大会上火山引擎发布的豆包1.6版别 ,在深度考虑推理才能上也现已有了更大的提高 。

如针对高考全国新一卷数学单科测评 ,豆包成果144分,全国榜首  。高考前火山引擎团队针对海淀区模仿全卷进行测评,豆包1.6相对上一年体现,理科成果显著提高154分,文科则提高90分。

别的 ,更为重要的一点是 ,字节的 C 端产品有许多用户 ,会大规划调用模型,能帮火山引擎做好服务,一同也会有许多用户拿着C端的产品Case过来 ,期望火山可以将其落地在事务中。

“所以咱们有一个优势 ,C端豆包APP用户十分多  ,在这个过程中 ,就总结了许多怎样做好杂乱Agent的最佳实践 ,并经过火山引擎对外供给服务。”谭待说道。

价格低 、模型作用好,还有许多C端用户与B端协同,这让火山引擎在短短一年之内,就登顶了我国公有云大模型调用量榜首,完结了千亿营收方针中,万里长城的榜首步 。

火山引擎 ,怎样搞定AI客户 ?

细节决议胜败。

除了上面这些战略级的打法 ,咱们在与火山引擎多个客户的交流中 ,还发现了一些细节的隐秘  。

上个月,瑞幸咖啡在小程序界面中上线了一个根据豆包大模型打造的AI点单智能体 ,而就这个智能体的上线,瑞幸咖啡与豆包的协作也阅历了一段曲折。

“这个智能体研制时刻仍是蛮久的,前期直接对接的豆包,它们日活许多 ,流量很大,所以最开端压测就没过 。”瑞幸咖啡相关负责人对光锥智能说道 ,“后来是火山出场 ,协助豆包处理了这些问题 ,和咱们一同对整个架构从头做了优化 。”。

所谓的压测 ,是指对大言语模型进行压力测验,以评价其在高负载条件下的功用和安稳性。

众所周知,像瑞幸咖啡这种依靠线上小程序点单的店肆 ,往往会有顶峰波谷时刻段 ,其需求满意在顶峰时期 ,瞬时流量对大模型的安稳性要求。

明显 ,在火山引擎出场之前,豆包对瑞幸咖啡的轻量化交给并未完结。

不过 ,比较于瑞幸咖啡这种存在顶峰波谷的需求,AI玩具就不需求以很重的方法  ,去做产品集成开发 。

而这种轻量化交给,也可以给豆包带来比较高的调用量 。

“咱们直接跟豆包签定的协作 ,现在这个产品现已出售了几十万单。”上述AI玩具生成商相关负责人说道,“尽管详细运用豆包Token的量还没测算出来,但(出售)反应说咱们这两个月 ,尤其是端午节后,AI玩具的消费全体比较多  。” 。

除了新消费、AI玩具硬件等职业,火山引擎在轿车 、金融 、教育等职业落地也十分快。

其间 ,在消费电子职业 ,全球Top10手机厂商有9家和火山引擎深度协作;轿车职业中  ,豆包大模型助力了多半干流轿车进行AI晋级;金融职业中,火山引擎已服务华泰证券、国信证券等数十家券商和基金公司,招商银行、浦发、民生等70%的体系重要性银行;教育职业中,火山引擎已与北京大学、浙江大学 、南开大学等超五成985高校到达协作 。

值得一提的是 ,本年以来,火山引擎的轿车职业大客户数量明显增加 ,本次大会BBA代表宝马和奔驰、荣威 、极氪都为其站台 ,集成豆包大模型打造了智能座舱的极氪009光芒也现场展现。

在4月份上海车展官宣协作的上汽荣威 ,宣告两边将推进AI模型上车、AI大数据全面赋能轿车 ,打造“更懂顾客”的荣威AI轿车 。

对轿车职业客户而言,火山引擎除了嵌入豆包大模型的才能外,还会嵌入字节跳动的内容资源。

比方极氪的智能座舱接入了抖音集团全部互联网渠道,包含抖音视频、本地日子等 。“这样可认为用户快速提高整个座舱的感知体会 。”极氪智能座舱高档总监李程峻说。

除了这些传统各行各业的企业外 ,火山引擎也留意到了一些新式企业。

“AI年代诞生了许多优异的创业公司 ,这些公司尽管人员少 ,但却根据AI所诞生 ,一个人可以做许多事,所以可以继续迭代,功用研制也很快 ,每天Token耗费也许多 。”谭待说道 。

重生的AI创业公司 ,正在逐步成为云厂商的“绩优股”客户 。

现在,谈到AI年代的落地,更是离不开Agent(智能体)。

“Agent可以自主感知,规划和反思 ,完结杂乱使命,软件也是榜首次从被迫的东西 ,变成自动的执行者 。”谭待说道 。

“当时主体已产生改变,云原生体系是为Web、APP等最佳实践规划,但当AI年代主体变为Agent  ,就需求规划新的技能栈。”谭待说道 。

如Agent落地不只需求更强更好的模型 ,还需求有更好的Prompt Pilot ,让模型才能强化并处理更特定的使命;Agent所需求处理的数据,也不是结构化或非结构化的数据 ,而是要有各式各样更原始的多模态数据 ,所以需求为其构建多模态数据湖。

未来 ,Agent之间也会相互交流,协同作业,Agent之间的防护、安全就十分重要,需求构建针对Agent之间的安全防护体系,如火山引擎最新推出的AICC密态核算和大模型运用防火墙等。

火山引擎环绕Agent在企业中的落地,现已形成了一套AI云原生的体系化技能才能和产品 ,逐步沉积在PaaS层的东西链上 。

在云原生年代,火山引擎因为起步较晚,一向在补根底东西链的课;但在AI原生年代,火山引擎的AI东西链上的建造 ,却一向处在榜首队伍,这将是AI落地到千行百业的底气。

“最重要的仍是树立机制,客户想用好大模型 ,需求做好 prompt、模型要精巧 、有适宜的 RAG 常识库。咱们会组成专门的服务团队,和职业线团队做匹配去服务他们 。”谭待说道。

留在牌桌上  。

“云核算商场仍是规划决议全部,终究牌桌上一定有火山。”谭待说道 。

现在来看 ,火山引擎尽管现已杀入职业前五 ,但全体我国公有云商场格式并未产生很大的改变,阿里云、华为云 、腾讯云仍然占有着巨大的商场。

在AI云商场中,各云厂商也都在加码,百度智能云对AI云商场凶相毕露,阿里云更是要出资3800亿元构建AI云根底设施 。那么,火山引擎凭什么留在牌桌上?

在光锥智能看来 ,火山引擎留在牌桌上的筹码首要来自两方面:

一是根据豆包大模型构建的笔直优化才能。

谭待说 :“那些很杂乱的 Agent  ,让它做好杂乱使命,不只模型要优化,背面的服务也得优化 ,还要预备好调优的环境等等。咱们能供给的最大价值,是笔直优化的才能。”  。

一个则是价格战,这儿的价格战 ,不单单仅仅对大模型Token的调用定价 ,而是在整个面向B端服务时 ,选用的新式商业化方式 。

比方其打造的智能客服Agent ,在面向企业端落地时 ,以往可能是依照项目制或服务费的方式收取费用,但火山引擎智能客服Agent则是依照实践服务量收取费用 。

简略来说,智能客户Agent一天协助客户回复了多少条信息 ,火山引擎就收取多少费用。

“前期咱们首要收一次企业要在体系中做事务处理和体系对接的费用 ,后续都是依照量去服务收费 。”火山引擎智能Agent产品相关负责人对光锥智能说道。

而想要确保智能客服Agent每天所回复100条信息都是有用信息,会有一些观测方针。如教育职业中的客服,包含班主任、指导老师等 ,会继续跟家长交流学习的进展、讲义常识产品运用等 ,经过人机协同方式 ,可以看到到课率、完课率是否下降 。假如没有下降 ,就可以确定智能客服Agent可以对标到达真人服务的规范 。

不过,该产品负责人并未直接泄漏每条信息详细的收费规范 ,但也明晰表明,该产品的方针客户集体,更倾向于具有上千人力规划的企业,存在真实降本增效的痛点 。而这种收费方式的智能客服Agent产品 ,“每年可以至少为其下降一半的本钱。”。

关于许多云厂商来说 ,现阶段大模型带来的正向收益并不多,更多仍是以售卖底层云算力资源为主。

而于火山引擎而言,“模型现在带来的成绩增加 ,以及这一块产品收入的增速,是在全部产品中最快的 ,远超其他产品 ,且毛利也是最好的 。”谭待向光锥智能说道。

在内卷加重的商场中 ,火山引擎挑选要点押注AI新赛道,再以贱价“粗野包围” 。未来,它能否真实挺进前三,还需时刻验证。

不过 ,谭待的决心十分足够:“马拉松刚跑了500米”,未来商场空间最少会扩展 100 倍 ,火山会继续坚持国内 AI 榜首 ,在传统云服务的存量商场继续增大。

特别声明 :本文为协作媒体授权专栏转载 ,文章版权归原作者及原出处全部 。文章系作者个人观点,不代表专栏的态度,转载请联络原作者及原出处获取授权 。(有任何疑问都请联络idonewsdonews.com)。

柯加

爱读书,爱生活!

发表评论