昆仑万维方汉表示,通用 Agent 往往被认为是大厂的专属领域,与创业者关系不大。他认为大厂凭借其雄厚的资源、技术和资金实力,更有能力去投入和研发通用 Agent 这类复杂的技术。而对于创业者来说,可能更多聚焦于细分领域的创新和发展,在特定场景下打造具有特色的产品和服务。然而,也不能完全忽视通用 Agent 的潜在价值,创业者可以通过与大厂合作或利用大厂的技术成果来拓展自身业务,而不是盲目追求通用 Agent 而忽视自身的优势和定位。
本文来自微信公众号:中国企业家杂志 (ID:iceo-com-cn),编辑:张晓迪,作者:闫俊文
5月26日,昆仑万维发布天工超级智能体(Skywork SuperAgents)APP,这款应用拥有PPT、Word、表格3个专家智能体和1个通用智能体,号称是全球首款基于AIAgent架构的Office智能体手机APP——8分钟完成8小时工作。
该产品一度爆火,在5月GAIA智能体榜上,位居全球APP指数第一。随之而来的是用户争相涌入,团队不得不采取限流措施。但这不是长久之计,最终昆仑万维选择不断加服务器,昆仑万维董事长兼总经理方汉告诉《中国企业家》:“目前已经取消了限流。”
就该产品本身而言,Word智能体采用Deep Research(深度调研)技术,可以撰写入门级金融报告,方汉解释其中的逻辑:
第一,模型的Function Call(调用外部工具)的能力有所积累。第二,资料来源由昆仑万维与知网、Wind等专业可靠的数据商签约获取。第三,他们针对上市公司的公告部署了特别的爬虫技术。
方汉认准了集采一定比单采要便宜的商业道理,对于用户来说,该Agent首先能实现降本增效目的。本质上,昆仑万维是替用户向所有的信源做集体采购,然后进行分发的智能中介。
关于Agent的护城河,方汉说,模型能力加上赛道的选择可能比时间和投入更重要。
这也是为何昆仑万维一直坚持做基础大模型的原因,但在DeepSeek等开源模型横空出世之后,这种策略变得更灵活了,方汉说:“对于通用大模型,我可能会外采。但一些专有大模型,还是要自己训练。”
在AI赛道,昆仑万维已经走了两年多,2023年4月,昆仑万维推出双千亿级大语言模型“天工1.0”,并对该大模型持续进行更新,先后推出了AI短剧、AI音乐、AI搜索与AI社交等产品。方汉称,在这些“AIGC赛道”,只要成本和门槛不断降低,就会迎来应用爆发,以短剧为例,该公司短剧平台DramaWave年化流水收入ARR(订阅服务下,企业年度经常性收入)达1.2亿美元,月均1000万美元。
今年前三个月,昆仑万维实现营收17.64亿元,同比增长46.07%,归母净亏损7.69亿元,同比下降310.32%。截至6月17日午间,该公司股价报33.83元,市值超过420亿元。
以下是方汉与《中国企业家》对话的详细内容(有删减):
在某些领域,模型能力已经超过了行业所需要的能力
《中国企业家》:Agent在立项的时候,公司内部有反对的声音吗?
方汉:肯定有很多反对。产品还是要从用户的需求去倒推,该不该做这个事——我们倒推之后,认为该做,就做了。
《中国企业家》:项目是什么时候开始做的?
方汉:这个项目做的时间不长,因为我们的技术需要前期积累,不管是AI搜索,还是我们的模型Function Call的能力,都积累了好几年。做这个Agent产品没多久,就几个月。
《中国企业家》:有没有受到2月爆火的Manus的影响?
方汉:Manus只是证明了这个事情是有需求的,我们想的是产品怎么落地,满足用户的需求。这就牵扯到一个根深蒂固的问题,是做通用Agent还是做垂类Agent?我们判断,在垂类背景下,我们更容易通过模型能力覆盖用户需求的边界。
《中国企业家》:你们的Agent产品,最核心的产品指标是什么?是月活还是留存或者是ARR?
方汉:我觉得还是ROS(销售回报率),就是假设有100个用户,其中多少人付费,如果没打正,商品的业务模式就不成立。
《中国企业家》:目前,用户对Skywork哪个功能板块需求更多一些?
方汉:生成PPT,这是一个刚需。此外,Deep Research也做得比较好,很多金融类研究所招一堆刚毕业的大学生写入门级报告,现在,这些入门级的报告的问题都可以用超级Agent来解决。
《中国企业家》:你们的Agent调用了哪些大模型?
方汉:有很多小模型,也有大模型,有自研的模型,也有外采的模型,这不是根本性的问题。根本的问题是怎么样完成事情,怎么样通过各种能力的组合,包含住用户需求的边界。
《中国企业家》:Manus说他们坚决不做底层模型,只做技术的工程化。
方汉:任何一个企业都一定要深入思考,做一个产品的护城河到底在哪?你不做模型只套壳的话,那么你就要赌你的护城河是什么,是用户的使用习惯?但在今天,用户的使用习惯似乎已变得没那么牢靠。
因为模型能力带来产品体验差别太大了,现在的用户其实是用脚投票,哪一个效果更好,他就跑到哪里。
在目前的阶段,有自己的模型能力还是非常重要的,只有等模型能力进入瓶颈之后,用户体验才会成为护城河。
《中国企业家》:模型能力高速成长的时期,这时候去做一个Agent产品,是不是很快就被下一个Agent所超越。
方汉:这话对,但也不对,因为所有的模型能力都在高速成长,在这个过程中,下一个C端产品的能力可能比已有的好很多,肯定就被超越了。
但在某些特别窄的领域,有可能模型的能力已经远远超过行业所需要的能力,如果做一个产品出来,那是可以长期生存下去的。比如,目前大家还在迭代文生图模型,但最早的Stable Diffusion仍在工程领域被大规模的采用,大家已经不关心文生图的模型迭代了,但文生视频的能力还没达到用户的需求。
《中国企业家》:DeepSeek出来之后,你们内部有讨论过,自研大模型这个事情要不要继续做?
方汉:我觉得这没什么可讨论的,大模型仍然是会继续做。只是说,选择的方向是以用户需求为导向,还是以技术指标为导向?这两个不一样,我们可能更选择以用户需求为导向。
这并不妨碍我们继续做大模型的工作,比如,预训练,我们的音乐模型和视频模型都需要预训练。只是,在文本大模型领域,我们是不是做最大的预训练模型,我觉得要看情况。
《中国企业家》:Agent的商业模式主流是订阅,它未来还有哪些商业性可能?
方汉:电商本质上也是广告,电商游戏也依赖于广告模式,广告模式的前提是拥有海量用户。
目前来看,我们瞄准的office场景,很难做到海量用户,我们必然以订阅模式为主。像其他的商业化模式一定是一个成本更低,然后用户人群更广的AI产品才能够做到,比如,谷歌的搜索。
越垂直,被大公司吃掉的可能性就越小
《中国企业家》:做Agent产品,要考虑接入小红书或者美团等超级APP吗?
方汉:我们做垂类Agent,不需要接那么多外部产品,因为我们现在主要做Deep Research,有搜索就可以,不一定要去接小红书或美团,那可能是其他方向Agent要做的事情。
在中国,信息孤岛的情况比较严重,各家(应用软件)不愿意开放(用户入口),大家都想把用户揽在某一个系统里,自己解决用户所有的问题。再者,用户的使用习惯也决定了产品间的互联互通,比海外的互联网行业更难。
我们不会掺和这些事,我们尽量通过公用协议来解决问题,搜索就是一个公用入口。
《中国企业家》:所以,做得越垂直,它越有可能生存壮大起来。
方汉:这个是肯定的,从用户角度来说,他不一定觉得通用Agent就能帮他解决什么问题,做个垂类,帮用户把事干了就行。其实这也是符合移动互联网的规律,点外卖用美团,买机票上飞猪等,可能你就只能干一件事。
《中国企业家》:移动互联网上出现了一批超级APP,Agent时代也会是这样吗?
方汉:移动互联网的时候,超级APP都在某某系里,比如腾讯系、阿里系等,真正全平台的可能只有小程序。我还是那句话,完成的工作越垂类,需要自闭环的可能性越大,超级APP那是各个大厂的事,跟我们这些创业公司没什么关系,所以不太担心。
《中国企业家》:那你担心大厂会覆盖你的产品吗?
方汉:字节、阿里把WPS干死了吗?没有,你要做到WPS这个级别,谁都干不死你。所以,垂类做得越垂,大厂要吃掉你的可能性就越小,越通用,反而越容易被吃掉。
来源:天工官方截图
《中国企业家》:那WPS也能生成PPT,垂类产品之间的竞争也很激烈。
方汉:WPS解决的是通用office编辑的问题,我们只解决用户的一个需求,比如写一篇论文,写一篇调研报告,我要解决的是这个层次的需求,而不是论文、报告是用PPT格式还是PDF格式,还是用Word格式,这些事情靠的是通用的能力。
《中国企业家》:在Agent实际应用中,你们怎么解决模型的幻觉问题?
方汉:幻觉问题是最容易解决的。以搜索为输入点,我们给到智能体的prompt(提示词),不是简单一句话“我要写报告”,而是“我要写报告”,同时我用搜索找到10条资料,Agent根据“我要写报告”和这10条资料来输出结果。
《中国企业家》:一些人会用Deep Research来生成报告,但他们会觉得参考价值不大,用户的感知还是很分裂。
方汉:这个问题就在于资料的来源,比如上市公司发了个公告,这就是个数据资产。再比如Wind、知网等,个人用户只能去搜网页。对我们来说,我们可以去跟这些信源谈协作;我们也专门针对上市公司的公告做了特别的爬虫。
对于用户来说,用知网,个人用户需要登录付费,用Wind,需要办会员。我们作为大B客户去跟他们签约,做分销,用了你的报告,给你交多少钱。本质上,我们跟这些产品不是对立的,我们是帮它去分销。
《中国企业家》:所以Agent本质上是一个付费服务?
方汉:第一,降本增效;第二,集采一定比单采要便宜,本质上,我们是替用户,向所有的信源做集体采购的一个中介。
《中国企业家》:其他Agent产品也这样做了,竞争壁垒在哪里?
方汉:在于用户使用习惯,我们做得早,所以,用户进来得多。后来者得花多少钱才能把我的用户拉过去?在这么窄的品类里面,后来者愿意砸多少钱?这也是一个未知数。
《中国企业家》:对于创业而言,时间是不是一个非常关键的变量,必须要提前做出来?
方汉:时间是一个重要因素,更重要的是,你怎么样去预判终局,从而选择时间是你的朋友的领域,所以,现在选择什么领域其实远比早做要重要,选择对的领域会带来时间上的优势。
《中国企业家》:什么是你们真正的护城河?
方汉:所有人做产品都要考虑护城河,护城河也就是壁垒的问题,这护城河到底是模型能力,还是工程能力,还是赛道的信息壁垒,还是资金投入壁垒?
我们的认知是,模型能力加上赛道的选择可能比时间和投入还要更重要。
《中国企业家》:未来,大模型走向公共基础设施之后,你们会调整自己的大模型策略吗?
方汉:做自己的大模型,然后坚持下去,这是我们的竞争力所在。对于通用大模型,我可能会外采。但一些专有大模型,比如,目前,我们的音乐大模型SkyMusic在国内指标排名第一,为什么不接着做,谁也替代不了我们。
发现让用户付费的真需求
《中国企业家》:过去两年,昆仑万维做了很多AI落地产品,比如音乐、短剧等方向,你们内部怎么总结这些探索?
方汉:不管是音乐、视频跟图像,都属于AIGC赛道,这个赛道的落地更容易,而且更全球化,我们要坚持做这些赛道。因为在AIGC赛道,你只要降低用户创作内容的门槛,那么赛道就会爆发。
未来,所有(算力)的成本会高速下降,不管是内容制作成本还是用户使用成本,只是商业模式要不要随着它而变化。
《中国企业家》:现在大家都在讨论后训练(Post-training)以及RAG(检索增强生成),你怎么看?
方汉:这两个技术主要是门槛低,也因为它能够弥补大模型的一些能力缺失,但我认为,最关键还是要人无我有,人有我优。
《中国企业家》:大公司走生态,初创公司打造工具产品,处于中间状态的昆仑万维是什么样的路径?
方汉:我们还是(保持)初创公司的心态,我们对海外很熟,所以,我们会更快进入很多市场,很多初创公司的第一站是中国,第二站是东南亚,我们上来可能第一站就是欧美,我觉得这可能是大的差别。
《中国企业家》:未来Agent产品会如何进化?
方汉:很难下定论,但我们一定是根据用户的需求去做,给B端用户降本增效,给C端用户降低创作门槛,这两个是产品最核心的出发点。
《中国企业家》:做Agent产品与做移动互联网的产品,有什么不一样?
方汉:模型能力不一样,产品原则上大体是一样的,产品原则就看谁的思考更深入,更有远见,这点跟移动互联网是一样的。但移动互联的时候不存在你租个服务器,我租不起的情况,或者你做个APP,我做不了的情况。
大模型本身就有竞争差别,同时又是基于云的基础服务,因此大家会走到以产品取胜的赛道上,不过我觉得都会很快趋同,差别不会那么大。
《中国企业家》:作为一个普通人,该怎么准备迎接AGI?
方汉:你要把AI当成计算机一样的工具,天天去使用它,你就不会落伍,多用多学,对于所有行业都是一样的。
《中国企业家》:请您给Agent创业者提供一些建议。
方汉:第一,你这个(产品)需求是不是真需求;第二,用户有多大的意愿为这个需求付费,这是判断真需求还是假需求的根本标准。只要用户不愿意付费,你只能让投资人付费。