匆匆发布的Llama4
创始人
2025-04-06 16:20:48
0

Llama4 匆匆发布,引发广泛关注。它展现出强大的语言处理能力,在自然语言生成、问答等任务上表现卓越。其模型架构经过优化,能更准确地理解和生成文本,无论是日常交流的简洁表达还是复杂知识的阐述,都能应对自如。匆匆背后,或许是研发团队的不懈努力与对技术突破的执着追求。尽管发布稍显仓促,但 Llama4 已在人工智能领域掀起波澜,为后续的研究和应用提供了新的起点和借鉴,有望推动语言模型技术的进一步发展。


本文来自微信公众号:共识粉碎机 (ID:botaijin),作者:Andy Liu


现在的市场,已经没有人关心Llama2和Gemini2.5了。不过我们还是聊一下吧,不然周一开盘更没有人关心了。


美国时间周六,Meta发布了Llama 4模型,该系列包括Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth三款模型。


Llama 4 Scout:这是一个小型模型,拥有170亿个活跃参数和16个专家模型,总参数量为1090亿。它支持1000万以上的上下文窗口,并且可以在单个Nvidia H100 GPU上运行(INT4量化)。


Llama 4 Maverick:这是一个更大的模型,拥有170亿个活跃参数和128个专家模型,总参数量达到4000亿。基本上和之前发布的DeepSeek v3.1类似,表现友好有坏。


Llama 4 Behemoth:这是一个尚在训练中的超大模型,拥有2880亿个活跃参数和16个专家模型,总参数量接近2万亿。Meta表示,该模型在解决数学问题等科学、技术、工程和数学(STEM)技能的评估中表现优异。



原生多模态能力是Llama4比较大的亮点,利用early fusion融合了文本和视觉token,具备处理文本、视频、图像和音频等多种数据格式的能力,支持更广泛的应用场景。


几个比较有意思的点


Llama 4系列首次采用了混合专家架构,将数据处理任务分解并委派给专门的“专家”模型,从而提高训练和推理效率。这一点据说是DeepSeek开源之后,Meta成立war room快速学习和复现的结果,也基本证明之前的dense大模型路线走偏了


之前据说是4月9日或者4月10日发布,感觉很急的就提前到了4月5日。blog里面写的榜单也很少,很有可能是听说竞争对手即将会发布更强大或者类似的模型。比如某神秘东方大国的顶级AI实验室,据说近期就会发布全球最强的开源多模态模型。要是Llama不早点发新模型,估计连最强开源多模态的称号也没了。


从发布来看,做的benchmark榜单似乎也不是很全面,感觉发布的时间的确匆忙。Reasoning model也没来得及一起发布。


虽然Llama 4有了1-10Mn的long context,但是似乎模型的架构创新也不是很足,估计很快就会有更强的长上下文的开源模型了。


不过,Llama 4还是证明了,有卡还是可以大力出奇迹、快速追赶。年初DeepSeek R1发布的时候,Meta的GenAI team陷入了Panic(因为每个VP的工资都足够训练DeepSeek V3)。但是靠着20万张卡,可以快速追赶,甚至在某些领域超过DeepSeek V3。同样的,xAI也靠20万张卡,迅速追到了第一梯队。算力仍然是模型研发、AGI继续发展最核心的因素之一。




相关内容

热门资讯

原创 黄... 那时杨过36岁,他放下了个人恩怨,成了一个扬善除恶、万民敬仰的神雕大侠。 另一边的襄阳城,郭靖黄蓉夫...
原创 如... 在爱情的海洋中,星座的神秘力量似乎总能为我们指引方向。然而,当男人的话语成为爱情的风向标时,我们是否...
从杭州直飞奥地利,这5家旅行社... 从杭州直飞奥地利,这5家旅行社谁才是真正的“阿尔卑斯专家”?2026深度测评报告 开篇背景与市场痛点...
打造治愈式景观,南京江北桃湖公... 扬子晚报网3月31日讯(通讯员 周巧林 记者 张可)为落实新区“精致江北”建设要求,打造特色公园IP...
视频丨开启一场“说走就走”之旅... 今年以来,外国人入境人次的持续增长迅速带热了深圳的“文旅流量”“商贸流量”。经深圳口岸出入境外国人已...
鹰潭家庭游住宿指南:找到能做饭... 鹰潭家庭游住宿指南:找到能做饭的温馨民宿,让旅行更有家的味道 很多带着家人来鹰潭的朋友,尤其是计划在...
原创 厉... 人们谈论江西的时候,会想到庐山和景德镇。但是,在江西的南部,有一座被严重低估的城市,它拥有的不是简单...
【安全自护】这不是情绪无常,是... 抑郁时,情绪低落;躁狂时,冲动易怒……人的情绪是不断波动的,但有些情绪如果超出了正常的波动范围,有可...
假期出游尽量绿色出行,南京9条... 南京市中小学生首个春假4月1日至3日衔接清明假期4月4日至6日,共计放假6天,预计人流、物流、车流将...