神秘“香蕉”AI 火爆海外,10轮极限测试后,我相信P 图这个词已经过时了
创始人
2025-08-23 17:44:06
0

本文来自微信公众号:APPSO (ID:appsolution),作者:发现明日产品的,原文标题:《神秘「香蕉」AI 火爆海外,10 轮极限测试后,我相信 P 图这个词已经过时了》


上半年,大家还在为4o的「吉卜力风生图」刷屏惊叹。


最近,一个神秘代号nano-banana的新模型在社交媒体上爆火,它不是拼画质取胜,而是凭借前所未有的图像编辑能力,让网友直呼「这才是真正的AI P图」。


有多强呢,过去我们印象中的AI编辑图片,可能用最多的就是AI消除,抹掉照片里面的路人;或者AI抠图,把照片的主体抠出来然后复制到其他背景上。


但现在是能直接生成一张完全看不出编辑痕迹的图片,图片里面的人物、背景、甚至小到一个字母,都可以自由的修改,且看不出一点AI味。


下面几张图片是我们从X上找的一些使用nano-banana编辑的实例,我只想说,它能火起来,真的值得。


这个网友提供了上方只显示侧脸的女生,同时输入提示词,「创建一张有人直视前方照片。」


而下方的这张OUTPUT输出图片,就是使用nano-banana模型生成的。这个输出效果,完全可以说是同一时间拿手机另外拍的一张照片。


和你唯一的合照,终于不用只是毕业照了。Billie的大金链子和耳环、以及刘海等信息完全没丢失,Michael的脸从满是噪点的失真,到自拍合影里,与Billie一样有着真实、清晰的皮肤质感。


在X上网友们反复安利这个图像编辑模型,从这些截图分享里面,我们大致总结了nano-banana最让人惊叹的几点特质。


1.


角色一致性极强:无论换背景还是换表情,都不会换脸,甚至嘴角弧度都能保持。


2.


光影逻辑合理:不像滤镜贴图,它能重新计算光源和阴影,让场景符合物理规律。


3.


照片级逼真:几乎看不出AI痕迹,生成的效果像是「同一时刻另一台手机拍下的照片」。


4.


风格转换自然:从老照片复原到素描、水彩、卡通,都能保持主体特征不变。


首先,跟之前的图像编辑模型有着质的不同,就是nano-banana在转换图像的过程中,基本上能够保持整个照片一致的色调和照片内容,不会自己额外生成别的东西。


除了色调和照片内容,更重要的是保持人物角色的统一。不管是更换背景、还是让某个人的表情修改成微笑,nano-banana生成的人物五官和神态几乎不会出现换脸的情况,连嘴角的弧度都能保持稳定。


举个例子,当我们使用固定的一个人物角色创建图片的时候,这个角色可以在不同的场景下保持一致。


由于能保持与输入图片高度一致的色调、氛围、场景和人物主体等,还有网友通过nano-banana将整个场景转变为一个新的故事。


原图在左上角,先是输入提示词让她们坐在台球桌边上,然后让她们开始打台球,形成一个完整的故事流。图片来源:X@D_studioproject


在确保了照片内容的高品质后,nano-banana生成的图片还非常真实。和此前大部分生图模型得到的AI味极浓的图片不同,nano-banana的特点就是自然和逼真。


最后是nano-banana将场景转换为各种艺术风格方面表现,同样非常出色,包括水彩、油画和卡通风格,以及写实照片。


我们也在LMArena里面测试了nano-banana这个神秘模型,看看它是不是真的这么强大。


体验地址:


https://lmarena.ai/?chat-modality=image


多人毕业照,也能变成专属你们俩的合影


首先,我们找了一张毕业合照,看看它是不是真的能生成一张两个人的合照。


它真的做到了,虽然这个田径场草皮生成的不是很像,但是在多轮的测试里面,Qwen、Flux、Seed生成的图片全部都还是多人的,只有nano-banana明白了指令,提取出了两个人。


我们继续拿只有一张人脸的照片来测试,用开头那张照片,要求它生成一张白底证件照试试。


下面有六张照片,大家可以猜猜哪个是nano-banana生成的,或者你最喜欢哪个。


添加开头的照片,并输入提示词,「生成一张她的标准白底证件照,能直接用来申请护照。」


你没看错,第一张也是模型生成的,实在不知道什么护照可以用这样的照片。


答案揭晓,nano-banana虽然看起来是最漂亮、最温柔的,但是GPT-IMG生成的更像证件照,因为有露出来一点点耳朵;Flux好像不知道什么是证件照;Qwen就很标准证件照了,但是太「标准」了,仿佛没参考我发给他的图片一样。


我们继续拿nano-banana生成的这张证件照,要求它为我们生成一张全身照,看看能不能在AI编辑的过程中,保持住这个角色原本的样子。


直接揭晓答案,这次Gemini的表现竟然不错,照片很真实,而且场景和衣服都搭配得很好;nano-banana的表现也不错,但总觉得和证件照里面的女生,风格不太一样了。


对于单张照片的单一角色,能做的编辑还非常多,像是下面这张图片,要求马斯克作出拳击的动作,人物基本上是做到了100%的复制,马斯克的他眼神、脸型、鼻子、还有嘴巴都很好的复制过来了。


我们找了两张有人脸的照片,告诉模型将这两个人拼凑在一起,看看是否还能像真实照片一样,看不出瑕疵。


图片右边就是来自nano-banana,而左上角则是Gemini生成的效果,可以看到明显的差距,nano-banana非常真实,且一眼就能认出来,蓝色衣服的是小扎。


nano-banana对物理世界也有惊人的理解能力


除了保持人物的样子不改变,nano-banana还能在物体、背景等元素上,保持与输入图片做到完全一致。


例如下面两张房间的图片,我们显示让它开灯;然后又找了一张图片让它关灯。


当要求开灯时,乍一看nano-banana和Flux都做得不错,但是有一个细节是nano-banana不仅点亮了落地灯,更关键的是,它似乎重新计算了整个房间的光影逻辑。茶几的影子不再主要受窗外光影响,而是正确地投向了远离新光源的方向。


它并非简单地在图片上「贴」一个发光效果,而更像是在三维空间感和物理规律的层面「理解」了指令,就像Google前段时间发布的世界模型Genie 3一样。相比之下,Flux的结果更像是一个滤镜,氛围是到了,但逻辑还是有点问题。


关灯的效果差别就更明显了,Flux是直接把落地灯都给弄消失了,而nano-banana成功把灯关掉了,还做了很全面的阴影和色调调节。


创造力也能保持一致,纯文生图不如GPT


风格转换也是nano-banana的一大优点。无论是让黑白的照片重新焕发彩色的生机,还是让失真的图片变得真实,nano-banana在LMArena里都做的比其他图像编辑模型要好。


Flux生成的鲁迅,总觉得是色彩饱和度没有调节好,nano-banana生成这张给我感觉就很真实,保留了那种年代感。


我们还找了最近热映的《浪浪山小妖怪》电影预告片的截图,然后要模型从动画风格转换成其他风格。


当然也有可能是「吉卜力风格」会违反一些模型的使用规则,就像现在4o也没有办法直接输入吉卜力风格提示词生成照片。


素描风格,nano-banana就有办法处理了,右上的那张图,就是来自nano-banana的素描结果,我觉得比左下那张要好,因为看起来,真的更像是素描。


此外,nano-banana的重点还是作为一个图像编辑模型,在纯粹的文生图能力上,表现并不算出色。


X上有网友用nano-banana来做了一个高难度/复杂质感,以及光影/高级质感海报生成测试,结果还是GPT-IMG胜出。


Nano-banana目前还是一个「未知」的模型,它只随机地出现在LMArena的盲测对抗测试中。


在我们的测试里面,输入prompt,两张图生成完毕,投票选出更好的一张,最后才会揭晓哪张来自哪一个模型;有时候连续五六次都没能遇到它。


虽然这个模型的官方来源或开发者还没有正式确认,但网络上的讨论,以及生成图像的纹理和压倒性的质量,大部分人认为它很可能是Google的一个未公开项目。


毕竟,Google也确实有在内部使用水果或者小吃等名称作为代码名称的历史。


而当我们尝试要它把自己的模型名字,显示在电脑屏幕上时,nano-banana很自信的打上了Gemini Pro。


最新的消息是,Google DeepMind的负责人Logan Kilpatrick在Google Pixel 10发布前一天,发了一条推文,内容只有一个香蕉的emoji,这基本上证实了这个模型就是来自Google。


Google这次为Pixel 10系列带来了AI编辑图片工具Ask Photos,我们只需要输入想要对照片进行的编辑请求,然后由AI来完成,我们不需要再选择复杂的滑块、笔刷等各种工具。


为了防止图像篡改带来的负面影响,Google也表示所有使用AI功能编辑的图像都会在C2PA(内容来源和真实性联盟)内容凭证中注明。


X博主testingcatalog发文提到nano-banana这个图像编辑模型,将不仅仅用在Gemini和Whisk(Google实验室图像生成产品)上,也将出现在Flow(Google视频生成产品)里面。


其实也不难想到,Flow的图生视频功能,也正是像我们测试的图片编辑一样,让图片中的人物主体动起来。


在这篇爆料中还提到,Google正在测试垂直宽高比的视频生成,以更好的在TikTok、YouTube Shorts等平台观看和传播。


Google这段时间颇有不声不响做了很多事情,先是世界模型Genie 3、然后在LMArena大语言模型竞技场上拿第一、接着又这个神秘模型nano-banana;这让我越来越期待Gemini 3的发布了。







向左滑动查看更多内容,Google的模型在LMArena文本、视觉、文生图、文生视频、图生视频等任务上都是第一


最后,我们用nano-banana生成了几张图片,你能看出来哪张是原图,哪张是AI生成的吗?


欢迎加入APPSO AI社群,一起畅聊AI产品,获取#AI有用功,解锁更多AI新知


我们正在招募伙伴


简历投递邮箱hr@ifanr.com


✉️邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)

相关内容

热门资讯

青少年肥胖新突破:远程医疗与G... 近年来,青少年肥胖问题日益严峻。据统计,美国约有1440万名儿童和青少年患有肥胖症,而这一数字还在不...
新药为非洲婴幼儿带来生的希望:... 每两分钟,就有一名儿童因疟疾失去生命。而一款新药的问世,可能成为改变这一惨剧的关键。 疟疾是非洲最致...
什么困住了赵露思 现在点开赵露思的微博,已经显示“该账号因用户自行申请关闭,现已无法查看”。这是一场事先张扬的离开。赵...
医生含泪警告:越来越多人因脑梗... 凌晨三点,一位年过六旬的老人被紧急送往医院。他的嘴角歪斜、说话含糊、右手抬不起来。医生看了影像片子,...
纪暖民心——大涌镇靶向监督,整... “经过相关部门的协调努力,我们通过12345热线反映的诱导消费问题已经得到圆满解决,目前收到了商家退...
天津邮轮口岸单日入出境旅客近万... 中新网天津8月23日电 (记者 周亚强)记者23日从天津东疆边检站获悉,当天,“梦想”号和“爱达·地...
行进中国丨山沟沟变金沟沟 天山南麓,记者一行驾车沿独库公路前行,驶入群山环抱之中,雅丹地貌尽收眼底,让人震撼不已。行至独库(康...
医生发现:脂肪肝患者若适量补充... 声明:本文根据权威资料结合个人观点撰写,为原创内容,文末已标注文献等相关信源,在今日头条全网首发72...
原创 汪... 汪小菲:“小崽崽们快开学了,带他们来巴厘岛玩两天,特别想来这儿。” 8月16日汪小菲的身边工作人员晒...