本文来自微信公众号:APPSO (ID:appsolution),作者:发现明日产品的,原文标题:《全网都在玩的生图模型,我用它把 iPhone 17 提前发布了》
最近,朋友圈和抖音小红书几乎被Nano Banana刷屏了。这个香蕉模型似乎要让P图这个词消失,直接给Gemini带来了一千万的新用户,火得一塌糊涂。
各路大神的邪修玩法铺天盖地,什么3D手办、大佬合影都是基操了。虽然Nano Banana强得不行,但我们在留言区依然收到不少用户的疑问和需求。
首先使用门槛就拦住了不少人,甚至比在国内用ChatGPT还麻烦一些。在图片编辑过程,最多人反馈的是Nano Banana图片分辨率不够高,以及比例高度不可控。
说实在,我也感觉自己有点吹毛求疵,但没想到,这些需求真的有人听了进去,并且做了出来,而且还是咱们国产厂商。
刚刚,火山引擎正式上线豆包・图像创作模型Seedream 4.0。
除了具备「超强主体一致性、多图灵活创作、连续生图」等核心能力,Seedream 4.0还有一个Nano Banana也没有的功能——支持最高4K高清图片输出。
这也是首个最高支持4K多模态生图的模型,目前企业用户已经可以通过火山方舟抢先体验了。
个人用户也不用眼馋,4K版将于今晚20:00首次开放给个人用户,搜索「火山方舟体验中心」,即可第一时间体验。
Seedream 4.0同时也在豆包、即梦全量上线,最高支持2K输出。
实际表现如何需要拉出来溜溜。APPSO提前拿到内测体验了几天,给它上点比Nano Banana更大的强度。
实测完后我发现,虽然也不能算完美,但国产生图确实来到了一个新的阶段。
我替苹果把iPhone 17 Air提前发布了
今晚就是苹果秋季发布会了,不用熬夜看直播,APPSO先把帮苹果把iPhone 17给上线了
我们用Seedream4.0生成了两款今年大火的iPhone 17 Air产品页面,这可是今年最受关注的超薄旗舰。
参考iPhone 16Pro的官网页面,替换手机和相关文案,保证果味十足
可以看到Seedream4.0生成的这版iPhone 17 Air将手握机身的倾角,刚好和字母A右边平行,有点资深设计师的审美了。
这次,我们不让库克来发布产品,有请特斯拉人形机器人来客串一把。还是熟悉的场景,熟悉的Good Morning(doge)。
这组图用到了三张参考图,人形机器人、iPhone 17 Air,以及库克的现场图,Seedream4.0一致性确实有点东西。
其实这里还有个逆天的细节容易被忽略,注意看观察生成图机器人头盔上的反射细节,原图是漆黑一片的。
也就是说,Seedream 4.0根据图3的蓝天白云和建筑物背景,推理出机器人应该有的反射,真的太细了。
不妨再脑洞大开一点,据称iPhone 17 Air就是为了明年折叠屏手机做准备。APPSO用Seedream4.0也提前让大家看看iPhone首款折叠手机的「实拍图」。
眼尖的读者可能已经发觉,是不是跟华为新款的三折叠有点像,没错我用了它作为参考图,替换了上苹果的摄像头和logo,无论是构图、背景和水印的细节都完整保留了。
那干脆整一部苹果的三折叠,没有人知道那一夜,苹果和华为究竟发生了什么。
如果是「乔布斯」,他会怎么发布这款产品,我们请AI老乔限时返场。
熟悉的身影,穿透屏幕的气场,让我们再次高呼「Amazing」。
好玩之外,还真能用
Nano Banana能走红,除了社交媒体的爆款玩法,更在于它的技术能「看得见未来」。
无论是一致性、局部修改、换色还是多图结合,都是能够直接用在电商、营销、社交媒体等等场景里。
技术如果不能应用到生产力场景,也只是玩具。下面我们看看Seeddream 4.0在一些实用场景能不能打。
我们先拿这两天刷屏的红月亮,融合到球鞋设计中。
我还想看看这款球鞋不同角度的展示,只需输入类似「生成一只白色运动鞋,展示正面、侧面和俯视视角」的提示词,不管是用于打样还是用于设计草图,都直接一步到位。
如果我还想找一个模特用不同姿势展示商品呢?找不到合适的参考照片也没关系,直接画个火柴人简笔画就行。
Seeddream 4.0基于手绘图能有效控制模特姿势的一致性,同时实现角度的合理变化,在多角度呈现上表现精准。
像下面这个案例,我在提示词里面没有指定两个人的站位,所以在它生成的4张照片里面,两种站位都有,而且效果都很好。
它像一个周到的乙方,如果你需求没有很明确,那就把可能的情况都考虑到并把成品给你挑选。
如果说拥抱这种动作太简单了,我们直接来一个举高高的动作,这次再指定多一张背景图片。
提示词:将图3和图1合进一张画面,参考图2姿势,图1是被举起来的那个小孩;同时背景使用图4。图四的背景是来自浪浪山,两个角色是罗小黑和他的师傅。
四个人的参考图,Seedream 4.0同样可以很好的处理,保持和简笔画的姿势一致。
提示词:把图一的四个角色(西游记里面的师徒四人,沙僧、唐僧、猪八戒、孙悟空)按照图二的姿势(叠罗汉)排布,沙僧、孙悟空和猪八戒在下面,唐僧在上面。
如果还想给模特更换妆造,我们发现Seeddream 4.0也能准确把握不同发型的特质:长直发的柔顺、盘发的干练以及卷发的弧度,全部都清晰呈现。
同时,背景与人体保持高度一致,未出现边缘模糊或形变问题,成功实现了在保留主体特征的基础上对妆发风格的精准转换——省了多少模特妆造费用。
最让我惊喜的要数线稿生成,线稿通常为简洁的线条勾勒,仅包含物体基本轮廓与结构,缺乏细节、色彩及质感。在草图转渲染功能上,Seeddream 4.0能将简单线稿转化为高质量成品图。
不仅精准填充丰富色彩,使物体视觉层次分明,还有细腻的光影处理与材质模拟,比如包包的皮质纹理、金属配件光泽等。
它对于「高质量渲染图」的理解,可谓是逆天,除了静物,还搭配了人像、场景,你没想到的,它都替你想到了。
讲真,Seeddream 4.0这次更新后,对真实质感的处理完全超出我的预期。
像皮具、金属的纹理表现已经很稳了,但当我看到它生成人的皮肤纹路时,还是被秀到了。
这个皮肤纹理、隐约可见的青筋,甚至是手腕上自然的汗毛感,还有光线打在皮肤上的通透效果……所有细节都拿捏得非常到位,组合在一起就一个字:真。
仅此而已。
细节还原仿佛真实拍摄,完美实现了真实世界照片拟合的需求。这都意味着模型能够适度的「创作」,在参考图和提示词给定的范围内,给出合理的发挥。
这种创作能力可以用在更有趣的玩法上,比如只需要一个矢量图,就可以给APPSO生成一整套完整的周边设计。
提示词:参考这个LOGO,做一套品牌视觉设计,品牌名称为APPSO,包括包装袋、帽子、纸盒、卡片、手环、挂绳等。红色视觉主色调,趣味、简约现代风格
Seeddream 4.0的「创作」能力和直接生成样品的玩法,极大地降低了制作成本。而且效果相当不错,模型捕捉到了「有趣味、简约现代」的核心风格,将品牌LOGO巧妙地应用在手机壳、卡套、挂绳和帽子上。
还有一点好评的是,Seeddream 4.0支持最高4K分辨率的输出,而2K分辨率直出只需要几秒,能在电商等一些场景做到专业级输出,有更大的后期空间。
更多邪修玩法
除此之外,APPSO还发现了一些有趣的邪修玩法,也跟大家分享。
最基本的桌面手办,当然是不在话下,我们试试让人物自己,拿着本人的手办。
提示词:将这张照片制作成一个角色模型。其后放置一个印有该角色图像的盒子,以及一台屏幕显示Blender建模过程的电脑。在盒子前方添加一个圆形塑料底座,角色模型手办站立在上面。并尽可能设置为室内场景。
提示词:照片级真实感。然后照片中的人拿着一个手办模型,这个模型是根据这张照片的主体人物,制作而成的一个角色模型,在自己的房间里,很满意的微笑。房间里的电脑桌上,有一台屏幕显示blender建模该模型过程的电脑,同时有一个印有该角色图像的包装盒子,以及盒子前方有一个圆形塑料底座。
不仅拿在手里,还能挂在包上,照片的真实感和一致性保持都非常厉害。
提示词:照片级真实感。先将这张照片变成一个可爱挂件/亚克力材质的扁平钥匙扣/橡胶材质的扁平钥匙扣,挂在lv包包/图二照片的包包上,然后她自己再背着这个有自己同一个角色挂件的包。
除了做手办,我们还拿它来生成了一些摄影风格极强,但是又保持真实的照片。
你的人生照片摄影师,可能会是Seedream 4.0。
除了强大的一致性和多图编辑能力,Seedream 4.0还带来了丰富的世界知识能力,生图模型也能推理预测,深度理解我们的提示词和图片,其背后的意图。
例如我们上传了一张杯子即将要掉在地上的图片,然后输入提示词「下一秒这个画面应该是怎么样的?」
杯子掉在了地上,同时能看到倒在地上的水,反射了部分杯子,和窗户的光。
Seedream 4.0除了知道一秒后会发生的事情,我们还能利用它的推理能力,整理自己的房间。
提示词:把沙发上的被子和衣服都叠好
除了能把衣服整整齐齐地叠好,弄得满是颜料的地板,Seedream也能在打扫干净的同时,保持图片内现有元素的一致性。
提示词:把这些颜料都收起来,地板擦干净(虽然这好像是个桌面)
借助它的推理能力,还有一个更骚的玩法。
下面这个案例里,上传的参考是模特图,让Seedream 4.0把模特衣服的细节展示出来,模型接到的指令是细节图——这当中的距离,就要靠模型自己去「想明白」。
从结果来看相当不错,不仅版型准确,对于局部细节展示这一指令跟随也没有问题。几乎可以直接上架了。
参考网友@op7418的提示词,我们也跑出了好几版关于AI模型的表情包,一次可能不成功,那就多抽几次卡就好,好在生成速度也够快。
你或许看过《千里江山图》这幅传世名作,但你或许还遗漏了亿点点细节。
同理可得,谁说《步辇图》里没有呆萌的Labubu,以及在《韩熙载夜宴图》的宴席中,突然出现一只从现代穿越过来的网红柴犬Kabosu,我也觉得毫无违和感,
体验下来,如果用一个词来形容Seedream 4.0,那必须是「六边形战士」。它像一个全能的创意总监+高效的制作团队,让你能快速得到想要的结果,同时对创作流程有更强的掌控感。
快,是第一体感。
基于DiT-MoE架构,Seedream 4.0的计算效率比上一代猛增了10倍以上,最快1.8秒就能生成一张2K高清大图。这种「秒级」响应,意味着极低的试错成本。
稳,则是生产力基石。
Seedream 4.0的超强主体一致性能力,让你无论是想给角色换个场景、换个画风,还是调整姿势视角,都能高度保持原有特征,避免了「画风突变」的尴尬。
对于很多电商和品牌设计师来说,AI不再是给一张海报换个颜色,而是能参考一个Logo,一键生成全套品牌视觉设计,从包装袋到手环,风格高度统一。
品牌规范开始从一本厚重的VI手册,变成一行行可执行的prompt。
作为我们这样的内容创作者,它能让你参考一个角色设定,批量生成漫画分镜或故事绘本,极大地提升内容连载的效率和一致。
而且在Nano Banana出来之后,已经不少人基于它开发出了轻量级的小游戏或实用工具,这类工具给了更多中小开发者把创意快速变成产品,而且获得用户认可的可能性。
这几天Seedream 4.0的内测已经开始刷屏社交媒体。热闹之外,我们也看到,Seedream 4.0已经不满足于当一个新奇的玩具,而是要成为一个可规模化、可商用的创意生产力平台。
欢迎加入APPSO AI社群,一起畅聊AI产品,获取#AI有用功,解锁更多AI新知
我们正在招募伙伴
简历投递邮箱hr@ifanr.com
✉️邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)