大家好,我是苍何。

谷歌新发布的 Gemini 2 多模态大模型可太好玩了,昨晚玩了一晚上,忍不住想给大家分享。

要知道,文生图并不是什么新鲜的功能,早年的 MJ、SD、DALL·E 3 都可以做到。

但最大的问题是,保持生成图片的强一致性,多多少少有些差强人意。

Gemini 2 做到了,比如这个 case,全程都是同一个角色。

嘴动修图神器诞生!Gemini 2 生成强一致性图片_gemini

甚至,我可以给角色添加气泡文字对话,这个就很牛逼了,我都可以用他来生成插画了。

接下来,体验一下,一键变给衣服变色:

嘴动修图神器诞生!Gemini 2 生成强一致性图片_人工智能_02

嘴动修图神器诞生!Gemini 2 生成强一致性图片_模态_03

整体人物是保持强一致性的,接下来我想让这个小姐姐换个背景:

嘴动修图神器诞生!Gemini 2 生成强一致性图片_模态_04

WOC,整个过程只花了 10 秒,关键 Gemini 还自动帮我调整小姐姐的姿势,让整个画面更协调了。

我想你看到这里,也会忍不住发出 WOC,不瞒你说,我昨晚已经 woc 了好几轮,连发两条朋友圈,一堆好友留言这是啥软件啊😂

嘴动修图神器诞生!Gemini 2 生成强一致性图片_gemini_05

这不是啥软件,这就是 Gemini 2,使用也很简单,你只需要打开一下这个地址:https://aistudio.google.com/

用谷歌账号登录,选择模型为 PREVIEW-Gemini 2.0 Flash Experimental.

嘴动修图神器诞生!Gemini 2 生成强一致性图片_强一致性_06

在输出格式那里选择 images and text。

嘴动修图神器诞生!Gemini 2 生成强一致性图片_gemini_07

然后就可以直接将图片拖到对话框,输入你要的操作即可。

视频简单演示一下:

+视频

当然了,还有更高级的玩法,比如产品图替换:

嘴动修图神器诞生!Gemini 2 生成强一致性图片_gemini_08

虽然说这和高逼格的设计图多少有些违和感,但大体已经成样子了,一段时间之后,效果估计更好。

Gemini 甚至可以直接出图文的教程,比如我让他生成水煮肉片的教程。

WOC 说多了嘴巴上火,将这个拿去做视频不是分分钟吗?

再比如我让他给我 2 岁的宝宝讲一个睡前故事。

嘴动修图神器诞生!Gemini 2 生成强一致性图片_人工智能_09

直接打印出来,不就成了儿童睡前故事绘本?

当然 Gemini 2 的想象空间还有很多等着你去发现,不过目前依旧有一些问题,比如你让他给瘦身的时候,人物会变形。

再比如输出中文字会乱码问题。

不过一项技术的诞生一开始并不会那么完美,需要经过多轮的迭代和发展。

所以,谈不上颠覆,更多的是惊喜,用好了能给你大大提效,用不好,也别说人辣鸡。

毕竟现在还能免费可以各种耍,试试又何妨。

好啦,以上全文 2709 字,10 张图,如果这篇文章对你有用,可否点个关注,给我个三连击:点赞、转发。