嘴动修图神器诞生！Gemini 2 生成强一致性图片

大家好，我是苍何。

谷歌新发布的 Gemini 2 多模态大模型可太好玩了，昨晚玩了一晚上，忍不住想给大家分享。

要知道，文生图并不是什么新鲜的功能，早年的 MJ、SD、DALL·E 3 都可以做到。

但最大的问题是，保持生成图片的强一致性，多多少少有些差强人意。

Gemini 2 做到了，比如这个 case，全程都是同一个角色。

嘴动修图神器诞生！Gemini 2 生成强一致性图片_gemini

甚至，我可以给角色添加气泡文字对话，这个就很牛逼了，我都可以用他来生成插画了。

接下来，体验一下，一键变给衣服变色：

嘴动修图神器诞生！Gemini 2 生成强一致性图片_人工智能_02

嘴动修图神器诞生！Gemini 2 生成强一致性图片_模态_03

整体人物是保持强一致性的，接下来我想让这个小姐姐换个背景：

嘴动修图神器诞生！Gemini 2 生成强一致性图片_模态_04

WOC，整个过程只花了 10 秒，关键 Gemini 还自动帮我调整小姐姐的姿势，让整个画面更协调了。

我想你看到这里，也会忍不住发出 WOC，不瞒你说，我昨晚已经 woc 了好几轮，连发两条朋友圈，一堆好友留言这是啥软件啊😂

嘴动修图神器诞生！Gemini 2 生成强一致性图片_gemini_05

这不是啥软件，这就是 Gemini 2，使用也很简单，你只需要打开一下这个地址：https://aistudio.google.com/

用谷歌账号登录，选择模型为 PREVIEW-Gemini 2.0 Flash Experimental.

嘴动修图神器诞生！Gemini 2 生成强一致性图片_强一致性_06

在输出格式那里选择 images and text。

嘴动修图神器诞生！Gemini 2 生成强一致性图片_gemini_07

然后就可以直接将图片拖到对话框，输入你要的操作即可。

视频简单演示一下：

+视频

当然了，还有更高级的玩法，比如产品图替换：

嘴动修图神器诞生！Gemini 2 生成强一致性图片_gemini_08

虽然说这和高逼格的设计图多少有些违和感，但大体已经成样子了，一段时间之后，效果估计更好。

Gemini 甚至可以直接出图文的教程，比如我让他生成水煮肉片的教程。

WOC 说多了嘴巴上火，将这个拿去做视频不是分分钟吗？

再比如我让他给我 2 岁的宝宝讲一个睡前故事。

嘴动修图神器诞生！Gemini 2 生成强一致性图片_人工智能_09

直接打印出来，不就成了儿童睡前故事绘本？

当然 Gemini 2 的想象空间还有很多等着你去发现，不过目前依旧有一些问题，比如你让他给瘦身的时候，人物会变形。

再比如输出中文字会乱码问题。

不过一项技术的诞生一开始并不会那么完美，需要经过多轮的迭代和发展。

所以，谈不上颠覆，更多的是惊喜，用好了能给你大大提效，用不好，也别说人辣鸡。

毕竟现在还能免费可以各种耍，试试又何妨。

好啦，以上全文 2709 字，10 张图，如果这篇文章对你有用，可否点个关注，给我个三连击：点赞、转发。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.tpcf.cn/news/918122.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

大家好，我是苍何。在藏师傅那里看到个有意思的玩法，能将任何内容快速生成可视化网页，并且效果还相当惊艳。于是我用 Cursor+Claude3.7 也快速将我的文章一键生成了可视化网页，整个过程只用了 2 分钟。。。这 2 分钟我慢悠悠的喝了菊花茶，等待 Claude 帮我生成代码，真正体…