sougood
小众、高效的搜索引擎

1分钟用最强生图模型生成精美PPT?Kimi PPT能力再升级

期末周,当代大学生的“渡劫期”

走廊里哀鸿遍野,所有人的怨气汇聚成一句话:“PPT 到底是谁发明的酷刑?”

对于这种“把简单的文字排版成我买不起的样子”的重复性劳动,我一向主张:能扔给 AI的,绝不自己动手。

继暑假我测评过一轮 AI PPT 之后,最近我发现 Kimi 的海外版(此处需懂的都懂)悄悄搞了个大动作——接入了传说中的 Nano Banana 模型。

我试着拿明天要汇报的主题丢给kimi,结果生成出来的效果让我非常惊喜——真的比今年夏天的效果又好了很多。

先给大家展示一下做出来的成果图片。

用nano banana🍌做出来的PPT和以往的模式有什么区别呢?

以前是根据大纲贴模板,自动进行排版,

现在是根据你的PPT不同的调性去分析-画出一个属于你自己独一无二的模板

因此,这就少了一些模板化和程式化,多了一些艺术感和精致感

那么话不多说,我来教大家如何使用:

目前中国大陆还是用不了的,只在海外进行内测

不过,我们通过一些方法还是可以使用的(懂得都懂)

第一步,开神秘模式

第二步,进入Google的神秘浏览模式

第三步,在浏览器里直接搜索kimi,进入到官网,就能看到了

最后,直接在对话框里输入你的提示词,AI就开始工作了~

最后点击香蕉模型,就可以使用了~

但,作为泡在AI圈子里的博主,我不打算只夸它好看。

当我们剥开华丽的外衣,你会发现这次更新的本质,是一场“技术路线的豪赌”

01 先说缺陷

最让我抓狂的,是它无法插入指定图片

我尝试过把包含图片和文字的文档喂给它,希望它像 Seede AI 那样

根据文档里的文字和图片进行直接创造

结果我甚至在对话框里直接发图,并在 Prompt 里卑微地写道:“请在这里插入图片1”。

AI 的反应是:我尝试做了,但我真的有幻觉😭

有些PPT尝试插入了“原图片”但其实根本不是原图片,

有的完全是替代了一张图

最后逼得我没办法,只能用缓兵之计: 在提示词里预留“坑位”,比如写上“这里请留出一半空白”。

等它生成完,导出 PPTX,我再手动把我的图贴上去。

02 它是“画”出来的,不是“排”出来的。

以前的 AI PPT(包括 Kimi 旧版),逻辑是“填空”

底层大概率是 HTML 或者 XML 代码,AI 只是个搬砖工,把你的字塞进预设的布局代码里。

虽然死板,但它是个矢量文件,字是字,图是图,可以随时修改。

而这次接的 Nano Banana,它是个生图模型(Diffusion Model)。 什么意思?

它不是在排版,它是在“画画”

它根据你的提示词和PPT的风格,

直接由像素堆叠出一张张“PPT 样子的图片”。

这就解释了为什么它多了“艺术感”:因为它不再被模板代码束缚,每一页都是AI的一次即兴创作,独一无二。

但是这也增加了他的修改难度。

当我点击做好的PPT后,我震惊地发现,竟然是一张贴图?!

然后我点击修改,需要等待一会,然后可以修改文字,但是不能修改画面其他元素

其实就是说,每当用户点击一次修改功能,kimi就要再生成一个图片

和原图一样的图,只不过没有文字

而你只能在这个基础上修改文字……

03. 月之暗面,在做一种很新的慈善

既然这么难改,还那么多幻觉,这东西是不是一无是处?

恰恰相反。

如果你稍微懂一点大模型行情,你会发现月之暗面(Kimi 背后的公司)正在做一件很疯狂的事。

这一套 Nano Banana 跑下来,背后燃烧的不是电费,是美元。

据不可靠消息(或者按谷歌同类模型推算),生成这样一张高精度、带文字排版的图片,成本可能在 0.7 元人民币左右。

一份 PPT 哪怕只有 10 页,成本就是 7 块钱。

而且因为不可编辑,用户往往会反复重试,这成本就蹭蹭往上涨。

而目前的内测版本,居然是免费的。

这意味着什么?

这意味着我们每一次生成的废稿,都是资本在为技术的未来买单。

04 所有的笨拙,都是进化的前奏。

写到这里,我想跳出测评,聊聊这背后的“野心”。

其实,Kimi 并不是想做一个更好用的 PowerPoint 插件。

它想做的是一个 PPT界的通用Agent(智能体)

我敢打赌,月之暗面的工程师们为了这个功能,在后台进行了无数次的微调(Fine-tuning),写了几万行的 System Prompt,甚至拆解了成千上万份优秀 PPT 的视觉逻辑。

他们试图教 AI 理解什么叫“逻辑流”,什么叫“视觉美学”。

但商业世界是残酷的。

在实验室里,技术难度的突破值得香槟庆祝;

但在 C 端用户的电脑前,决定我们是否买单的,永远不是“你有多努力”,而是“你是否真的解决了我那个该死的问题”

从这个角度看,目前的 Nano Banana 还是个偏科生——美术满分,语文和逻辑挂科

但这并不妨碍它的价值。

虽然它干不了精准的商业汇报,但它确实解放了另一群人——那些“视觉优先”的表达者。

比如生物老师,终于可以一键生成复杂的细胞分裂流程图,而不用在 PPT 里画圈圈;

比如像我这样的大学生,终于可以把时间花在构思创意上,而不是去对齐那该死的文本框(顺便水一个作业)

目前的 AI PPT,或许还不够从容,甚至有点笨拙。

它像极了早期的汽车,跑起来甚至没有马车稳,还得时刻担心抛锚。

但我们都清楚:马车再快也是马车,而汽车是另一个物种。

当 AI 从“帮你排版”进化到“帮你思考”,从“渲染代码”进化到“生成视觉”时, 我们正在目睹的,其实是 PPT 这种存在了 37 年的古老媒介,即将崩塌重建的前夜

我不嫌弃它现在的幻觉与昂贵。

相反,我感激月之暗面愿意在这个还在茹毛饮血的阶段,就把未来的样子端到我们面前

这一刻,AI 替我们做 PPT 的那天,真的不远了。

**爱你,Kimi。

(是真心的!!哪怕是为了那 7 块钱的 GPU 成本。)

写完这篇文章看到原来这个免费就到这周末结束,不嘻嘻了


@sougood 社交搜索 —— 寥寥输入、万千结果,10倍信息获取效率