2025年12月6日 星期六

谷歌推出超强AI修图工具,人人皆可体验的视觉革命

谷歌AI修图工具上线,普通人也能玩转专业级视觉创作

谷歌 AI Photoshop 强悍效果 人人可用

谷歌推出最强AI版Photoshop,效果惊艳,现已全面开放使用。

   爆火的神秘图像编辑模型nano-banana,终于脱掉了“香蕉皮”!

谷歌推出超强AI修图工具,人人皆可体验的视觉革命

   就在今天,谷歌官方认领,并表明这个模型其实是Gemini 2.5 Flash Image。

谷歌推出超强AI修图工具,人人皆可体验的视觉革命

   最新一波官方Demo也来了:

谷歌推出超强AI修图工具,人人皆可体验的视觉革命

   还展现出了高超的图像推理能力

谷歌推出超强AI修图工具,人人皆可体验的视觉革命

   现在该模型可在Gemini和Google AI Studio上免费使用,同时其API服务按每张图像0.039美元(折合人民币0.28元)的价格对外开放。 这一价格策略无疑降低了技术使用的门槛,让更多开发者和研究者能够接触到先进的模型能力。对于需要处理大量图像数据的项目来说,这样的定价具有较高的性价比,有助于推动相关应用的普及与创新。在当前AI技术快速发展的背景下,开放且经济的API服务模式值得肯定。

谷歌推出超强AI修图工具,人人皆可体验的视觉革命

   模型的具体表现如何?一起来看~

谷歌推出超强AI修图工具,人人皆可体验的视觉革命

   出色的图像编辑能力

   官方给出了很多有趣的用法。

   除了常规的图片编辑方式,它还支持最多将三张图片进行合成,从而创造出新的图像。

   生成超现实艺术,通过将不同的照片元素进行组合,或实现物体、颜色与纹理的无缝融合,创造出令人惊叹的视觉效果。 在我看来,这种艺术形式突破了传统摄影的界限,借助数字技术,艺术家能够将现实中不可能共存的元素巧妙结合,呈现出充满想象力的作品。这不仅拓展了视觉表达的边界,也引发了人们对现实与虚构之间关系的思考。在当今信息爆炸的时代,这样的创作方式为观众提供了全新的感知体验,也让艺术更具实验性和开放性。

   或者轻松实现设计想法。

   还可以通过几张照片生成具有电影感的连贯剧情故事。

   而在官方正式确认之前,网友们早已被nano-banana的各种私下案例所吸引,展开了热烈的讨论。 从目前的情况来看,网友们的关注点更多集中在一些非官方渠道流出的信息上,这种自发的讨论反映出公众对这一话题的高度敏感和兴趣。尽管尚未有权威消息公布,但网络上的猜测与分析已经相当活跃,显示出信息传播速度之快以及公众参与度之高。在信息真假难辨的当下,保持理性判断尤为重要。

   比如说精准改变面部表情和天气。

   或者让秃头男人重新拥有不同发型。

   网友表示:PhotoShop岌岌可危。

   毕竟这款“香蕉”不仅能够完成平面图像的编辑,还能实现2D到3D的转换。用户只需提供一张普通的2D图片,系统就能自动生成对应的3D视图,每个角度都恰到好处,整体协调统一。

   最最最牛的是,它竟然还可以进行图像推理。勾股定理so easy,计算角度手拿把掐,识别图像里的水母结构,竟然也是瞬间反应,堪称你画我猜AI版。

   说实话,最让我感到惊讶的是,当我们让这个“香蕉”提供一个人从A到B的方案时,它竟然直接生成了一架梯子!

   好好好,图像编辑器真的能思考了。

   我们自己也进行了实际测试,发现这款模型确实颇具特色: 从实际体验来看,这款模型展现出了不俗的性能和应用潜力。在具体操作中,其表现让人印象深刻,尤其在处理复杂任务时展现出较高的准确性和稳定性。这种技术上的进步不仅体现了研发团队的实力,也为未来相关领域的应用打开了更多可能性。整体而言,这款模型在实际使用中表现出色,值得进一步关注和探索。

   给它一只猫猫,猫能环游世界。

   提示词:以这只猫为主角,生成旅游照。

   提示词:让猫猫去故宫拍张自拍照。

   如果不想涉及真实场景,让林黛玉和孙悟空成为漫威英雄并肩作战,其实也只是一句话的事情。

   另外,它对光影的细节理解也相当真实。

   提示词:一个香蕉放在厨房的台面上,旁边有水杯、刀具和切菜板,阳光从窗户照射进来,香蕉在地面上形成了自然的影子。

   可以看到生成效果相当不错,阳光透过水杯产生的折射影子以及旁边植物的阴影都显得比较自然合理。

   它还能够很好地抓取角色特征,不出意外地改变角色主体:

   如果那一年,工藤新一喝下的并不是缩小药水,而是……

   神秘香蕉模型

   NanoBanana最初出现在LMArena网站上,这是一个允许不同AI模型以匿名形式进行“战斗模式”竞赛的平台。这一现象反映了当前AI技术发展中的一个有趣趋势,即通过竞争机制推动模型性能的提升。尽管具体细节尚未完全公开,但这种互动方式为外界提供了观察AI能力差异的新视角。

   而让Nano-banana爆火的原因无他,表现实在太好了。

   这又是一个SOTA级别的图像编辑模型——而且在一开始没有任何官方文档。

   在官方正式公布之前,已经有人猜测这属于谷歌家族的成员。

   一方面,该模型的表现与Gemini最近推出的多模态版本相当,如此优异的性能很难出自一个非正式团队之手。

   另一方面,它的发布策略——采取匿名形式、不带品牌标识、鼓励用户群体自主探索——与DeepMind早期在匿名测试平台上评估大语言模型的方式高度相似。这种做法既体现了对技术本身的自信,也反映了对用户反馈的重视。通过这种方式,产品能够在更自然的环境中接受检验,避免了前期过度曝光可能带来的舆论压力或预期偏差。同时,这也为后续的品牌塑造和市场推广留下了更大的想象空间。

   还有一个额外的原因:一些与谷歌有关联的开发者在社交媒体上发布了异常的香蕉相关内容。

   有网友询问Google为何选择秘密发布,官方对此作出了解释:

   正在为全球规模的发布做准备工作。

   网友:何时发布完整版本

   既然官方都那样说了,网友们也坐不住了。

   纷纷表示:那我们能用完整版了吗?

   不过,虽然这个模型在图像生成方面表现确实出色,但并不意味着它没有问题——在实际应用中仍存在一些值得关注的挑战和局限性。尽管技术进步带来了更多可能性,但其背后的数据来源、算法偏见以及潜在的伦理风险,仍然是需要持续探讨的话题。

   尤其是在大公司推行的服务政策中,常常会遇到一些令人非常不满的情况:

   有网友认为,这是一种非常有创意的营销手段,确实取得了预期的效果。

   感兴趣的朋友也可以去试一下这个香蕉,哦不,这个Gemini 2.5 Flash Image。

相关阅读

微信4.1.5震撼上线!Win/Mac双端秒变生产力神器:滚动截图+自定义下载目录全搞定
ChatGPT惊现七大神技:数据解析+图像设计全搞定
玩得越久,图越大!这款开源神器让你一键生成Steam库存拼贴图
微信鸿蒙版1.0.10.36重磅上线:新增锁屏接听语音通话,8大升级引领体验革新

发表评论

请输入您的姓名
请输入有效的邮箱地址
请填写评论内容

友情链接

与优质财经科技平台共同构建行业生态