
该模型具有中心特征,例如使用双子座世界知识库,角色的一致性,自然语言定向版和图像处理的多个图像融合。目前,它可以通过API等平台进行预览。
在推出新模型之前,“纳米香蕉”代码名称在盲试平台上匿名宣布,成为世界上最合格的图像编辑模型。我们收到了用户热情的评论,并确认了此更新的成功。
8月27日,周二,Google推出了Gemini 2.5 Flash Image(编码为“ Nano Banana”)的新闻。这是新一代的世代模型和IA的编辑。现在,该模型已完全集成到双子座应用程序的图像编辑功能中。这现在可以通过Gemini的API,Google AI Studio和Vertex AI平台获得Flash Gemini 2.5图像。稳定版本预计将在几周内正式推出。该模型使用代币计费模型的价格为每百万个输出代币30美元,单个图像设置为1,290个输出令牌(每图像约为0.039美元)。其他入口和出口模式的计费标准与2.5 Flash Gemini一致。 Google在他的技术博客中说,该更新带来了四个主要功能。承认多个图像的智能融合,维持不同照片之间字符的一致性,以改善叙事表示,以自然语言以自然语言获得精确的定向版,并通过双子座世界知识库实现图像产生和处理。今年早些时候,Google开始使用Gemini 2.0 Flash生成本地图像时,其潜伏期低,高成本的性能和用户获得的使用易用性赞美,但也提高了图像输出的质量并使其创造性。也有评论说他们想改善自己的控制功能。为了减少开发阈值,Google同时更新了Google AI Studio的“编译模式”(将来会有更多的特征开始)。开发人员不仅可以在其模型中测试应用程序功能,而且现在他们可以通过单个指令实现创造性的重建和概念性实现。创建应用程序后,用户可以直接从Google AI Studio中实现,也可以使用SOA单击在GitHub存储库中保存代码。开发人员可以输入步骤,例如“构建由用户支持的图像版应用程序,以加载图像并应用不同的过滤器”,或选择用于辅助创建的预先建立的模板。上述特征目前可免费使用。保持图像生成领域的作用的一致性面临着核心挑战很久。也就是说,如何在输入和编辑多个命令时保持对象或对象的外观的一致性。如今,用户可以将同一篇论文放在不同的环境中,并在新方案中从多个角度出现单一产品,或以高度统一的视觉风格生成品牌资产,所有这些操作确保受试者的特征始终不会改变。 Google在Google Toi Studio上提供可自定义的模板应用程序(录取视觉编程),以可视化模型的强大能力,以保持角色的一致性。除了字符的一致性外,该模型还具有视觉模板的出色适应性。目前,开发人员将其应用于房地产清单卡,统一员工的工作卡,产品目录的动态表示等,而实现所有这些只是基本设计模板。基于双子座的图像版2.5闪存图像允许用户启用通过自然语言说明,方向转换和精确的本地版。某些特征包括模糊的图像基金,消除衬衫中的污垢,完全消除照片中的人,调整主题的位置,颜色为黑白照片以及用户可以通过自然语言描述来实现的其他版本,包括:在视觉上呈现这些特征,Google已在Google AI Studio上开发了双向图片编辑应用程序。结合了本土世界知识传统的图像生成模型通常集中在美学表达上,但对现实世界有深刻的语义理解给人带来明显的不便。 Flash Gemini 2.5图像基于巨大的双子座世界知识库,以打破这种限制并开放图像生成应用程序的新维度。例如,Google在Google AI Studio上创建了一个模板应用程序。这证明了整体上限将简单画布转换为交互式教育导师工具,手工分析图形,回答与世界相关的真实问题,并在一步中执行复杂的编辑指令的真实问题。 Fusion Gemini 2.5 Fusius Imagesn 2.5的多个图像可让您同时智能理解和合并多个输入图像。用户可以在新场景中自然嵌入对象,通过配色方案和材料纹理重新定义房间的样式,并将多个图像的融合与单个说明完成。为了证明此功能,Google启动了专门针对Google AI Studio的模板应用程序。用户可以简单地拖动操作以将产品放置在新场景中,并迅速生成非常逼真的融合图像。 Google在IA图像竞赛中的新领导者Gemini 2.5 Flash Image的推出是Google与竞争对手的差距,并打算直接与OpenAI和Ada等公司竞争是。在官方首次亮相之前,这些模型以谦虚而成功的方式观察到。在假名“纳米 – 巴纳纳”(Nano-Banana)出现在Lmarena文明的盲试平台上的Wayanonymous中之后,它很快引起了AI社区内的激烈辩论,成为世界上最受欢迎的图像编辑模型。双子座的负责人戴维·沙龙(David Sharon)说,反叛市场的徐说:“用户的早期评论非常热情,并且已成为世界上最合格的图像编辑模式。”毫无疑问,这次发布是Google对竞争日益激烈的市场的重要回应。今年3月,OpenAI直接在Chatgpt中整合了GPT-4O Image Generator。这不仅会出现用户参与,而且还建立了通过一组病毒内容集成AI工具的新参考,这些病毒内容表现出强大的特征并促进了易用性。同时,创意软件积极地认为巨型软件是积极的为一组照片做。萤火虫促进的特征自动与颜色和照明相吻合,“和谐”和改进的分辨率和消除工具进一步整合了它们在专业领域的位置。提供最佳产品。QWEN图像模型是突出的,当主要的技术问题已与更轻松的文本表示启动时,在Groment Systems中启动了更加优化的fillibization formizization formizization for for for fors。 IA.ores产生的整个内容的水印品牌,目前面临迪士尼作者的要求,以及关于迪士尼法律顾问的涉嫌违反培训数据的普遍照片。致力于这种行为的人工智能公司不会减轻违规行为。”他同时,整个行业对AI参考点的可靠性构成怀疑。作为AI的策略师Nate Jones,“施压他们的分类可能会导致在某些测试中效果很好但无法解决实际问题的模型的发展。”总而言之,通过在其徽章产品中集成功能强大且简单的编辑工具,Google试图通过简单而创意的控制来吸引传统的用户。该策略不仅将Gemini作为聊天机器人,而且使其成为占据迅速发展的内容生成领域的位置的整体创意引擎。 (小氧)
快来访问暗黑猎奇外网,参与吃瓜爆料每日大赛,获取最新的精彩内容和独家爆料!