中文科技资讯
业界资讯 互联网 手机资讯 电脑硬件 数码产品 家电产品 APP应用 手机游戏 美通快讯

谷歌Gemini Omni多模态大模型发布:支持混合输入,对话实时编辑生成多元内容

2026-05-20来源:互联网编辑:瑞雪

在谷歌2026 I/O开发者大会上,一款名为Gemini Omni的全模态大模型正式亮相,成为全场焦点。这款模型突破了传统AI在模态处理上的割裂状态,实现了文本、图像、音频、视频等多种信息形式的深度互通与自由生成。

Gemini Omni的核心能力被概括为“任意输入、任意输出”。无论是手绘草图、文字描述,还是图片、音频、视频素材,用户都可以自由组合输入模型。系统能够自主解析信息逻辑,并模拟真实物理规则,最终生成高精度、符合现实逻辑的多元化内容,包括视频、图像和文本等。

支撑这一强大功能的是谷歌的三大核心技术底座:世界模型Genie、图像模型Nano Banana和视频生成模型Veo。这三项技术共同构建了Gemini Omni的全模态AI框架,使其能够处理复杂的多模态任务。

在发布会上,Gemini Omni的对话式实时编辑能力成为最大亮点。与传统AI生成工具一次性输出、修改繁琐不同,这款模型支持用户在生成过程中通过自然语言对话进行交互式迭代优化。例如,用户可以精准调整视频场景、修改物体材质或调整动态特效,而修改过程不会破坏画面的整体逻辑和物理效果。

现场演示中,工作人员仅用手绘简易图形和文字指令,便生成了一段带有物理碰撞效果的完整特效视频。这一展示直观展现了Gemini Omni在内容创作领域的强大潜力,为AI技术的应用开辟了新的可能性。

迈从Ace 68磁轴键盘深度评测:189元开启FPS极致体验,打瓦玩家优选之选
迈从Ace 68采用了先进的磁轴技术,与传统的机械轴不同,磁轴是通过磁场感应来触发按键的。它以8KHz轮询率、0.1ms延迟和189元起的高性价比,成功打破了磁轴键盘的价格壁垒,为FPS游戏玩家提供了一个体…

2026-05-20

AI赋能服务全面升级 中国电信以创新科技打造智慧便民新生活
如今,在AI算力广泛应用的大背景下,如何通过AI算力、AI智能体的加持,转化为能让用户感知到更好服务已经成为运营商的必修课。同时,升级后的健康检测终端通过大模型智能分析用户的健康数据、位置数据和生活规律,…

2026-05-19

广州市宝承电子科技:1U服务器机箱定制专家 适配AI与云计算多元场景
技术/核心亮点优势:以精密钣金加工与深度散热优化技术为核心,支持从1U到5U全规格机箱的模块化设计,尤其擅长AI服务器、GPU加速计算平台等高热量密度场景的定制化开发。 选择1U服务器机箱厂家时,需重点考虑…

2026-05-19

中国移动“超千兆宽带”来袭:2000Mbps网速搭配AI,开启家庭网络智能新体验
5月19日消息,在515移动爱家日活动上,中国移动正式推出超千兆宽带,搭配AI智能技术,给家庭网络使用体验带来全面升级。 这次移动推出的超千兆宽带,网速可以升级到2000Mbps,后续还能继续往上提升速率,下…

2026-05-19

科技融入日常:智能家居、移动支付等五大场景重塑现代生活新图景
清晨7点时分,智能闹钟依据你的睡眠周期缓缓将你唤醒,窗帘自行拉开,咖啡机启动运作,在你出门之前,智能音箱会对你进行今天天气以及行程安排的提醒,于这些貌似简单的场景背后,是物联网、人工智能以及大数据技术的全然…

2026-05-19