中文科技资讯
业界资讯 互联网 手机资讯 电脑硬件 数码产品 家电产品 APP应用 手机游戏 美通快讯

字节豆包通用图像编辑模型SeedEdit开启测试 用户可一句话轻松改图

2024-11-11来源:中文科技资讯编辑:芳华

11月11日,字节在豆包大模型团队官网上公布最新通用图像编辑模型SeedEdit。SeedEdit支持一句话轻松改图,包括修图、换装、美化、转化风格、在指定区域添加删除元素等各类编辑操作,通过简单的自然语言即可驱动模型编辑任意图像。

目前,该模型已经在豆包PC端及即梦网页端开启测试。用户可以在豆包生成图片后,点击继续编辑按钮,输入简单的文本指令对图片背景或主体进行轻松调整,实现一句话改图。例如,用户在生成一张“小狗在草地奔跑”的图片后,可以直接输入“背景换成海边”等指令,获得一张基于原图片的微调图。

此外,用户也可以尝试在豆包PC或即梦的图像生成功能中自行上传参考图并进行二次加工。

SeedEdit是国内首个实现产品化的通用图像编辑模型。过往,学术界在文生图和图生图领域已有较多研究,但做好生成图片的指令编辑一直是难题,二次修改很难保证稳定性和生成质量。今年以来,Dalle3、Midjourney接连推出产品化的生图编辑功能,相较业界此前方案,编辑生成图片的质量大大改善,但仍缺乏对用户编辑指令的精准响应和原图信息保持能力。

字节跳动豆包大模型团队表示:图像编辑任务的关键在于取得「维持原始图像」和「生成新图像」之间的最优平衡,这一理念贯穿了整个模型的设计与优化过程。

据介绍,在模型数据生产中, SeedEdit 针对数据稀缺问题, 重新设计模型架构,并且采用多模型,多尺度,和多标准的数据制造方案很大程度上解决了数据量,数据多样性和数据质量的问题。作为一款专为图像编辑任务设计的模型,SeedEdit在通用性、可控性、高质量等方面取得了一定突破。

此前业界技术主要针对单个专家任务进行优化,比如针对表情、发型、背景的删除或替换,或专门配置工作流进行风格调配,每次出现新的编辑任务均需收集对应数据进行训练开发。而SeedEdit作为通用的图像编辑模型,适用各类编辑任务,支持用户脑洞大开的奇思妙想,无需再训练微调即可快捷应用。 它与业界同类方法对比 (如EMU Edit和Ultra Edit),取得显著更优的性能指标。

(HQ-Edit等基准测评显示:SeedEdit能理解相对模糊的指令,且执行细致编辑时具有更高的图像保持率和成功率)

即便在常规任务中,相比专家模型,SeedEdit 也有一定优势。比如,在“抠图”换背景等用户最常用到的图像分割任务中,SeedEdit 编辑生成后的图像风格自然,无“贴图感”;在局部涂抹、编辑、添加和删除元素等任务中,相比手动涂抹编辑, SeedEdit通过语言指定, 大大节省了用户涂抹的时间,尤其针对裂纹、发丝等相对精细的涂抹区域。

(要求图片将草莓替换成柠檬)

同时,SeedEdit通过创新的模型架构,多尺度、多规则的数据获取、构造和过滤方案,能更好地理解用户意图并对齐 diffusion 生图模型,极大提高了图像编辑的精准度,并保持了高质量的图片生成效果。

(要求去掉裂纹,让图片变干净)

基于豆包文生图大模型,目前SeedEdit支持中文和英文输入,还可以对中文成语和专有名词进行精准响应。下一步,SeedEdit还将开放多轮复杂编辑的功能。

豆包大模型团队表示,现阶段SeedEdit对模型生成图片的编辑效果要好于输入真实图片,同时在更复杂和更精细的控制上仍有改进空间。未来,SeedEdit会在真实图片保真、ID保持、编辑精确性、以及长时序的故事类、漫画类生成方面做进一步的优化和探索,提升编辑可用率和用户体验,支持用户更高效地创作有趣的内容。

青岛疾控中心公益视频:“青小侠”带你认识人畜共患结核病
内容 视频来源:青岛市疾病预防控制中心青岛市预防医学研究院青岛市卫生健康大数据中心

2024-12-30

场景拓新,AI添翼 萤石云荣获OFweek行业优秀开发平台奖
近日,由中国高科技行业门户OFweek及旗下权威的物联网专业媒体-OFweek·物联网共同举办的“维科杯”年度评选揭晓,萤石网络——萤石物联云平台荣获行业优秀开发平台奖,该奖项也是对萤石云在丰富音视频场景化应用和AI探索创新行动上的认可。音视频在越来越多

2024-12-26

星动纪元端到端原生机器人大模型ERA-42正式亮相,引领具身大模型进入灵巧操作时代
导语:近期,星动纪元端到端原生机器人大模型ERA-42正式亮相,即“纪元原生机器人大模型”,寓意着不断探索宇宙万物的终极答案,展示了其与自研五指灵巧手星动XHAND1结合后的灵巧操作能力,已学会了使用不同工具完成100多种复杂灵巧的操作任务,并且持续在同一

2024-12-23

FF宣布再获3000万美元新融资 首笔750万美金已到账将加速FX战略等业务
12月23日,总部位于美国加州、致力于推出人工智能电动车(AIEV)的科技公司Faraday Future(纳斯达克:FFIE,简称FF)今天宣布,继9月份完成3000万美元融资之后,FF又完成了新一轮3000万美元的现金融资,加速助力FX战略推进。公司还将于1月5号-7号在拉斯维加斯举

2024-12-23

阿里云百炼上线音视频实时互动功能,人人都能创建专属多模态应用
近日,阿里云百炼上线了全新音视频实时互动功能,用户可在百炼上自由选择文本、语音和视觉理解等200多款模型,无需代码,数分钟即可搭建一个能听、能看、会说的专属AI助手。阿里云百炼还支持以sdk的形式集成到Web、ioS和安卓应用,可应用于AI虚拟助手、虚拟陪

2024-12-19

豆包视觉理解模型正式发布,比行业价格便宜85%
继大语言模型价格以厘计算之后,视觉理解模型也宣告进入“厘时代”。在12月18日举办的火山引擎 Force 大会上,字节跳动正式发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720

2024-12-19

百雀羚研究院启航:共绘美妆科技新蓝图
12月17日,东方智慧共建首都美丽健康产业研讨会在北京工商大学盛大举行!会上,百雀羚携手北工商共同宣布百雀羚全球前沿科技研究院正式成立。此举不仅标志着百雀羚在科技创新、人才培养与产学结合方面迈出了坚实的一步,更凸显了其在科研领域坚守的长期主义理

2024-12-19

引领AI安全时代:三六零发布智鉴智盾智搜等大模型安全产品
12月17日,由360集团牵头发起的大模型安全联盟(以下简称“联盟”)在北京成立。据了解,包括联想、腾讯云、百度智能云、火山引擎、MiniMax、清华大学等监管机构、科研院所、大模型伙伴、算力与基础设施伙伴及安全伙伴等参与了联盟启动仪式。大模型安全联盟汇聚

2024-12-18

360安全卫士极速版2025上线:重新定义"轻快"安全软件
近日,360安全卫士推出全新极速版2025,通过深度优化和创新技术,为用户带来隐形级的安全守护体验。作为拥有4000万+用户的国民级安全软件,新版本将安装速度提升至10秒内完成,开机速度提升20%,同时巧妙解决了安全软件对系统性能的影响问题。在这个互联网时

2024-12-16

番茄小说创作者大会举办,未来一年将投入两亿现金扶持精品内容
12 月 11 日,番茄小说创作者大会在海南三亚举办,相关负责人分享了平台一年间在生态多元化与 IP 生态构建方面取得的进展。会上,番茄小说宣布将在2025年投入两亿元现金扶持精品内容,并持续推出系列扶持计划,在 IP 生态上发力。生态多元化,番茄小说助力更

2024-12-11