中文科技资讯
业界资讯 互联网 手机资讯 电脑硬件 数码产品 家电产品 APP应用 手机游戏 美通快讯

字节豆包通用图像编辑模型SeedEdit开启测试 用户可一句话轻松改图

2024-11-11来源:中文科技资讯编辑:芳华

11月11日,字节在豆包大模型团队官网上公布最新通用图像编辑模型SeedEdit。SeedEdit支持一句话轻松改图,包括修图、换装、美化、转化风格、在指定区域添加删除元素等各类编辑操作,通过简单的自然语言即可驱动模型编辑任意图像。

目前,该模型已经在豆包PC端及即梦网页端开启测试。用户可以在豆包生成图片后,点击继续编辑按钮,输入简单的文本指令对图片背景或主体进行轻松调整,实现一句话改图。例如,用户在生成一张“小狗在草地奔跑”的图片后,可以直接输入“背景换成海边”等指令,获得一张基于原图片的微调图。

此外,用户也可以尝试在豆包PC或即梦的图像生成功能中自行上传参考图并进行二次加工。

SeedEdit是国内首个实现产品化的通用图像编辑模型。过往,学术界在文生图和图生图领域已有较多研究,但做好生成图片的指令编辑一直是难题,二次修改很难保证稳定性和生成质量。今年以来,Dalle3、Midjourney接连推出产品化的生图编辑功能,相较业界此前方案,编辑生成图片的质量大大改善,但仍缺乏对用户编辑指令的精准响应和原图信息保持能力。

字节跳动豆包大模型团队表示:图像编辑任务的关键在于取得「维持原始图像」和「生成新图像」之间的最优平衡,这一理念贯穿了整个模型的设计与优化过程。

据介绍,在模型数据生产中, SeedEdit 针对数据稀缺问题, 重新设计模型架构,并且采用多模型,多尺度,和多标准的数据制造方案很大程度上解决了数据量,数据多样性和数据质量的问题。作为一款专为图像编辑任务设计的模型,SeedEdit在通用性、可控性、高质量等方面取得了一定突破。

此前业界技术主要针对单个专家任务进行优化,比如针对表情、发型、背景的删除或替换,或专门配置工作流进行风格调配,每次出现新的编辑任务均需收集对应数据进行训练开发。而SeedEdit作为通用的图像编辑模型,适用各类编辑任务,支持用户脑洞大开的奇思妙想,无需再训练微调即可快捷应用。 它与业界同类方法对比 (如EMU Edit和Ultra Edit),取得显著更优的性能指标。

(HQ-Edit等基准测评显示:SeedEdit能理解相对模糊的指令,且执行细致编辑时具有更高的图像保持率和成功率)

即便在常规任务中,相比专家模型,SeedEdit 也有一定优势。比如,在“抠图”换背景等用户最常用到的图像分割任务中,SeedEdit 编辑生成后的图像风格自然,无“贴图感”;在局部涂抹、编辑、添加和删除元素等任务中,相比手动涂抹编辑, SeedEdit通过语言指定, 大大节省了用户涂抹的时间,尤其针对裂纹、发丝等相对精细的涂抹区域。

(要求图片将草莓替换成柠檬)

同时,SeedEdit通过创新的模型架构,多尺度、多规则的数据获取、构造和过滤方案,能更好地理解用户意图并对齐 diffusion 生图模型,极大提高了图像编辑的精准度,并保持了高质量的图片生成效果。

(要求去掉裂纹,让图片变干净)

基于豆包文生图大模型,目前SeedEdit支持中文和英文输入,还可以对中文成语和专有名词进行精准响应。下一步,SeedEdit还将开放多轮复杂编辑的功能。

豆包大模型团队表示,现阶段SeedEdit对模型生成图片的编辑效果要好于输入真实图片,同时在更复杂和更精细的控制上仍有改进空间。未来,SeedEdit会在真实图片保真、ID保持、编辑精确性、以及长时序的故事类、漫画类生成方面做进一步的优化和探索,提升编辑可用率和用户体验,支持用户更高效地创作有趣的内容。

牌面拉满!比亚迪成为多国元首的选择
近年来,我国新能源汽车产业在科技创新驱动下实现跨越式发展,比亚迪作为行业领军企业,技术领先全球瞩目,凭借过硬的技术实力与产品品质,赢得多国元首青睐,成为“中国制造”向“中国智造”转型升级的典型代表,更成为传递中国科技实力的“移动新名片”与“

2025-10-21

抖音电商持续治理虚假宣传保健功效,清退违规达人4.3万名,违规商家793家
10月20日,抖音电商安全与信任中心发布治理虚假宣传保健功效的进展,公告称多平台反复出现以“健康焦虑”为卖点的功效虚假宣传现象,已成为食品行业的顽疾。据了解,部分不良商家、达人将普通食品包装为“保健品”或“特医食品”,甚至将保健食品夸大为具有医

2025-10-21

红果短剧创作服务平台成立,为行业全链条从业者提供支持
近日,红果短剧创作服务平台正式成立,旨在搭建行业交流平台,汇聚产业资源,提升协作效率,构建开放高效的服务型生态,助力微短剧行业持续高质量发展。近年来,微短剧市场蓬勃发展,《2024 微短剧行业生态洞察报告》显示,行业整体规模已突破500亿元,带动超

2025-10-16

百度搜索全面升级创作能力 用户日均生成AIGC内容已破千万
10月15日,百度搜索宣布全面升级文心助手AIGC创作能力,支持AI图片、AI视频、AI音乐、AI播客等8种模态创作,且能够一键调用多工具解决多场景问题。截至目前,百度搜索用户日均生成AIGC内容已破千万。此外,百度搜索还发布行业首个开放式实时互动的数字人智能

2025-10-15

2025vivo开发者大会:人文科技铺就信息无障碍之路
10月10日,以“同心·同行”为主题的2025 vivo开发者大会在深圳国际会展中心成功举办。大会主会场正式发布vivo全新系统OriginOS 6及自研蓝河操作系统3,其搭载的vivo AI蓝心大模型为信息无障碍功能带来系列升级,通过科技赋能,进一步让视听障用户更便捷地享

2025-10-14

2025 VDC互联网技术分会场:多专家分享业务赋能实践效果
2025年度vivo开发者大会于10月10日成功举办。此次大会延续了“同心•同行”主题,开设主会场及11大分会场。在互联网技术分会场上,多位vivo专家针对拨测融合流量管理、微服务架构与Dubbo性能优化、全链路多版本环境落地、GPU容器与AI训练平台等方面分享了vivo

2025-10-11

vivo AI战略“个人化” 原系统6、蓝河操作系统3亮相开发者大会
10 月 10 日,2025 vivo 开发者大会在深圳国际会展中心正式启幕。作为 vivo 年度技术战略的重要发布窗口,本次大会延续「同心·同行」的主题,集中呈现了vivo蓝心智能战略、原系统 6(OriginOS 6)、蓝河操作系统 3(BlueOS 3)及vivo在生态合作、安全、人文等方

2025-10-11

上市72小时即交付,全新问界M7交付现场竟然她们也来了!
文 / 小林美编 / 顾青青出品 / 电动新物种9月26日的问界M7交付现场,来了一群特殊的客人。中国国家艺术体操队的姑娘们穿着训练服,好奇地打量着眼前这台刚刚上市就火爆全网的新车。她们伸手触摸车身线条,就像在赛场上感受器械的质感一样专注。一边是刚刚创下

2025-09-30

贾跃亭公布FX品牌第二款车型FX 4产品计划 目标AIEV时代下RAV4颠覆者
9月29日,Faraday Future(FF)创始人、联席CEO贾跃亭公布了FX品牌第二款车型FX 4产品计划,目标是打造AIEV时代下RAV4的颠覆者;同时宣布在10月28日举行FX Super One中东Final Launch发布会,并计划11月率先在中东市场开启交付,并发布FX 4重大项目进展及产品设

2025-09-29

双11节奏出炉:10月9日晚8点开启 主打官方直降
今年11.11购物节,正式定档10月9日开启!9月29日,京东宣布,今年京东11.11将于10月9日晚8点现货开卖。在汇集海量热销爆款好物的同时,将提供“官方直降 低至1折”的优惠福利,为消费者带来又好又便宜的消费体验!京东11.11选择在“十一黄金周”结束后的第一天

2025-09-29