中文科技资讯
业界资讯 互联网 手机资讯 电脑硬件 数码产品 家电产品 APP应用 手机游戏 美通快讯

字节豆包通用图像编辑模型SeedEdit开启测试 用户可一句话轻松改图

2024-11-11来源:中文科技资讯编辑:芳华

11月11日,字节在豆包大模型团队官网上公布最新通用图像编辑模型SeedEdit。SeedEdit支持一句话轻松改图,包括修图、换装、美化、转化风格、在指定区域添加删除元素等各类编辑操作,通过简单的自然语言即可驱动模型编辑任意图像。

目前,该模型已经在豆包PC端及即梦网页端开启测试。用户可以在豆包生成图片后,点击继续编辑按钮,输入简单的文本指令对图片背景或主体进行轻松调整,实现一句话改图。例如,用户在生成一张“小狗在草地奔跑”的图片后,可以直接输入“背景换成海边”等指令,获得一张基于原图片的微调图。

此外,用户也可以尝试在豆包PC或即梦的图像生成功能中自行上传参考图并进行二次加工。

SeedEdit是国内首个实现产品化的通用图像编辑模型。过往,学术界在文生图和图生图领域已有较多研究,但做好生成图片的指令编辑一直是难题,二次修改很难保证稳定性和生成质量。今年以来,Dalle3、Midjourney接连推出产品化的生图编辑功能,相较业界此前方案,编辑生成图片的质量大大改善,但仍缺乏对用户编辑指令的精准响应和原图信息保持能力。

字节跳动豆包大模型团队表示:图像编辑任务的关键在于取得「维持原始图像」和「生成新图像」之间的最优平衡,这一理念贯穿了整个模型的设计与优化过程。

据介绍,在模型数据生产中, SeedEdit 针对数据稀缺问题, 重新设计模型架构,并且采用多模型,多尺度,和多标准的数据制造方案很大程度上解决了数据量,数据多样性和数据质量的问题。作为一款专为图像编辑任务设计的模型,SeedEdit在通用性、可控性、高质量等方面取得了一定突破。

此前业界技术主要针对单个专家任务进行优化,比如针对表情、发型、背景的删除或替换,或专门配置工作流进行风格调配,每次出现新的编辑任务均需收集对应数据进行训练开发。而SeedEdit作为通用的图像编辑模型,适用各类编辑任务,支持用户脑洞大开的奇思妙想,无需再训练微调即可快捷应用。 它与业界同类方法对比 (如EMU Edit和Ultra Edit),取得显著更优的性能指标。

(HQ-Edit等基准测评显示:SeedEdit能理解相对模糊的指令,且执行细致编辑时具有更高的图像保持率和成功率)

即便在常规任务中,相比专家模型,SeedEdit 也有一定优势。比如,在“抠图”换背景等用户最常用到的图像分割任务中,SeedEdit 编辑生成后的图像风格自然,无“贴图感”;在局部涂抹、编辑、添加和删除元素等任务中,相比手动涂抹编辑, SeedEdit通过语言指定, 大大节省了用户涂抹的时间,尤其针对裂纹、发丝等相对精细的涂抹区域。

(要求图片将草莓替换成柠檬)

同时,SeedEdit通过创新的模型架构,多尺度、多规则的数据获取、构造和过滤方案,能更好地理解用户意图并对齐 diffusion 生图模型,极大提高了图像编辑的精准度,并保持了高质量的图片生成效果。

(要求去掉裂纹,让图片变干净)

基于豆包文生图大模型,目前SeedEdit支持中文和英文输入,还可以对中文成语和专有名词进行精准响应。下一步,SeedEdit还将开放多轮复杂编辑的功能。

豆包大模型团队表示,现阶段SeedEdit对模型生成图片的编辑效果要好于输入真实图片,同时在更复杂和更精细的控制上仍有改进空间。未来,SeedEdit会在真实图片保真、ID保持、编辑精确性、以及长时序的故事类、漫画类生成方面做进一步的优化和探索,提升编辑可用率和用户体验,支持用户更高效地创作有趣的内容。

从技术到标准,我国燃气热水器行业加快推进绿色升级
在 “双碳” 目标引领能源变革的时代浪潮下,天然气作为优质高效、绿色清洁的低碳能源,其在能源体系中的关键作用愈发凸显。与此同时,国家积极推动的家电 “以旧换新” 行动,也为天然气的高效利用与安全普及注入新动力。作为家庭用能的重要构成部分,天然气

2025-08-01

陈佩斯《戏台》南京开演,“轻功登台”快闪装置引打卡热潮#vivoXFold5
陈佩斯《戏台》南京开演,“轻功登台”快闪装置引打卡热潮#vivoXFold5

2025-06-27

美团外卖日单量连日超过9000万,餐食外卖市占率稳占70%
“从日GMV看,市场格局仍然处在7:2:1的稳定阶段。”作者丨代聪飞编辑丨林觉民6月17日,雷峰网独家获得一组流传的数据显示,自6月中旬开始,美团外卖日均支付订单始终维持在9000万量级以上,从单日GMV和餐食外卖市场单量等角度看,美团外卖市占率稳居70%左右。

2025-06-18

GAITC2025全球人工智能技术大会 | 每日互动方毅:开源大模型+闭源小数据是AI时代的重要路径
“人工智能的翻译可能存在一个误会,它更适合叫‘人造智能’,对应的是‘神造智能’。‘人造智能’模拟了神造智能过程中的规律;如今我们也可以从人造智能身上重新学回‘神’的智慧。”6月8日上午,每日互动方毅在2025全球人工智能技术大会(GAITC)智能传媒专题

2025-06-11

每日互动荣登“2025年度浙商‘AI+’TOP100”榜单
摘要:用技术赋能产业,以创新链动未来6月4日,由浙商发展研究院、浙江日报报业集团、浙江省创业投资协会、浙江省股权投资行业协会指导,《浙商》杂志、《浙商》全国理事会联合主办的“2025年度浙商‘AI+’TOP100”榜单正式发布。每日互动凭借在AI技术融合、

2025-06-06

青岛疾控中心公益视频: 结核分枝杆菌潜伏感染者预防性治疗大冒险
视频来源:青岛市疾病预防控制中心青岛市预防医学研究院青岛市卫生健康大数据中心

2025-03-27

DeepGreenX中国公司荣获“2025福布斯中国行业发展领军企业”奖项
2025年3月22日,在2025沙利文中国企业家年会暨“福布斯中国行业发展领创者评选”颁奖典礼上,阳光七星投资集团旗下企业DeepGreenX集团(以下简称“DXG”)旗下的中国公司凭借其在行业创新、市场领导力及可持续发展方面的卓越表现,荣获“2025福布斯中国行业发展

2025-03-24

吴征博士荣获“2025福布斯中国行业发展领创者”称号
吴征博士荣获“2025福布斯中国行业发展领创者”称号 引领阳光七星投资集团迈向全球创新新高地2025年3月22日,在2025沙利文中国企业家年会暨“福布斯中国行业发展领创者评选”颁奖典礼上,阳光七星投资集团主席兼CEO吴征博士凭借其卓越的领导力、创新精神及对

2025-03-24

2025年呼叫中心品牌排行,如何选择智能呼叫系统?
呼叫中心已从传统电话接听演变为企业连接客户的核心枢纽,一套高效、稳定且智能的呼叫系统,是企业提升服务效率、优化用户体验的关键基建。本文将基于行业调研与市场反馈,梳理当前呼叫中心品牌排行的核心逻辑,并深度解析头部厂商的产品价值,为企业选型提供

2025-03-17