中文科技资讯
业界资讯 互联网 手机资讯 电脑硬件 数码产品 家电产品 APP应用 手机游戏 美通快讯

豆包视觉理解模型正式发布,比行业价格便宜85%

2024-12-19来源:互联网编辑:芳华

继大语言模型价格以厘计算之后,视觉理解模型也宣告进入“厘时代”。

在12月18日举办的火山引擎 Force 大会上,字节跳动正式发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%,以更低成本推动AI技术普惠和应用发展。

豆包大模型全面升级

研究显示,人类接受的信息超过80%来自视觉。视觉理解将极大地拓展大模型的能力边界,同时也会降低人们与大模型交互的门槛,为大模型解锁更丰富的应用场景。

据火山引擎总裁谭待介绍,豆包视觉理解模型不仅能精准识别视觉内容,还具备出色的理解和推理能力,可根据图像信息进行复杂的逻辑计算,完成分析图表、处理代码、解答学科问题等任务。此外,该模型有着细腻的视觉描述和创作能力。

图:火山引擎总裁谭待

此前,豆包视觉理解模型已经接入豆包App和PC端产品。豆包战略研究负责人周昊表示:“豆包一直在努力,让用户的输入更快更方便”。为此,豆包产品非常注重多模态的输入和打磨,包括语音、视觉等能力,这些模型都已通过火山引擎开放给企业客户。

会上,豆包3D生成模型也首次亮相。该模型与火山引擎数字孪生平台veOmniverse结合使用,可以高效完成智能训练、数据合成和数字资产制作,成为一套支持 AIGC 创作的物理世界仿真模拟器。

豆包大模型多款产品也迎来重要更新:豆包通用模型pro已全面对齐GPT-4o,使用价格仅为后者的1/8;音乐模型从生成60秒的简单结构,升级到生成3分钟的完整作品;文生图模型2.1版本,更是在业界首次实现精准生成汉字和一句话P图的产品化能力,该模型已接入即梦AI和豆包App。

即梦Dreamina张楠认为,生成式AI技术可以把每个人脑子里的奇思妙想快速视觉化,“像做梦一样”。即梦希望成为“想象力世界”的相机,记录每个人的奇思妙想,帮助每个有想法的人轻松表达、自由创作。

图:即梦Dreamina 张楠

大会正式宣告,2025年春季将推出具备更长视频生成能力的豆包视频生成模型1.5版,豆包端到端实时语音模型也将很快上线,从而解锁多角色演绎、方言转换等新能力。谭待表示,豆包大模型虽然发布较晚,但一直在快速迭代进化,目前已成为国内最全面、技术最领先的大模型之一。

大模型应用加速落地

数据显示,截至12月中旬,豆包通用模型的日均tokens使用量已超过4万亿,较七个月前首次发布时增长了33倍。大模型应用正在向各行各业加速渗透。

据悉,豆包大模型已经与八成主流汽车品牌合作,并接入到多家手机、PC等智能终端,覆盖终端设备约3亿台,来自智能终端的豆包大模型调用量在半年时间内增长100倍。

与企业生产力相关的场景,豆包大模型也获得了众多企业客户青睐:最近3个月,豆包大模型在信息处理场景的调用量增长了39倍,客服与销售场景增长16倍,硬件终端场景增长13倍,AI工具场景增长9倍,学习教育等场景也有大幅增长。

谭待认为,豆包大模型市场份额的爆发,得益于火山引擎“更强模型、更低成本、更易落地”的发展理念,让AI成为每一家企业都能用得起、用得好的普惠科技。

在公布豆包视觉理解模型超低定价的同时,火山引擎升级了火山方舟、扣子和 HiAgent 三款平台产品,帮助企业构建好自身的 AI 能力中心,高效开发 AI 应用。其中,火山方舟发布了大模型记忆方案,并推出 prefix cache 和 session cache API,降低延迟和成本。火山方舟还带来全域 AI 搜索,具备场景化搜索推荐一体化、企业私域信息整合等服务。

云原生是过去十年最重要的计算范式,大模型时代则推动着云计算的变革。火山引擎认为,下一个十年,计算范式应该从云原生进入到AI云原生的新时代。

基于AI云原生的理念,火山引擎推出了新一代计算、网络、存储和和安全产品。在计算层面,火山引擎GPU实例,通过vRDMA网络,支持大规模并行计算和P/D分离推理架构,显著提升训练和推理效率,降低成本;存储上,新推出的EIC弹性极速缓存,能够实现GPU直连,使大模型推理时延降低至1/50、成本降低20%;在安全层面,火山将推出PCC私密云服务,构建大模型的可信应用体系。基于PCC,企业能够实现用户数据在云上推理的端到端加密,而且性能很好,推理时延比明文模式的差异在5%以内。

谭待说:“今年是大模型高速发展的一年。当你看到一列高速行驶的列车,最重要的事就是确保自己要登上这趟列车。通过AI云原生和豆包大模型家族,火山引擎希望帮助企业做好AI创新,驶向更美好的未来。”

百雀羚研究院启航:共绘美妆科技新蓝图
12月17日,东方智慧共建首都美丽健康产业研讨会在北京工商大学盛大举行!会上,百雀羚携手北工商共同宣布百雀羚全球前沿科技研究院正式成立。此举不仅标志着百雀羚在科技创新、人才培养与产学结合方面迈出了坚实的一步,更凸显了其在科研领域坚守的长期主义理

2024-12-19

引领AI安全时代:三六零发布智鉴智盾智搜等大模型安全产品
12月17日,由360集团牵头发起的大模型安全联盟(以下简称“联盟”)在北京成立。据了解,包括联想、腾讯云、百度智能云、火山引擎、MiniMax、清华大学等监管机构、科研院所、大模型伙伴、算力与基础设施伙伴及安全伙伴等参与了联盟启动仪式。大模型安全联盟汇聚

2024-12-18

360安全卫士极速版2025上线:重新定义"轻快"安全软件
近日,360安全卫士推出全新极速版2025,通过深度优化和创新技术,为用户带来隐形级的安全守护体验。作为拥有4000万+用户的国民级安全软件,新版本将安装速度提升至10秒内完成,开机速度提升20%,同时巧妙解决了安全软件对系统性能的影响问题。在这个互联网时

2024-12-16

番茄小说创作者大会举办,未来一年将投入两亿现金扶持精品内容
12 月 11 日,番茄小说创作者大会在海南三亚举办,相关负责人分享了平台一年间在生态多元化与 IP 生态构建方面取得的进展。会上,番茄小说宣布将在2025年投入两亿元现金扶持精品内容,并持续推出系列扶持计划,在 IP 生态上发力。生态多元化,番茄小说助力更

2024-12-11

AI时代如何构建智算中心?维谛技术(Vertiv)全链智算解决方案让算力触手可及
AI时代,算力无处不在。AI完成每一次人脸识别、每一次语音文字转换,都需要硬件芯片的算力支持。当你在电商平台按下支付的那一秒,后台就完成了十几亿次计算。自动驾驶级别每升高一级,算力就需要增加一个量级,L5级的算力需求超过2000TOPS。根据IDC发布的相

2024-12-11

抖音精选加码知识普惠,知名教育博主“一数”入驻引领数学学习风潮
近日,知名教育内容创作者“一数”正式入驻抖音,称将在抖音持续发布高中数学系统知识合集内容。抖音精选“精品课”栏目也将收录“一数”相关内容,为青少年提供优质的免费课外课堂资源。作为教育领域的头部博主,“一数”以趣味横生的数学讲解风靡全网,其创

2024-12-09

特斯拉最新一代V4超级充电桩即将在2025年登陆中国内地
日前,特斯拉V4超级充电桩已经在北美、亚太、欧洲等地区启动了部署工作。据悉,特斯拉计划在2025年,在中国大陆地区开始部署V4超级充电桩。V4超充桩搭载了特斯拉最先进的充电技术,全面提升特斯拉车主超充体验,同时V4超充桩全面支持更多第三方车辆充电,包括

2024-12-09

毫末智行张凯&顾维灏发布五周年内部信:《前进,再前进!》
11月29日,毫末智行迎来了五周年。毫末智行董事长张凯和CEO顾维灏发出内部信《前进,再前进!》,号召毫末人要始终保持危机意识,用比别人付出更多几倍的努力,迎接一个又一个量产交付挑战。内部信回顾了毫末五年来的发展。五年里,毫末从一颗怀揣梦想与希望的

2024-12-05

首次覆盖超11类编程场景!字节开源最全面代码大模型基准FullStack Bench
代码大模型越来越卷,评估AI编程水平的“考卷”也被迫升级。12月5日,字节豆包大模型团队开源最新代码大模型评估基准FullStack Bench,在业界首次囊括编程全栈技术中超11类真实场景,覆盖16种编程语言,包含3374个问题,相比此前基准,可以更有效地评估大模型

2024-12-05

知音谷:刘玲玲脉轮瑜伽,疗愈身心灵,享受健康人生
随着经济不断发展和社会认知的提升,越来越多的中老年人开始主动走出以往的生活惯性,探索更有意义的老年生活。他们不仅注重日常的养生和食疗,还通过短视频等新兴平台学习瑜伽、站桩等健身项目,展现出积极的“活到老,学到老”精神,追求更加多元和充实的晚年生活

2024-12-03