中文科技资讯
业界资讯 互联网 手机资讯 电脑硬件 数码产品 家电产品 APP应用 手机游戏 美通快讯

2024年AI评测新风尚:从“史密斯吃面”到游戏对战,谁更接地气?

2025-01-01来源:ITBEAR编辑:瑞雪

在人工智能技术的飞速发展下,一个令人啼笑皆非的现象悄然兴起:每当有新的视频生成器问世,网络上总会出现一段威尔·史密斯享用意大利面的视频。这一场景,似乎成了新技术试金石,用以检验AI能否以假乱真,重现史密斯大快朵颐的瞬间。TechCrunch对此进行了详细报道,指出这一现象已超越了简单的网络迷因,成为了衡量AI视频生成能力的非正式标准。

有趣的是,史密斯本人也于二月通过Instagram回应,亲自模仿了这一场景,加入了这场由AI引发的网络狂欢。但这仅仅是2024年人工智能领域众多奇特“民间”评测标准中的一个缩影。早前,一位16岁的开发者创建了一款应用,让AI操控《我的世界》游戏,以此测试其建筑设计的智慧。同时,英国一位程序员也搭建了一个平台,让AI在“你画我猜”和“四子棋”等游戏中展开对决,进一步探索AI的娱乐潜能。

尽管人工智能领域不乏专业的性能测试,但这些略显古怪的测试方式却意外走红。原因在于,许多专业的AI基准测试对于普通大众而言,显得过于深奥难懂。企业常常强调AI在解决奥林匹克数学难题或博士级别问题上的能力,然而,大多数人使用聊天机器人的目的,仅仅是进行日常对话或回复邮件,这些高深的测试与他们的实际需求相去甚远。

即便是行业内广泛采用的评测方法,也并非尽善尽美。以备受关注的“聊天机器人竞技场”为例,该平台允许网络用户对AI在特定任务上的表现进行评分,如开发网页应用或生成图像。然而,参与评分的用户大多来自人工智能和科技行业,他们的投票往往基于个人偏好,缺乏代表性,这使得评测结果的公正性和普适性受到质疑。

相比之下,“四子棋”、“我的世界”以及“威尔·史密斯吃面条”等另类基准测试,虽然缺乏严谨性,却因其娱乐性和易理解性而广受欢迎。当然,这些测试也存在局限性,AI在某一任务上的出色表现,并不能直接反映其在其他任务上的能力。例如,能够完美生成“威尔·史密斯吃面条”视频的AI,未必能准确生成汉堡的图像。

技嘉B860M冰雕主板深度评测:千元价位与酷睿Ultra的完美搭档
XMP AI Boost的DDR5-8200 CL40挡位也能够顺利开启,再叠加上高带宽、低延迟功能的性能加成之后,内存性能继续得到提升,但写入性能基本上是到顶了,主要是受限于B860芯片组主板无法调整CP…

2025-11-14

杭州上城第三批50个“人工智能+”场景发布 涵盖多领域促发展
11月13日,杭州市上城区第三批“人工智能+”机会场景发布会暨场景供需对接会活动举行,推出50个高价值场景,涵盖社会治理、金融服务、民生服务、城市管理、智能建造、文化旅游、时尚消费等多个热门领域。如,由上城…

2025-11-14

高光谱探测器助力宽带叠层扫描成像 开启3D高光谱成像新篇
最近的研究表明,能量分辨或高光谱探测器可以在某种程度上取代单色器的作用来执行,例如,在单次采集中使用宽带辐射进行边缘减影叠层扫描成像。利用这样的探测器,时间相干性变得可调(在探测器的能量分辨率的限制内)并且在…

2025-11-12

乐鑫年会背后:17年创新坚守,从芯片到生态开启万物互联新征程
重要的是早在2024年,乐鑫科技就已成功突破Wi-Fi 6E技术,完成2.4GHz/5GHz/6GHz全频段技术布局,为Wi-Fi7产品研发奠定核心技术基础。 乐鑫从单枪匹马的上海浦东到登录科创板的行业排…

2025-11-12

中国电信携手多方完成2万公里中轨NTN在轨验证 助力6G天地一体组网
试验配置 Ka 频段 100MHz 带宽,基于自研的 NTN 终端样机,完成 FR2 频段 n510参数配置的透明转发模式在轨通信技术验证及海域宽带应用试点,实测下行峰值速率达 140Mbps(IT之家注…

2025-11-11

湖北Steam Deck下载遇阻?连接超时不用慌,这些方法助你畅享游戏
下载并安装UU加速器打开UU加速器,搜索并选择"Steam"在加速选项中,特别选择"下载异常专用"区服启动加速后再打开Steam Deck进行下载许多湖北用户反馈,使用这种方式后,原本停滞的下载进度条重新开…

2025-11-11

毕马威进博会聚焦运营服务:以智能驱动,助企业迈向可持续增长新路
毕马威运营服务四大核心价值运营重塑(Operational Reinvention)不只是把流程自动化,而是让智能成为业务的一部分。 在复杂监管中确保透明与合规在多业务场景中提升客户体验与决策质量在跨职能协作…

2025-11-11

解码细胞“对话”密码:单细胞转录组技术洞察疾病微环境奥秘
3. 通讯潜力: 如果细胞A表达配体,同时细胞B表达匹配的受体,那么A to B 的信号通路就被认为具有潜在的通讯活性。如果发现成纤维细胞通过TGF-β 信号轴强烈抑制 NK 细胞,那么 TGF-β 阻断…

2025-11-11

2025年AI智能鼠标深度体验:星火大模型赋能,它能替代哪些办公工具?
AI智能鼠标2025深度测评:星火大模型加持,AI问答、AI绘图能替代哪些工具?当一款鼠标,内嵌了如科大讯飞星火这般强大的认知大模型时,它所带来的,远不止是光标移动的流畅,更是一场关于效率与创造力的革命。我们…

2025-11-10