近日,哈佛大学携手谷歌在AI领域迈出了重要一步,他们宣布将联合发布一个规模庞大的数据集,包含约100万本公共领域的书籍。这一举措旨在为AI训练提供丰富且合法的数据源。
据悉,AI训练所需的数据成本高昂,往往让资金有限的机构望而却步。然而,哈佛大学此次推出的数据集,将覆盖多种类型、语言和作者的作品,其中包括许多经典作家的名著,如狄更斯、但丁和莎士比亚等人的作品。这些作品的版权已随时间流逝而过期,因此可以被自由使用。

值得注意的是,早在今年3月,哈佛大学就已透露了其“机构数据计划(IDI)”,旨在构建一个合法且可信的数据通道,以支持AI的发展。该计划直到正式启动后,才确认了微软和OpenAI的资金支持。
作为IDI的执行董事,格雷格·莱佩特表示,这一数据集的目标是让AI领域的竞争环境更加公平。通过向研究机构、AI初创公司等各类机构开放这一庞大的数据集,他们将有更多机会训练出大型语言模型,从而推动AI技术的进一步发展。
山海星耀攻克超低轨难题,以硬核技术逐梦空天新蓝海
天虎科技了解到,虽然当前市场上有一些针对超低轨的吸气式推进器,但从气体收集率、推进效率、测试工作环境等维度上,山海星耀的电推进器均具备一定优势。 蔡东升表示,目前该产品是商业航天公司首次实现了“高真空运行环…
2025-11-12
企业宽带选不对,带宽再大也白费!这些关键因素决定实际网速
• 网速(用户感知):即实际访问体验,取决于 3 个核心因素 —— 带宽只是基础,更重要的是网络质量、路由优化和并发处理能力。 真正专业的服务商,会从企业实际业务场景出发提供解决方案,而非一味推销高带宽产品…
2025-11-12
可编程网络中控系统:控制为核心基石,附属功能助力效能提升
AI算法在中控系统中的应用,并非为了追求技术噱头,而是通过分析设备运行状态数据,实现控制指令的预判与自适应调整——如根据会议室人数自动调节空调温度、根据室外光照强度自动调整室内照明亮度,让控制更智能、更贴合实…
2025-11-10