关闭广告

大规模强化学习框架RLinf!清华、北京中关村学院、无问芯穹等开源

机器之心Pro2025-09-01 12:00:01230人阅读

机器之心报道

机器之心编辑部

清华大学、北京中关村学院、无问芯穹联合北大、伯克利等机构重磅开源RLinf:首个面向具身智能的“渲训推一体化”大规模强化学习框架。



人工智能正在经历从 “感知” 到 “行动” 的跨越式发展,融合大模型的具身智能被认为是人工智能的下一发展阶段,成为学术界与工业界共同关注的话题。

在大模型领域,随着 o1/R1 系列推理模型的发布,模型训练的重心逐渐从数据驱动的预训练 / 后训练转向奖励驱动的强化学习(Reinforcement Learning, RL)。OpenAI 预测强化学习所需要的算力甚至将超过预训练。与此同时,能够将大规模算力高效利用的 RL infra 的重要性也日益凸显,近期也涌现出一批优秀的框架,极大地促进了该领域的发展。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

游船突遇狂风被掀翻 美国外卖巨头高管及父母丧生

红星新闻 浏览 9356 06-26

男健身教练同时睡4名女学员 拍下性视频发网上炫耀

180视角 浏览 243 09-09

270余人遇难 印度航空空难初步调查报告公布

界面新闻 浏览 10451 07-12

17.98万元起!大平层/云辇-C/无人机 方程豹钛7上市

网易汽车 浏览 193 09-11

德天空:大幅涨薪,努涅斯在利雅得新月每年将净赚1500万欧

懂球帝 浏览 2404 08-07

内蒙古“婚内强奸案”今日一审开庭 女方提出30万赔偿

极目新闻 浏览 1282 08-12

夏联-杨瀚森10分5篮板开拓者遭灰熊末节逆转 威尔斯23+7

网易体育 浏览 3987 07-14

70岁的任达华打脸内娱年轻明星,动作戏这么帅

最爱酷影视 浏览 7552 07-31

首回合告负!穆帅:在这个球场我从未赢过,但我总能淘汰费耶诺德

直播吧 浏览 5180 08-07

以色列议会初步通过吞并约旦河西岸法案 遭15国谴责

环球时报国际 浏览 97 10-26

金靖马德里生图曝光!被搞笑耽误的神颜!

开心熬夜观影 浏览 808 07-10

欧美新关税协议能兑现吗?

国际金融报 浏览 7869 07-31

Karpathy戳破强化学习神话,首提AI复盘式进化!暴力试错将死

新智元 浏览 6137 07-14

技嘉B860M AORUS PRO WIFI7主板评测:酷睿Ultra 200处理器好搭档

IT之家 浏览 3165 08-06

ICCV 2025满分论文:一个模型实现空间理解与主动探索大统一

机器之心Pro 浏览 3907 07-14

深圳1900亿央企换将,去年人均薪酬超51万

华美财经 浏览 15 12-12

《披荆斩棘5》官宣定档,阵容好离谱啊!网友:请不到人就别办了

娱乐圈笔娱君 浏览 9682 08-07

罗马诺:巴塞尔签18岁塞尔维亚后腰巴查宁达协议,总价300万欧

直播吧 浏览 7738 07-31

以军攻势升级 加沙两天内超4万人流离失所

澎湃新闻 浏览 166 09-18

挖机参与抗洪抢险陷入沼泽近两月 施工队未能助它脱困

极目新闻 浏览 212 09-20

vivo Vision 探索版使用磁吸镜片方案,会尝试三方镜片的兼容

IT之家 浏览 296 08-24
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11