关闭广告

大规模强化学习框架RLinf!清华、北京中关村学院、无问芯穹等开源

机器之心Pro2025-09-01 12:00:01227人阅读

机器之心报道

机器之心编辑部

清华大学、北京中关村学院、无问芯穹联合北大、伯克利等机构重磅开源RLinf:首个面向具身智能的“渲训推一体化”大规模强化学习框架。



人工智能正在经历从 “感知” 到 “行动” 的跨越式发展,融合大模型的具身智能被认为是人工智能的下一发展阶段,成为学术界与工业界共同关注的话题。

在大模型领域,随着 o1/R1 系列推理模型的发布,模型训练的重心逐渐从数据驱动的预训练 / 后训练转向奖励驱动的强化学习(Reinforcement Learning, RL)。OpenAI 预测强化学习所需要的算力甚至将超过预训练。与此同时,能够将大规模算力高效利用的 RL infra 的重要性也日益凸显,近期也涌现出一批优秀的框架,极大地促进了该领域的发展。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

高考生被骗至缅甸 同车人:一起拼车4小时 都劝他回家

扬子晚报 浏览 753 07-14

寄件强制刷脸为哪般?用户质疑:网点标准不一,担心隐私泄露

南方都市报 浏览 1209 07-17

中国恒大正式退市 仍将继续清盘

证券时报 浏览 249 08-26

海狮05 EV如何拿捏10万级家用SUV需求

网易汽车 浏览 266 05-26

厦大EMBA,四维一体、育见未来

经理人杂志 浏览 92 10-22

岚图双子星首搭华为ADS4,全新岚图知音8月底上市

智驾网 浏览 850 07-17

深交所下令,卷铺盖走人!与证监会缠斗数月,江苏一家人迎来终章

壹只灰鸽子 浏览 7355 07-25

德天空记者:德甲球队为莱斯特中场恩迪迪提供邀约,估价1500万欧

直播吧 浏览 2507 07-15

股市:“最大的推手”出现了!

小白读财经 浏览 282 08-28

红军城陷落在即 俄军或迎巴赫穆特后最大胜利

北京日报客户端 浏览 49 11-12

罗马总监谈桑乔:不认为目前存在推进谈判的条件和动机

直播吧 浏览 254 08-24

《冰湖重生》被曝补拍!黄杨钿甜宣传未出镜,网友想看原定小楚乔

萌神木木 浏览 1733 07-17

女子离婚前被丈夫杀害:男方曾连打84通电话要她回家

南方都市报 浏览 221 09-09

姆伯莫:我喜欢动脑子去做事,希望职业生涯中能实现很多目标

懂球帝 浏览 184 09-09

居然智家董事长突然离世,家居行业到底发生了什么?

郭施亮 浏览 731 07-29

90后小伙靠非遗闯入时尚圈,年销超100万,上过21次央视节目

电商在线 浏览 2783 07-17

小黑裙,让人从夏美到秋!

Yuki女人故事 浏览 2512 07-16

圣坛夺冠!刘圣书/谭宁2-1力克马来西亚组合,首夺世锦赛女双冠军

直播吧 浏览 191 09-01

唐国强也没想到,前妻让两个残疾儿子承受恶意

石场阿鑫 浏览 5845 08-10

7月新能源战绩点评 零跑霸榜 蔚小理重新排位

网易汽车 浏览 8700 08-02

坏了,看到剧本杀鼻祖了!

时尚COSMO 浏览 62 11-05
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11