关闭广告

大规模强化学习框架RLinf!清华、北京中关村学院、无问芯穹等开源

机器之心Pro2025-09-01 12:00:01418人阅读

机器之心报道

机器之心编辑部

清华大学、北京中关村学院、无问芯穹联合北大、伯克利等机构重磅开源RLinf:首个面向具身智能的“渲训推一体化”大规模强化学习框架。



人工智能正在经历从 “感知” 到 “行动” 的跨越式发展,融合大模型的具身智能被认为是人工智能的下一发展阶段,成为学术界与工业界共同关注的话题。

在大模型领域,随着 o1/R1 系列推理模型的发布,模型训练的重心逐渐从数据驱动的预训练 / 后训练转向奖励驱动的强化学习(Reinforcement Learning, RL)。OpenAI 预测强化学习所需要的算力甚至将超过预训练。与此同时,能够将大规模算力高效利用的 RL infra 的重要性也日益凸显,近期也涌现出一批优秀的框架,极大地促进了该领域的发展。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

重回“ABB”,一汽奥迪逆势突破背后的“价值竞争”

桑之未 浏览 203 01-28

上海校园餐背后的供应商,越挖越让人心惊!

功夫财经 浏览 395 09-22

卖房炒股后,韩国股市快翻倍了

大猫财经Pro 浏览 230 01-09

英媒:面对美国 欧洲领导人"必须学会反击"

环球网资讯 浏览 212 12-11

售14.98万起 2026款海豹07DM-i正式上市

网易汽车 浏览 375 09-17

美将暂停实施对华海事等301调查措施一年

财联社 浏览 290 10-31

浙江女子开水果店亏钱"像在守活寡" 网友吵翻了

FM93浙江交通之声 浏览 357 09-18

居然智家开盘跌停 传公司实控人汪林朋跳楼

网易财经 浏览 1176 07-28

天啊!看到林志玲和小13岁刘亦菲同框,才懂王晶为啥说她很一般了

温柔娱公子 浏览 169 11-12

足协官宣 45岁邵佳一出任国足新主帅

央视新闻客户端 浏览 235 11-06

亏损超1.4亿?《浪浪人生》票房崩塌

靠谱电影君 浏览 312 10-01

宋丹丹冠“宋”姓俩孙子,如今竟开始为她争光啦

智凌纵横 浏览 2629 08-04

VLA司机大模型赋能,理想纯电i8正式上市

上游新闻 浏览 831 07-30

一家4口爬山妻子坠亡 警方排除他杀可能:属于高空坠亡

极目新闻 浏览 191 03-03

国庆档电影第一波口碑出炉!七部新片各有槽点

萌神木木 浏览 329 10-02

24岁学生9字回应酷似大S 侧面捅破具俊晔龌龊心思

小丸子的娱乐圈 浏览 5528 08-05

获皮奥利称赞!小法回应:很感谢他,去年曾联系他并聊了两个小时

直播吧 浏览 364 09-22

韩国特使离开北京 中方提出一个要求李在明口风变了

梁讯 浏览 524 08-29

7.98万起/星栈平台亮相 上汽大通星际皮卡三车上市

网易汽车 浏览 6778 08-08

还是别买了,这个超火的单品连郑秀晶钟小姐穿上也不种草

黎贝卡的异想世界 浏览 7284 07-31

阿里AI To C官宣启动大规模招聘:涉夸克、通义、AI眼镜等

网易科技报道 浏览 1543 08-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11