关闭广告

全新合成框架SOTA:强化学习当引擎,任务合成当燃料

量子位2025-10-02 00:00:0274人阅读

AntResearchNLP团队 投稿
量子位 | 公众号 QbitAI

下一步,大模型应该押注什么方向?

蚂蚁通用人工智能中心自然语言组联合香港大学自然语言组(后简称“团队”)推出PromptCoT 2.0,要在大模型下半场押注任务合成



实验表明,通过“强起点、强反馈”的自博弈式训练,PromptCoT 2.0可以让30B-A3B模型在一系列数学代码推理任务上实现新的SOTA结果,达到和DeepSeek-R1-0528, OpenAI o3, Gemini 2.5 Pro等相当的表现。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

男童在苍山遇难 家属:当天改变登山路线 定位器失灵

中国新闻周刊 浏览 10861 08-21

泰方部署6架F16摧毁柬方2处军事设施 洪马奈下令

掌青说历史 浏览 5193 07-25

盛名之下无虚士?毛京波将接掌莲花英国及全球业务

道哥说车 浏览 240 08-11

记者:沙特升班马尼奥姆2000万报价南特后卫泽泽,黄潜报价2200万

直播吧 浏览 8868 07-26

在创业的夏天,遇见未来!WAIC Future Tech邀你共赴AI创投盛宴

观察者网 浏览 9923 07-24

新质生产力“可感可及”,华强北机器人展演月“硬核度”爆表

南方都市报 浏览 91 09-29

WTT澳门冠军赛:卫冕冠军林诗栋3-0战胜高承睿,晋级16强

懂球帝 浏览 136 09-10

郑晓龙《红楼梦》选角又现神操作!81岁曹翠芬演贾母

小邵说剧 浏览 127 09-11

景区300元1天招10名兼职"野人":2000多名大学生报名

极目新闻 浏览 9236 08-07

“TVB第一美人”背后,她到底赢在了哪?

Yuki女人故事 浏览 124 09-07

乔-科尔:波特根本就没得到足够的支持,西汉姆对他有所怀疑

懂球帝 浏览 80 09-29

百色"锅底"村庄积水不退 村民:明年不想再种地 白费劲

澎湃新闻 浏览 21 10-24

【央行重磅出手】5000亿资金落地!中信银行、兴业银行、民生银行等六大商业银行企业融资黄金窗口开启

闺蜜财经 浏览 183 09-02

强化性能 本田Prelude Type R假想图曝光

车质网 浏览 7077 07-21

双十一特惠5折,双厨狂喜:智本社X财新

智本社 浏览 19 10-27

欢迎回家!首架自伊朗撤离中国公民临时航班顺畅通关

极目新闻 浏览 4884 06-22

广东一学校收班费 家长质疑:每人收200 一学期花1万吗

极目新闻 浏览 185 09-15

图生视频新玩法刷爆外网:图上画两笔就能动起来,告别文本提示

机器之心Pro 浏览 192 08-19

1.77亿患者,等待一款痛风药

虎嗅APP 浏览 471 07-15

张国荣跳楼前1小时究竟发生了什么?

阿废冷眼观察所 浏览 142 09-09

这些地铁,在花式搞钱

花朵财经 浏览 239 08-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11