关闭广告

商汤科技发布万字长文:多模态是通往AGI必经之路

网易科技报道2025-08-13 12:00:017621人阅读

本文信息:作者为科技联合创始人、执行董事、首席科学家林达华,题目为《迈向多通用智能:商汤的思考》。以下为正文:

AI 是一场长跑。从大语言模型(LLM)的兴起到真正意义的通用人工智能(AGI),还有很多开放性的问题有待解决。我们认为,多模态是从 LLM 到 AGI 的必经之路。

围绕多模态,从智能演进、学习范式、数据和模型架构都面临诸多挑战,也有很大的创新空间;在组织和战略层面也有很多值得思考的问题。在本文中,我先整体回顾一下商汤的多模态之路,然后就其中的关键问题谈一下我们的思考。

1、商汤多模态之路概览

商汤是从计算机视觉技术出发,在人工智能变革浪潮中发展起来的企业。在发展之初,商汤基于深度学习在视觉领域的运用,在人脸识别、画质处理、智能驾驶等多个应用方向突破了工业红线,推动了 AI 技术在行业的落地应用。

早在2019年,商汤就基于自身的技术判断,开始在视觉模型上进行尺度定律的探索,在业内率先推出百亿参数的视觉大模型,在视觉识别上突破了多项性能纪录。这一前瞻性的技术观察,也是推动商汤较早就进行大规模 AI 算力投入的重要原因。

2022年底,OpenAI 推出 ChatGPT,掀起了全球范围的大模型浪潮,AI 进入了2.0时代。对于商汤来说,这是一次重要的机遇。我们当时开始思考,当视觉模型和语言模型在尺度定律上相会,会给我们带来什么?

在2023年3月,商汤和上海人工智能实验室合作研发,推出了我国首个多模态通用大模型“书生2.5” 并开源。这个30亿参数的大模型刷新了包括 ImageNet 和 COCO 在内的多个视觉任务的纪录,并且初步展示了通用图文问答能力。在6个月之后,Open

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

天猫被曝入局共享充电赛道,测试两轮车/汽车充电业务“喵充电”

IT之家 浏览 212 08-22

贵州茅台酒五星商标70周年款将上架 每瓶或定价7000元

界面新闻 浏览 1422 08-06

演唱会看出张杰夫妇相处方式,并非谢娜“矫情”

清游说娱 浏览 2261 07-31

申花保住中超颜面!跃居东亚第5,打破首尔不败纪录,连破2魔咒

奥拜尔 浏览 26 10-23

经济上行期是什么样子的?

智谷趋势 浏览 1350 07-26

苹果美股涨近4%

证券时报 浏览 3767 08-07

今年秋天最时髦的穿法:夹克+裙子,时髦又松弛!

LinkFashion 浏览 100 10-01

E句话 | 她这算内涵吗?

仙女事件簿 浏览 193 08-21

中日关系新篇:合作与挑战并存

浏览 8890 07-14

离婚4年佟丽娅又官宣喜讯,陈思诚已高攀不起

窥史 浏览 9520 07-31

环球:在澳中国人屡遭暴力 恐怕不能用"巧合"一言蔽之

环球网资讯 浏览 3433 08-12

玫瑰空调被嫌“土”,董明珠回应:“你不喜欢有人喜欢”

红星资本局 浏览 805 08-09

16分钟拿12+4+3+0失误!杨舒予三战33分势头正盛 成李梦接班人

颜小白的篮球梦 浏览 4353 07-17

18岁甘肃小伙称在广东打工 家人查其账号IP地址在缅甸

红星新闻 浏览 4212 07-28

光伏反内卷下的降本之道:去银化提速,聚和材料进展领先,铜浆有望显著提升盈利水平

时代周报 浏览 141 09-10

燃油车天要塌了!国产固态电池宣布量产,充电6分钟跑1000km

小李车评李建红 浏览 205 06-14

21独家|周文龙拟出任海尔消金总经理,曾在中原消金供职10年

21金融圈 浏览 8784 07-31

穆尼奥斯:会以最好表现回报深圳球迷,让对手难以在我们主场取胜

直播吧 浏览 2020 08-06

男生带妈妈跨越700公里参加毕业典礼:想有妈妈参与

极目新闻 浏览 5952 06-24

新增车道级导航与全向记录仪 腾势N9迎重磅OTA升级

网易汽车 浏览 43 10-16

专家:多名前"正国级"被处分 越南新一届领导人敲山震虎

上观新闻 浏览 8023 07-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11