关闭广告

商汤科技发布万字长文:多模态是通往AGI必经之路

网易科技报道2025-08-13 12:00:017881人阅读

本文信息:作者为科技联合创始人、执行董事、首席科学家林达华,题目为《迈向多通用智能:商汤的思考》。以下为正文:

AI 是一场长跑。从大语言模型(LLM)的兴起到真正意义的通用人工智能(AGI),还有很多开放性的问题有待解决。我们认为,多模态是从 LLM 到 AGI 的必经之路。

围绕多模态,从智能演进、学习范式、数据和模型架构都面临诸多挑战,也有很大的创新空间;在组织和战略层面也有很多值得思考的问题。在本文中,我先整体回顾一下商汤的多模态之路,然后就其中的关键问题谈一下我们的思考。

1、商汤多模态之路概览

商汤是从计算机视觉技术出发,在人工智能变革浪潮中发展起来的企业。在发展之初,商汤基于深度学习在视觉领域的运用,在人脸识别、画质处理、智能驾驶等多个应用方向突破了工业红线,推动了 AI 技术在行业的落地应用。

早在2019年,商汤就基于自身的技术判断,开始在视觉模型上进行尺度定律的探索,在业内率先推出百亿参数的视觉大模型,在视觉识别上突破了多项性能纪录。这一前瞻性的技术观察,也是推动商汤较早就进行大规模 AI 算力投入的重要原因。

2022年底,OpenAI 推出 ChatGPT,掀起了全球范围的大模型浪潮,AI 进入了2.0时代。对于商汤来说,这是一次重要的机遇。我们当时开始思考,当视觉模型和语言模型在尺度定律上相会,会给我们带来什么?

在2023年3月,商汤和上海人工智能实验室合作研发,推出了我国首个多模态通用大模型“书生2.5” 并开源。这个30亿参数的大模型刷新了包括 ImageNet 和 COCO 在内的多个视觉任务的纪录,并且初步展示了通用图文问答能力。在6个月之后,Open

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

几千元一台的AI学习机,谁在掘金谁在买?

中新经纬 浏览 514 09-09

速览!假期这些大事影响节后市场

Wind万得 浏览 201 02-24

张慧贤指责万鹏“当小三当惯了”万鹏方严正声明

韩小娱 浏览 332 10-18

我国电动船舶锂电池安全防控技术实现新突破

新华社 浏览 258 01-02

冯绍峰与新女友又被拍了!​女方撞脸马筱梅,还疑似被前任内涵

萌神木木 浏览 993 08-05

黎巴嫩总统谴责以军空袭贝鲁特

上观新闻 浏览 267 11-24

《逐玉》出圈理由:刘琳的演技,张凌赫的脸

娱乐圈笔娱君 浏览 199 03-11

中佛罗里达大学破解仿真优化难题:让计算机在噪声中找到最优解

科技行者 浏览 260 01-05

在黄浦江畔唯一内陆岛,小红书RED LAND迎来首批玩家

文汇报 浏览 2515 08-09

吴易昺遭逆转不敌斯库尔凯特,止步ATP250洛斯卡沃斯站首轮

直播吧 浏览 3958 07-16

一管血造出会跳的心脏?

网易健康 浏览 457 09-29

马特乌斯预测德甲排名:拜仁夺冠,多特次席,法兰克福第三

懂球帝 浏览 570 08-23

宗馥莉陷资产纠纷被起诉 三名原告自称是同父异母弟妹

环球时报 浏览 9615 07-14

巴西28分出线,世预赛南美区改制后球队最差成绩

懂球帝 浏览 423 09-10

这事不怪杨幂,可也恰恰证明:一些更糟糕的事,正在演艺圈发生

娱乐圈笔娱君 浏览 465 08-22

纪念抗战胜利80周年大会第一次综合演练圆满结束

新华社 浏览 23594 08-11

2025凉鞋爆款Top10!第1双明星同款,第3双巨显腿长!

Yuki女人故事 浏览 1784 07-11

全运科技盛宴11月7日天河启幕

环球网资讯 浏览 325 11-05

百年同仁堂,怎么成了中药界的“南极人”?

花朵财经 浏览 189 12-23

印度制造商:只有与中国和解 才能拿到稀土

澎湃新闻 浏览 6081 07-13

一箱油跑1000km 长安逸动限时7.29万起

网易汽车 浏览 388 09-08
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11