关闭广告

商汤科技发布万字长文:多模态是通往AGI必经之路

网易科技报道2025-08-13 12:00:017675人阅读

本文信息:作者为科技联合创始人、执行董事、首席科学家林达华,题目为《迈向多通用智能:商汤的思考》。以下为正文:

AI 是一场长跑。从大语言模型(LLM)的兴起到真正意义的通用人工智能(AGI),还有很多开放性的问题有待解决。我们认为,多模态是从 LLM 到 AGI 的必经之路。

围绕多模态,从智能演进、学习范式、数据和模型架构都面临诸多挑战,也有很大的创新空间;在组织和战略层面也有很多值得思考的问题。在本文中,我先整体回顾一下商汤的多模态之路,然后就其中的关键问题谈一下我们的思考。

1、商汤多模态之路概览

商汤是从计算机视觉技术出发,在人工智能变革浪潮中发展起来的企业。在发展之初,商汤基于深度学习在视觉领域的运用,在人脸识别、画质处理、智能驾驶等多个应用方向突破了工业红线,推动了 AI 技术在行业的落地应用。

早在2019年,商汤就基于自身的技术判断,开始在视觉模型上进行尺度定律的探索,在业内率先推出百亿参数的视觉大模型,在视觉识别上突破了多项性能纪录。这一前瞻性的技术观察,也是推动商汤较早就进行大规模 AI 算力投入的重要原因。

2022年底,OpenAI 推出 ChatGPT,掀起了全球范围的大模型浪潮,AI 进入了2.0时代。对于商汤来说,这是一次重要的机遇。我们当时开始思考,当视觉模型和语言模型在尺度定律上相会,会给我们带来什么?

在2023年3月,商汤和上海人工智能实验室合作研发,推出了我国首个多模态通用大模型“书生2.5” 并开源。这个30亿参数的大模型刷新了包括 ImageNet 和 COCO 在内的多个视觉任务的纪录,并且初步展示了通用图文问答能力。在6个月之后,Open

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

一箭11星 吉利星座05组卫星成功发射

极目新闻 浏览 196 09-09

就业网站Indeed数据:美国10月职位空缺跌至2021年2月以来最低

华尔街见闻官方 浏览 62 11-05

提升气质?试试这两招儿

Yuki女人故事 浏览 8169 08-05

从业者谈乘龙被理想i8撞"断头":从业多年从未见过

封面新闻 浏览 7364 08-05

命运多舛的英伦跑车:解读Marcos Mantis历史

老爷车 浏览 24 12-05

大本营失守?特斯拉在美国市场份额跌至八年最低

选车侦探 浏览 220 09-10

具俊晔深情人设翻车!年轻时抛弃大S,人不在了守着墓地毫无意义

萌神木木 浏览 5963 07-29

德约科维奇,我错怪你了!

网球之家 浏览 1937 07-13

吉利银河A7 EM-i 馈电油耗2L级 续航2100km+

懂车之道 浏览 293 06-09

深度揭秘OpenAI如何让GPT-5「技术性」超越Claude:悄悄跳过最难的23道题

新智元 浏览 272 08-20

印度航空近期将减少宽体客机执飞国际航班

新华社 浏览 2887 06-20

徽商银行再次大幅扩员、人均年薪35.84万,董监高整体降薪12%

湘财Plus 浏览 8784 07-14

朱迅:为缅怀母亲,演唱歌曲《蓝天上的云》

晓今娱 浏览 1194 08-11

打假博主被店主持30厘米长的斩骨刀追砍 后者被拘5日

潇湘晨报 浏览 28 12-11

长安汽车、东安动力等多家兵装系上市公司:间接控股股东变更为中国长安汽车

红星资本局 浏览 9328 07-30

星巴克王牌品类茶拿铁系列焕新升级,真茶真奶 真茶拿铁

财经无忌 浏览 254 08-19

身材要练壮壮的,手袋要买大大的

时尚COSMO 浏览 1290 08-09

每体:拉什福德18岁时就年少成名,被很多巴萨年轻球员视为偶像

直播吧 浏览 2849 08-07

景顺长城换帅:“华能系”叶才接棒董事长,6000亿公募迎第七任掌舵人

时代周报 浏览 10238 08-07

唇疱疹和口腔溃疡是"同伙"吗?

网易健康 浏览 1264 04-18

和聚投资安永平:聚焦产业链,深挖成长股 | 打卡100家小而美私募

私募排排网 浏览 7522 07-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11