关闭广告

商汤科技发布万字长文:多模态是通往AGI必经之路

网易科技报道2025-08-13 12:00:017856人阅读

本文信息:作者为科技联合创始人、执行董事、首席科学家林达华,题目为《迈向多通用智能:商汤的思考》。以下为正文:

AI 是一场长跑。从大语言模型(LLM)的兴起到真正意义的通用人工智能(AGI),还有很多开放性的问题有待解决。我们认为,多模态是从 LLM 到 AGI 的必经之路。

围绕多模态,从智能演进、学习范式、数据和模型架构都面临诸多挑战,也有很大的创新空间;在组织和战略层面也有很多值得思考的问题。在本文中,我先整体回顾一下商汤的多模态之路,然后就其中的关键问题谈一下我们的思考。

1、商汤多模态之路概览

商汤是从计算机视觉技术出发,在人工智能变革浪潮中发展起来的企业。在发展之初,商汤基于深度学习在视觉领域的运用,在人脸识别、画质处理、智能驾驶等多个应用方向突破了工业红线,推动了 AI 技术在行业的落地应用。

早在2019年,商汤就基于自身的技术判断,开始在视觉模型上进行尺度定律的探索,在业内率先推出百亿参数的视觉大模型,在视觉识别上突破了多项性能纪录。这一前瞻性的技术观察,也是推动商汤较早就进行大规模 AI 算力投入的重要原因。

2022年底,OpenAI 推出 ChatGPT,掀起了全球范围的大模型浪潮,AI 进入了2.0时代。对于商汤来说,这是一次重要的机遇。我们当时开始思考,当视觉模型和语言模型在尺度定律上相会,会给我们带来什么?

在2023年3月,商汤和上海人工智能实验室合作研发,推出了我国首个多模态通用大模型“书生2.5” 并开源。这个30亿参数的大模型刷新了包括 ImageNet 和 COCO 在内的多个视觉任务的纪录,并且初步展示了通用图文问答能力。在6个月之后,Open

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

佘诗曼《新闻女王2》首波口碑出炉了!现场观众的评价一针见血

娱乐圈笔娱君 浏览 236 11-06

高市早苗成功"策反"对手 分析称其当选首相几乎成定局

红星新闻 浏览 292 10-20

读懂IPO|实控人及高管拿分红买理财,世昌股份近亿元利润无现金支撑,靠票据贴现实现回款

时代周报 浏览 378 09-10

郭碧婷自曝和向佐两地分居,靠孩子联络感情,婆婆向太给钱大手笔

萌神木木 浏览 225 12-11

明明一脸褶子浑身赘肉,45岁硬演 “少年洪七公”,内娱没人了么

娱乐圈笔娱君 浏览 1126 08-06

制造商主动揭开骗局 港府饮用水供应商冒用品牌被拘捕

南方都市报 浏览 448 08-21

广汽丰田双向突围,是疯了吗?

汽车K线 浏览 200 12-02

千问宣布投30亿元“发红包”,大厂竞逐春节档,腾讯元宝App一度崩溃

红星资本局 浏览 229 02-03

纯电续航给到200km 2026款猛龙限时售15.38万起

网易汽车 浏览 451 08-20

翟相栋或将离任,9000亿招商基金,难解转型焦虑?

侃见财经 浏览 2959 07-30

外媒:克宫称普京愿与马克龙就俄乌冲突对话

环球网资讯 浏览 217 12-22

背上「大电池」,增程、插混要抢纯电的饭碗?

豹变 浏览 404 09-10

基本半导体递交赴港IPO申请

证券时报 浏览 246 12-05

苹果公开反对,欧盟委员会强硬回应

第一财经资讯 浏览 353 09-26

同心杯-刘李22+11 杨曦皓15+10+5 福建浔兴58分大胜澳门昊骏

直播吧 浏览 3652 07-31

43岁蔡卓妍官宣再婚!明星好友纷纷祝福

萌神木木 浏览 66 04-29

推广|| 被低估的百元级国货!推荐你们趁好价试试

黎贝卡的异想世界 浏览 341 09-20

法国宣布正式承认巴勒斯坦国

央视新闻客户端 浏览 343 09-24

三星 Galaxy Buds 4/Pro 旗舰耳机首现踪迹,有望 2026 年初发布

IT之家 浏览 342 09-20

车企研发:小米车门锁在某些看不见的地方省去了成本

第一财经 浏览 304 10-16

助贷新规落地调查:单利最低达7.56%

时代周报 浏览 317 10-19
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11