关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2025-10-22 00:00:02109人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

五年十代攻关 浙大成功培育高锌水稻“全能选手”

环球网资讯 浏览 91 10-14

电讯报:西汉姆考虑任命一位短期主帅,接替波特

直播吧 浏览 168 09-22

误将应急舱门当厕所门打开 乘客被判赔偿国航7.7万元

封面新闻 浏览 175 09-08

关系藏不住了?小S二女儿被曝恋情

小梊搞笑解说 浏览 110 10-16

广东佛山26岁女子欲离婚 遭丈夫开车撞击、捅刺致死

澎湃新闻 浏览 275 08-24

覆盖驾驶辅助/座舱/底盘 长安发布天枢智能品牌

网易汽车 浏览 195 09-06

【创·智造】当“汉语桥”遇见世界机器人大会,解锁关于“未来”的全新方式

东南卫视 浏览 3753 08-10

曾经爆火的潘多拉,为什么“卖不动”了?

国是直通车 浏览 272 08-25

滑翔伞玩家被"云吸"至8000米高空 官方调查

央视新闻 浏览 7346 05-28

特朗普提名的美联储理事和主席热门人选布拉德力挺降息,称关税不导致通胀

华尔街见闻官方 浏览 2447 08-13

2026 款长城哈弗猛龙 PHEV 将于 8 月 19 日上市

IT之家 浏览 9802 08-09

奥登:我个人的GOAT是大卫-罗宾逊 等詹姆斯退役后他就将成为GOAT

直播吧 浏览 214 09-11

中美马德里经贸会谈成果公布 专家:向全球发积极信号

环球网资讯 浏览 255 09-16

女护士被同居男友杀害 家属:放弃赔偿希望判男方死刑

纵览新闻 浏览 98 11-01

中美贸易谈判结束中方用10字谈成果 特朗普突然变口气

沧海旅行家 浏览 267 09-17

成龙,李连杰,张卫健都老了,60岁的他却像35岁

跳跳历史 浏览 8238 07-31

【今晚播出】中国电动智能汽车的当下与未来丨两说

第一财经资讯 浏览 4888 07-16

3年半亏损289亿,华侨城A换帅,人均薪酬15.5万元

华美财经 浏览 197 09-22

日本政客鼓吹发展核武 还锅甩给特朗普

澎湃新闻 浏览 287 08-21

郁闷,大神跑路了

越女事务所 浏览 1396 07-18

特斯拉"车顶维权"女车主:四年了 终于赢了特斯拉一次

每日经济新闻 浏览 256 09-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11