关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2025-10-22 00:00:0229人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

GE医疗被传出售中国业务:中国区业绩承压,国产厂商崛起外资巨头守擂台

时代周报 浏览 107 09-21

今年秋天最美的4件针织,怎么搭都好看!

LinkFashion 浏览 205 08-24

车主称50升油箱被加了67.96升汽油 涉事加油站未回应

澎湃新闻 浏览 664 08-20

罗大美家属哭诉:儿子努力改变家庭命运 可惜好景不长

潇湘晨报 浏览 2372 07-30

人工智能城市竞赛,“万亿俱乐部”跑得最快:20城出台政策,拼算力拼场景

时代周报 浏览 161 09-09

丰田探索车载无人机系统:车辆通过复杂路况之前能帮你“探路”

IT之家 浏览 38 10-11

留得下、住得稳、有发展,淘宝闪购饿了么“城市骑士之家”创新骑士权益保障

上观新闻 浏览 111 09-20

美媒:梅西可能免受禁赛处罚,因他赛程繁重&未入全明星最终名单

直播吧 浏览 3910 07-24

为什么出海企业,都该学丹纳赫?

霞光社 浏览 223 08-22

刷单炒信?警惕流量驱动下的数字陷阱

环球网资讯 浏览 2079 07-13

日本首相之位将会花落谁家?

首席商业评论 浏览 116 09-21

阮经天:交往了16年,她没有背弃过我。

桑葚爱动画 浏览 37 10-20

市场变化越快,华润啤酒越稳

斑马消费 浏览 207 08-20

美财长:两三个月内将再与中方会面

澎湃新闻 浏览 6346 08-14

73岁普京每天健身1.5小时 曾误伤自己致额头擦伤

大象新闻 浏览 7109 05-06

萨尔瓦多:我们临门一脚始终欠缺感觉,联赛还剩十轮依然拥有决心

直播吧 浏览 9105 08-10

叶珂复播 自曝产女后与黄晓明彻底分手

陈意小可爱 浏览 5327 07-23

乌克兰称不需要中国提供安全保障 中方回应

澎湃新闻 浏览 216 08-23

“最后期限”前现转机,特朗普据称拟最早下周和普京会面,然后见泽连斯基

华尔街见闻官方 浏览 10164 08-07

图卢兹vs梅斯:雷斯特、西迪贝首发,巴洛-图雷、哈比卜-迪亚洛出战

懂球帝 浏览 26 10-20

生猪产业新生态:结构调整与种养结合,筑牢农业强国根基

一点财经 浏览 7425 07-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11