关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2025-10-22 00:00:02288人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

影石 Insta360 Go Ultra 运动相机渲染图曝光

IT之家 浏览 6137 07-31

媒体:航母舰载机紧急着陆 英国军队在日本丢人现眼

新民周刊 浏览 571 08-17

"路怒"特斯拉高速路上多次别车还竖中指挑衅 交警:拘

封面新闻 浏览 2444 07-24

一觉醒来,整个世界都在做多中国

米筐投资 浏览 473 08-22

SRM理工学院发布:文本到视频生成技术演进图谱

科技行者 浏览 260 11-09

包贝尔新片上映就爆了!没想到真敢拍!事实证明:它的尺度真不小

娱乐圈笔娱君 浏览 40 05-09

霍思燕晒家中环境,父母双亡丈夫也不在身边!

自娱众乐 浏览 1923 08-13

范戴克:我们不想在主场取得平局,有势头后就应该全力以赴

懂球帝 浏览 308 10-21

贝克汉姆长子在说谎?英国媒体爆料婚纱实情

译言 浏览 223 01-21

高德10天完成扫街榜+团购布局,直指美团核心业务?

深眸财经 浏览 376 09-21

向渠道要效率,理想汽车:将关闭一些能效低的门店,目前还处于评估阶段

时代财经 浏览 207 01-27

杨振宁逝世享年103岁 清华大学沉痛悼念

北京青年报 浏览 231 10-19

追觅造车有新进度,相关3款车亮相CES,首款车还处概念车阶段

红星资本局 浏览 227 01-08

你的基础款,差一双Y3K银色球鞋

时尚COSMO 浏览 6771 08-14

叙利亚过渡政府宣布延长停火15天

上观新闻 浏览 222 01-25

加沙卫生部门:过去24小时以军行动造成至少80人死亡

环球网资讯 浏览 2122 07-08

网友称在按摩时遭51岁技师摸下体猥亵 门店:他才来3天

大风新闻 浏览 254 02-05

“章子怡挨打”背后的她更令人惊心

Yuki女人故事 浏览 8143 06-24

弗兰克:要做到攻守平衡,巴黎是欧洲最佳但热刺希望赢得欧超杯

直播吧 浏览 7946 08-12

多地机票价格显著回落 错峰游受青睐

环球网资讯 浏览 8916 05-31

白宫官员:普京必须与泽连斯基会面 才能与特朗普会晤

央视新闻客户端 浏览 2138 08-08
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11