关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2025-10-22 00:00:02286人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

财经调查丨全靠“吹”!年销量超30万件的“木棉皱皱纱”是纯化纤

央视财经 浏览 310 09-22

11名大学生中元节爬野山被困 联系救援人员还各有主意

极目新闻 浏览 460 09-09

中科院举办出版座谈会,以科学家精神引领科技创新高质量发展

澎湃新闻 浏览 10598 07-26

日本30年期国债拍卖结果出炉 投标倍数为23年以来新低

财联社 浏览 6195 06-06

广东潮州渔民捕到罕见"通天河神兽":重11斤 有脸盆大

极目新闻 浏览 438 09-21

智元机器人发布灵创平台,稚晖君宣布机器人二次开发将“0门槛”

IT之家 浏览 455 08-22

TA:热刺几乎没能给森林造成任何威胁,他们需要减少自身失误

懂球帝 浏览 226 12-15

将于春季正式上市 智界V9内饰谍照曝光

车质网 浏览 204 02-04

宁波84-79逆转江苏取4连胜,杰克逊29+6,庞峥麟25分5板7助

懂球帝 浏览 212 01-02

记者:本周五泰山队代理主帅韩鹏和球员于金永出席赛前发布会

懂球帝 浏览 5438 08-07

男子被马蜂蜇伤后死亡 两养蜂邻居被判连带赔偿近百万

红星新闻 浏览 469 09-08

朱媛媛去世后辛柏青首露正脸,眼神空洞憔悴

胡一舸南游y 浏览 212 10-31

委内瑞拉主帅告别:未能实现晋级世界杯目标,感谢大家的支持

直播吧 浏览 394 09-11

特朗普:已开始从委石油资源中赚钱

环球时报国际 浏览 227 01-09

《不期而遇的生活》大结局:最圈粉的不是程心

潇洒的怂熊 浏览 230 01-08

OPPO K15系列手机规格曝光:6.78英寸直屏、8000mAh电池

IT之家 浏览 33 05-09

希腊航运巨头28岁女继承人死于虫咬 误诊细节披露

新民周刊 浏览 445 09-19

光速下课!官方:滕哈赫不再担任勒沃库森主帅,上任仅62天

直播吧 浏览 363 09-02

杨利伟:外籍航天员将在中国接受全方位训练

IT之家 浏览 6864 07-12

从性丑闻到RWA第一股,Figure的“美国骗局”

虎嗅APP 浏览 9704 08-09

霍家主母显气度:一代卖船供学二代稳大局三代全颜面,四代无人及

不八卦会死星人 浏览 210 01-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11