关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2025-10-22 00:00:02106人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

35+款漂亮包包!百搭好看!挑花眼了!

Yuki女人故事 浏览 6069 07-28

掏10个亿,阿里为啥让高德去“扫街”?

中新经纬 浏览 174 09-10

球衣名记:尼昂在绿军将继续穿20号 上一任主人是刚被裁的戴维森

直播吧 浏览 9948 07-26

官宣!GPT-4核心,挂帅Meta超级智能实验室

网易科技报道 浏览 5360 07-26

泰柬局势"火药味"飙升:泰国出动F-16战机 洪森表态

每日经济新闻 浏览 3423 07-25

利物浦赛季前瞻:卫冕冠军负重前行,斯洛特要打“富裕仗”了

直播吧 浏览 316 08-11

23岁华裔女子在澳洲醉酒开700万豪车出车祸 背景成迷

潇湘晨报 浏览 8400 08-10

女子高铁弄丢价值13.8万的手镯 4天后在坐垫下被找到

极目新闻 浏览 161 09-15

周鸿祎:最近采购的都是华为 H20性价比不高

第一财经资讯 浏览 5295 07-24

酿酒入列历史经典产业,郎酒的“慢功夫”见真章

征探财经 浏览 52 11-06

40岁童瑶与42岁蒋欣:气质对比很明显

大眼妹妹 浏览 55 11-08

世界乒坛现役十大美女,国乒占三,谁是第一美?

南宗历史 浏览 42854 08-28

今年秋天最流行的5款短发,穿什么都时髦!

LinkFashion 浏览 237 08-27

加沙地带8人领取援助物资时遭袭身亡 61人受伤

国际在线 浏览 6253 06-08

张杰院士:三步走,2045建成上海首个聚变商业电站

澎湃新闻 浏览 161 09-22

金钟国资产超5亿,婚前安排超细致,网友劝他对新婚妻子别太抠门

萌神木木 浏览 263 08-19

韩国团体在中国驻韩使馆附近示威时涉辱华 韩警方介入

澎湃新闻 浏览 7229 08-11

有友食品,缺的是财务总监吗?

斑马消费 浏览 156 09-26

今年最好的大银幕电影,没有之一

电影最TOP 浏览 69 10-28

固若金汤!蓉城最近10个主场丢球都不超过1粒,打破队史中超纪录

直播吧 浏览 226 09-01

迈入合资2.0时代,神龙汽车加码第二次创业

网易汽车 浏览 144 09-23
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11