Deepseek-OCR

版主: hci

头像
hci(海螺子)楼主
论坛支柱
论坛支柱
帖子互动: 537
帖子: 10413
注册时间: 2022年 7月 22日 15:29

#1 Deepseek-OCR

帖子 hci(海螺子)楼主 »

只有3B的模型,达到了SOTA。小模型才是未来。美帝走错路了。

DS-OCR不光是个OCR模型,还是DS开始搞通用多模态信息处理的开端。据某些大佬评论,有一定理论突破,因为做到了根据上下文的高度信息压缩;用视觉通道来实现文本信息压缩,算是一个新思路。

文章:

https://github.com/deepseek-ai/DeepSeek ... _paper.pdf

x2 图片 x3 图片
上次由 hci 在 2025年 10月 21日 11:40 修改。
原因: 未提供修改原因

标签/Tags:
wass
论坛精英
论坛精英
2024年度优秀版主
wass 的博客
帖子互动: 785
帖子: 7801
注册时间: 2022年 7月 23日 22:13

#2 Re: Deepseek-OCR

帖子 wass »

hci 写了: 2025年 10月 21日 11:27

只有3B的模型,达到了SOTA。小模型才是未来。美帝走错路了。

DS-OCR不光是个OCR模型,还是DS开始搞通用多模态信息处理的开端。据某些大佬评论,有一定理论突破,因为做到了根据上下文的高度信息压缩;用视觉通道来实现文本信息压缩,算是一个新思路。

文章:

https://github.com/deepseek-ai/DeepSeek ... _paper.pdf

你怎么知道美国不搞小模型?

专用小模型也是美国开始的

wass
论坛精英
论坛精英
2024年度优秀版主
wass 的博客
帖子互动: 785
帖子: 7801
注册时间: 2022年 7月 23日 22:13

#3 Re: Deepseek-OCR

帖子 wass »

美国现在唯一能做的是关闭互联网,50年后见分晓

美国比中国早半年、一年没有意义

wass
论坛精英
论坛精英
2024年度优秀版主
wass 的博客
帖子互动: 785
帖子: 7801
注册时间: 2022年 7月 23日 22:13

#4 Re: Deepseek-OCR

帖子 wass »

互联网,开源,技术报告,都是八旗子弟的玩具

magagop
著名点评
著名点评
帖子互动: 244
帖子: 3499
注册时间: 2024年 12月 5日 17:35

#5 Re: Deepseek-OCR

帖子 magagop »

hci 写了: 2025年 10月 21日 11:27

只有3B的模型,达到了SOTA。小模型才是未来。美帝走错路了。

DS-OCR不光是个OCR模型,还是DS开始搞通用多模态信息处理的开端。据某些大佬评论,有一定理论突破,因为做到了根据上下文的高度信息压缩;用视觉通道来实现文本信息压缩,算是一个新思路。

文章:

https://github.com/deepseek-ai/DeepSeek ... _paper.pdf

微軟也有小模型。

wass
论坛精英
论坛精英
2024年度优秀版主
wass 的博客
帖子互动: 785
帖子: 7801
注册时间: 2022年 7月 23日 22:13

#6 Re: Deepseek-OCR

帖子 wass »

Meta只有开除Lecun,才有可能开发ai

头像
fanqie
论坛元老
论坛元老
帖子互动: 1207
帖子: 17138
注册时间: 2023年 2月 22日 13:23

#7 Re: Deepseek-OCR

帖子 fanqie »

按照现在标准,这是能拿诺贝尔奖的成果

头像
hci(海螺子)楼主
论坛支柱
论坛支柱
帖子互动: 537
帖子: 10413
注册时间: 2022年 7月 22日 15:29

#8 Re: Deepseek-OCR

帖子 hci(海螺子)楼主 »

我估计DS的下一个大的发布版本会用同样技术,如果出来一个SOTA的多模态模型,只有30 B,美帝AI就完了,股市要腰斩。

hci 写了: 2025年 10月 21日 11:27

只有3B的模型,达到了SOTA。小模型才是未来。美帝走错路了。

DS-OCR不光是个OCR模型,还是DS开始搞通用多模态信息处理的开端。据某些大佬评论,有一定理论突破,因为做到了根据上下文的高度信息压缩;用视觉通道来实现文本信息压缩,算是一个新思路。

文章:

https://github.com/deepseek-ai/DeepSeek ... _paper.pdf

头像
hci(海螺子)楼主
论坛支柱
论坛支柱
帖子互动: 537
帖子: 10413
注册时间: 2022年 7月 22日 15:29

#9 Re: Deepseek-OCR

帖子 hci(海螺子)楼主 »

小模型不创新有卵用。

ds这个模型可怕之处在于新思路。

参数量降一个数量级,效果一样的话,就是大地震。

wass 写了: 2025年 10月 21日 13:38

你怎么知道美国不搞小模型?

专用小模型也是美国开始的

x1 图片 x2 图片
上次由 hci 在 2025年 10月 21日 22:15 修改。
原因: 未提供修改原因
pplar
论坛点评
论坛点评
帖子互动: 387
帖子: 2424
注册时间: 2023年 6月 18日 12:43

#10 Re: Deepseek-OCR

帖子 pplar »

大模型小模型两条腿走路挺好

fantasist
见习点评
见习点评
帖子互动: 259
帖子: 1832
注册时间: 2022年 7月 24日 19:52

#11 Re: Deepseek-OCR

帖子 fantasist »

wass 写了: 2025年 10月 21日 13:40

美国现在唯一能做的是关闭互联网,50年后见分晓

美国比中国早半年、一年没有意义

DS-OCR这波可能把gemini的long context优化秘密给直接揭开了。美帝现在挺难受,御三家吭哧提高上限,费时费力,然后墙国两家开源模型动不动免费放出只落后半年到一年的。白嫖党是最爽的,只需要付一点算力钱自己推理就行,不需要分摊研发成本。
归功于墙国的刷题机制,现在美帝与墙国的AI公司人力成本差10倍(其实各行各业都这个成本差距)。御三家需要能长期证明其正版API和和其配套的企业级服务相对于开源模型的溢价,搞的美帝从御三家扩展到其它AI公司再扩展到整个相关IT行业越来越被迫通过全面996来压低人力成本,作为从业者感觉还是挺烦躁的。

x3 图片 x4 图片
toraasakusa
正式写手
正式写手
帖子互动: 14
帖子: 140
注册时间: 2025年 4月 28日 18:12

#12 Re: Deepseek-OCR

帖子 toraasakusa »

美帝早就走小模型了,你是多久不涉及AI

hci 写了: 2025年 10月 21日 11:27

只有3B的模型,达到了SOTA。小模型才是未来。美帝走错路了。

DS-OCR不光是个OCR模型,还是DS开始搞通用多模态信息处理的开端。据某些大佬评论,有一定理论突破,因为做到了根据上下文的高度信息压缩;用视觉通道来实现文本信息压缩,算是一个新思路。

文章:

https://github.com/deepseek-ai/DeepSeek ... _paper.pdf

☆ 发自新买提 Android 25.09.28

fantasist
见习点评
见习点评
帖子互动: 259
帖子: 1832
注册时间: 2022年 7月 24日 19:52

#13 Re: Deepseek-OCR

帖子 fantasist »

toraasakusa 写了: 2025年 10月 22日 01:56

美帝早就走小模型了,你是多久不涉及AI

☆ 发自新买提 Android 25.09.28

别期待太高了,这个论坛上基本全是从来没训过LLM的。从用户体验角度讨论还可以,但碰到真正的技术话题,比如ds最近几篇paper是真创新还是沿用了类似idea,实战效果如何,就别指望得到验证过的信息了。他们的认知全是不知道传了几手的自媒体noise,还特自信。

wass
论坛精英
论坛精英
2024年度优秀版主
wass 的博客
帖子互动: 785
帖子: 7801
注册时间: 2022年 7月 23日 22:13

#14 Re: Deepseek-OCR

帖子 wass »

fantasist 写了: 2025年 10月 22日 01:32

DS-OCR这波可能把gemini的long context优化秘密给直接揭开了。美帝现在挺难受,御三家吭哧提高上限,费时费力,然后墙国两家开源模型动不动免费放出只落后半年到一年的。白嫖党是最爽的,只需要付一点算力钱自己推理就行,不需要分摊研发成本。
归功于墙国的刷题机制,现在美帝与墙国的AI公司人力成本差10倍(其实各行各业都这个成本差距)。御三家需要能长期证明其正版API和和其配套的企业级服务相对于开源模型的溢价,搞的美帝从御三家扩展到其它AI公司再扩展到整个相关IT行业越来越被迫通过全面996来压低人力成本,作为从业者感觉还是挺烦躁的。

想想几十年前的微软、苹果,公司只做产品,保密工作做得好

现在的ai公司,天天发paper、开源

老蛆
小有名气
小有名气
帖子互动: 6
帖子: 48
注册时间: 2025年 10月 17日 16:25

#15 Re: Deepseek-OCR

帖子 老蛆 »

别人用1/10成本做出跟你们效果差不多的产品。
那除了说你们蠢,真没有别的词了。

fantasist 写了: 2025年 10月 22日 01:32

DS-OCR这波可能把gemini的long context优化秘密给直接揭开了。美帝现在挺难受,御三家吭哧提高上限,费时费力,然后墙国两家开源模型动不动免费放出只落后半年到一年的。白嫖党是最爽的,只需要付一点算力钱自己推理就行,不需要分摊研发成本。
归功于墙国的刷题机制,现在美帝与墙国的AI公司人力成本差10倍(其实各行各业都这个成本差距)。御三家需要能长期证明其正版API和和其配套的企业级服务相对于开源模型的溢价,搞的美帝从御三家扩展到其它AI公司再扩展到整个相关IT行业越来越被迫通过全面996来压低人力成本,作为从业者感觉还是挺烦躁的。

头像
hci(海螺子)楼主
论坛支柱
论坛支柱
帖子互动: 537
帖子: 10413
注册时间: 2022年 7月 22日 15:29

#16 Re: Deepseek-OCR

帖子 hci(海螺子)楼主 »

这些美帝的LLM从业人员很抓狂,可以理解。哈哈。蠢不蠢不知道。抓狂是明显的。

这其实反映了美帝的抓狂。AI的技术路线本身就没有探明,全力押宝到一个路线上,除了是因为抓狂了,还真没法解释。

至于这些从业人员,除了知道自己是来捞一把的那种(这些人干不过国内小年轻没有悬念),别的就是没有眼光的。

老蛆 写了: 2025年 10月 22日 06:42

别人用1/10成本做出跟你们效果差不多的产品。
那除了说你们蠢,真没有别的词了。

上次由 hci 在 2025年 10月 22日 10:30 修改。
原因: 未提供修改原因
wass
论坛精英
论坛精英
2024年度优秀版主
wass 的博客
帖子互动: 785
帖子: 7801
注册时间: 2022年 7月 23日 22:13

#17 Re: Deepseek-OCR

帖子 wass »

hci 写了: 2025年 10月 22日 10:17

这些美帝的LLM从业人员很desperate,可以理解。哈哈。蠢不蠢不知道。desperate是明显的。

是国家傻逼,公司傻逼。人总是贪心的

国家傻逼是加州不允许no compete,外地签no compete的可以去加州

公司天天开源,发paper,参加会议

头像
hci(海螺子)楼主
论坛支柱
论坛支柱
帖子互动: 537
帖子: 10413
注册时间: 2022年 7月 22日 15:29

#18 Re: Deepseek-OCR

帖子 hci(海螺子)楼主 »

“国家傻逼,公司傻逼”,输得心服口服不就行了。

可偏偏要不服,最后要撒泼。

这就是我说大家要做好逃难的准备的原因。别跟着傻逼了。

wass 写了: 2025年 10月 22日 10:30

是国家傻逼,公司傻逼。人总是贪心的

国家傻逼是加州不允许no compete,外地签no compete的可以去加州

公司天天开源,发paper,参加会议

上次由 hci 在 2025年 10月 22日 10:34 修改。
原因: 未提供修改原因
头像
hci(海螺子)楼主
论坛支柱
论坛支柱
帖子互动: 537
帖子: 10413
注册时间: 2022年 7月 22日 15:29

#19 Re: Deepseek-OCR

帖子 hci(海螺子)楼主 »

在技术领导层对技术路线都还没有共识的情况下,举国力量投入其中一个路线,除了“国家傻逼公司傻逼”之外,没有什么更好的解释。

曼哈顿计划的时候,难道有前沿物理学家认为原子弹技术路线是错的么?没有呀。

wass 写了: 2025年 10月 21日 19:00

Meta只有开除Lecun,才有可能开发ai

x1 图片
fantasist
见习点评
见习点评
帖子互动: 259
帖子: 1832
注册时间: 2022年 7月 24日 19:52

#20 Re: Deepseek-OCR

帖子 fantasist »

老蛆 写了: 2025年 10月 22日 06:42

别人用1/10成本做出跟你们效果差不多的产品。
那除了说你们蠢,真没有别的词了。

你是资本阶级?听到人力成本被压到1/10,觉得太棒了,还能再傻逼点?

回复

回到 “葵花宝典(Programming)”