分页: 1 / 3

#1 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 03:07
wanmeishijie


#2 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 03:35
fanqie

放话这里,比R1的影响力还大


#3 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 03:41
xiaozhao

确实牛b, 这个模型的论文,揭露一个结论, 文本可能不是llm的最好输入, 图片和视频才是。 而图片和视频可以压缩很小,所以给一个图片的txt,运算量小很多。


#4 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 03:58
foofy

图片


#5 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 04:11
xiaoju

叔去年就这么说

但是你弟业界折腾一年,除了烧器材的砸钱的,一个实质性成就也没有

xiaozhao 写了: 昨天 03:41

确实牛b, 这个模型的论文,揭露一个结论, 文本可能不是llm的最好输入, 图片和视频才是。 而图片和视频可以压缩很小,所以给一个图片的txt,运算量小很多。


#6 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 04:12
wanmeishijie
xiaozhao 写了: 昨天 03:41

确实牛b, 这个模型的论文,揭露一个结论, 文本可能不是llm的最好输入, 图片和视频才是。 而图片和视频可以压缩很小,所以给一个图片的txt,运算量小很多。

直观上文本必须tokenize再向量化。这个空间维度不低。
而图片如果是16色很有限


#7 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 04:33
sgisp2

兔子家缺算力,所以能搞出无穷的优质高效算法,又把老米甩得远远滴


#8 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 04:46
redot

注意力权重,是人的本能之一
如对号码的记忆,是恨明显的例子


#9 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 04:50
老蛆

文本为什么需要16色?lgbt专用文本? :lol: :lol: :lol: :lol:

wanmeishijie 写了: 昨天 04:12

直观上文本必须tokenize再向量化。这个空间维度不低。
而图片如果是16色很有限


#10 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 05:05
coltzhao

这个按发表的数字是很牛的,而且很新,以前没人走过的路。


#11 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 05:20
zheliemit

现在开源大模型都被你憋包揽了前三名:智谱、QWen、Deepseek


#12 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 05:54
民主自由是婊子的遮羞布
sgisp2 写了: 昨天 04:33

兔子家缺算力,所以能搞出无穷的优质高效算法,又把老米甩得远远滴

麻痹的,兔子太猛

就像兔子家的发动机不行

就在气动外形和模型上下功夫

最后搞出极致的气动模型


#13 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 06:22
xiaoju

缺算力是个伪命题,你只要有钱token要多少有多少

你弟的本质问题是明明没钱,却装成大款无限烧钱,所以研发停滞不前

sgisp2 写了: 昨天 04:33

兔子家缺算力,所以能搞出无穷的优质高效算法,又把老米甩得远远滴


#14 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 06:24
xiaoju

deepseek-ocr的玩法是把重复信息忽略掉,比如100页稿纸,后面的只看内容不看格式,节省大量token

人也是这么阅读的

wanmeishijie 写了: 昨天 04:12

直观上文本必须tokenize再向量化。这个空间维度不低。
而图片如果是16色很有限


#15 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 07:51
sgisp2

应该是图像好记一些


#16 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 07:59
xiaoju

我觉得本质上deekseek-ocr还是一个tokenizer

不过因为其基于现代LLM,而不是古典的BPE算法,所以可以更高效的降噪,只提取有用信息

sgisp2 写了: 昨天 07:51

应该是图像好记一些


#17 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 08:00
Newsmax

梁某人又要闯荡股市了?


#18 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 08:04
Narcotics07

Photographic memory, 不是雨人类自闭症有的嘛

这类人在米国被当特殊人(aka 傻子)


#19 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 08:12
windy

看了下,显然是Deepseek在模型的能力上拼不过,改打这种小trick来抓眼球。这种东西有用吗?有。但是用处不大。类似的东西,包括多态模型,现在研究的多了。产品也多如牛毛。几个主打的大语言模型(其实这些都早不仅仅是“语言”模型了)都支持多模态输入。DS作为产品的卖点可以理解,从创新角度上真没啥好吹的


#20 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!

发表于 : 2025年 10月 21日 08:20
Bush
sgisp2 写了: 昨天 04:33

兔子家缺算力,所以能搞出无穷的优质高效算法,又把老米甩得远远滴