分页: 1 / 3
#1 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 03:07
由 wanmeishijie
#2 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 03:35
由 fanqie
#3 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 03:41
由 xiaozhao
确实牛b, 这个模型的论文,揭露一个结论, 文本可能不是llm的最好输入, 图片和视频才是。 而图片和视频可以压缩很小,所以给一个图片的txt,运算量小很多。
#4 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 03:58
由 foofy
#5 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 04:11
由 xiaoju
叔去年就这么说
但是你弟业界折腾一年,除了烧器材的砸钱的,一个实质性成就也没有
xiaozhao 写了: 昨天 03:41
确实牛b, 这个模型的论文,揭露一个结论, 文本可能不是llm的最好输入, 图片和视频才是。 而图片和视频可以压缩很小,所以给一个图片的txt,运算量小很多。
#6 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 04:12
由 wanmeishijie
xiaozhao 写了: 昨天 03:41
确实牛b, 这个模型的论文,揭露一个结论, 文本可能不是llm的最好输入, 图片和视频才是。 而图片和视频可以压缩很小,所以给一个图片的txt,运算量小很多。
直观上文本必须tokenize再向量化。这个空间维度不低。
而图片如果是16色很有限
#7 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 04:33
由 sgisp2
兔子家缺算力,所以能搞出无穷的优质高效算法,又把老米甩得远远滴
#8 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 04:46
由 redot
注意力权重,是人的本能之一
如对号码的记忆,是恨明显的例子
#9 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 04:50
由 老蛆
#10 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 05:05
由 coltzhao
这个按发表的数字是很牛的,而且很新,以前没人走过的路。
#11 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 05:20
由 zheliemit
现在开源大模型都被你憋包揽了前三名:智谱、QWen、Deepseek
#12 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 05:54
由 民主自由是婊子的遮羞布
sgisp2 写了: 昨天 04:33
兔子家缺算力,所以能搞出无穷的优质高效算法,又把老米甩得远远滴
麻痹的,兔子太猛
就像兔子家的发动机不行
就在气动外形和模型上下功夫
最后搞出极致的气动模型
#13 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 06:22
由 xiaoju
缺算力是个伪命题,你只要有钱token要多少有多少
你弟的本质问题是明明没钱,却装成大款无限烧钱,所以研发停滞不前
sgisp2 写了: 昨天 04:33
兔子家缺算力,所以能搞出无穷的优质高效算法,又把老米甩得远远滴
#14 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 06:24
由 xiaoju
deepseek-ocr的玩法是把重复信息忽略掉,比如100页稿纸,后面的只看内容不看格式,节省大量token
人也是这么阅读的
wanmeishijie 写了: 昨天 04:12
直观上文本必须tokenize再向量化。这个空间维度不低。
而图片如果是16色很有限
#15 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 07:51
由 sgisp2
#16 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 07:59
由 xiaoju
我觉得本质上deekseek-ocr还是一个tokenizer
不过因为其基于现代LLM,而不是古典的BPE算法,所以可以更高效的降噪,只提取有用信息
#17 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 08:00
由 Newsmax
#18 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 08:04
由 Narcotics07
Photographic memory, 不是雨人类自闭症有的嘛
这类人在米国被当特殊人(aka 傻子)
#19 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 08:12
由 windy
看了下,显然是Deepseek在模型的能力上拼不过,改打这种小trick来抓眼球。这种东西有用吗?有。但是用处不大。类似的东西,包括多态模型,现在研究的多了。产品也多如牛毛。几个主打的大语言模型(其实这些都早不仅仅是“语言”模型了)都支持多模态输入。DS作为产品的卖点可以理解,从创新角度上真没啥好吹的
#20 Re: 厉害了我的国!刚刚DeepSeek又发布新模型!开源!
发表于 : 2025年 10月 21日 08:20
由 Bush
sgisp2 写了: 昨天 04:33
兔子家缺算力,所以能搞出无穷的优质高效算法,又把老米甩得远远滴