我关注的是数据准备,数据统一,不同来源的数据如何处理以统一。
https://zhuanlan.zhihu.com/p/17728210584
https://arxiv.org/pdf/2412.18619


版主: verdelite, TheMatrix
看了一下。是一个review,没有什么有启发的东西。TheMatrix 写了: 2025年 1月 14日 13:12 我还没看,先放在这。
我关注的是数据准备,数据统一,不同来源的数据如何处理以统一。
https://zhuanlan.zhihu.com/p/17728210584
https://arxiv.org/pdf/2412.18619
![]()
目前这种用LLM方法搞出的多模态不行,要从机器人那里bottom up 世界模型TheMatrix 写了: 2025年 1月 15日 14:17 看了一下。是一个review,没有什么有启发的东西。
我主要关心tokenization,image或者video的tokenization,输入方面的。
它里面介绍的两种,无论discrete还是continuous tokenization,都没有看到我想要看到的东西:
viewtopic.php?p=4812354#p4812354
TheMatrix 写了: 2025年 1月 15日 14:17 看了一下。是一个review,没有什么有启发的东西。
我主要关心tokenization,image或者video的tokenization,输入方面的。
它里面介绍的两种,无论discrete还是continuous tokenization,都没有看到我想要看到的东西:
viewtopic.php?p=4812354#p4812354