
中文的确比英文密度大多了
-
TheMatrix楼主
- 论坛元老

2024年度优秀版主
TheMatrix 的博客 - 帖子互动: 294
- 帖子: 13920
- 注册时间: 2022年 7月 26日 00:35
Re: 中文的确比英文密度大多了
Hard to say when. The Chinese government relied on lockdown and contact tracking. As covid spreads still, such measures are unlikely to be relaxed until a clear downturn is seen worldwide.
⚪︎ 辟邪剑法七折大酬宾~~
-
TheMatrix楼主
- 论坛元老

2024年度优秀版主
TheMatrix 的博客 - 帖子互动: 294
- 帖子: 13920
- 注册时间: 2022年 7月 26日 00:35
Re: 中文的确比英文密度大多了
你这个少了一段“过去,中国政府通过。。。”。zeami 写了: 2022年 12月 8日 13:18 Hard to say when. The Chinese government relied on lockdown and contact tracking. As covid spreads still, such measures are unlikely to be relaxed until a clear downturn is seen worldwide.
-
TheMatrix楼主
- 论坛元老

2024年度优秀版主
TheMatrix 的博客 - 帖子互动: 294
- 帖子: 13920
- 注册时间: 2022年 7月 26日 00:35
Re: 中文的确比英文密度大多了
同样压缩一下中文还是短的多zeami 写了: 2022年 12月 8日 13:18 Hard to say when. The Chinese government relied on lockdown and contact tracking. As covid spreads still, such measures are unlikely to be relaxed until a clear downturn is seen worldwide.
很难说。中国政府以前依靠封锁和追踪接触。随着病毒持续传播这些措施可能会被继续采用除非世界各地病例出现显著下降
Re: 中文的确比英文密度大多了
中文一般以汉字为token
英文现在一般是用word piece, 比如“lockdown and contact tracking” 可能就是#lock down# SP #and# SP #contact# SP #track ing# 这些token
#表示词边界
英文现在一般是用word piece, 比如“lockdown and contact tracking” 可能就是#lock down# SP #and# SP #contact# SP #track ing# 这些token
#表示词边界
-
TheMatrix楼主
- 论坛元老

2024年度优秀版主
TheMatrix 的博客 - 帖子互动: 294
- 帖子: 13920
- 注册时间: 2022年 7月 26日 00:35
Re: 中文的确比英文密度大多了
对。但中文的二维密度大。da1gaku 写了: 2022年 12月 12日 14:51 中文一般以汉字为token
英文现在一般是用word piece, 比如“lockdown and contact tracking” 可能就是#lock down# SP #and# SP #contact# SP #track ing# 这些token
#表示词边界
Re: 中文的确比英文密度大多了
用故意压缩和省略来证明密度大?辛苦了
zeami 写了: 2022年 12月 8日 13:18 Hard to say when. The Chinese government relied on lockdown and contact tracking. As covid spreads still, such measures are unlikely to be relaxed until a clear downturn is seen worldwide.

