DuckDB 1.0.0发布了
版主: hci
#6 Re: DuckDB 1.0.0发布了
我早就推荐了,压根都不用学pandas之类
viewtopic.php?t=478302
最近用duckdb把750GB的房里美的CSV读进了数据库,然后转存Parquet,才20GB。
viewtopic.php?t=478302
最近用duckdb把750GB的房里美的CSV读进了数据库,然后转存Parquet,才20GB。
hci 写了: 2024年 6月 4日 16:07 DuckDB貌似很火爆。好像数据科学家们很喜欢。除了分析数据很快,据说DuckDB的SQL也比较expressive,有用过的么。
https://duckdb.org/2024/06/03/announcin ... b-100.html
行数据库用SQLite,列数据库用DuckDB,都用SQL,貌似包圆了。
上次由 wokao 在 2024年 6月 5日 18:17 修改。
工具机谈智商, 犹如妓女谈贞操, 哪壶不开提哪壶
呼叫鸡谈造谣, 犹如站街女谈卖淫, 那是行家里手
#7 Re: DuckDB 1.0.0发布了
还有个类似的,好像还是中国人做的,基于clickhouse,但是不支持Windows,这点给差评
https://github.com/chdb-io/chdb/blob/main/README-zh.md
工具机谈智商, 犹如妓女谈贞操, 哪壶不开提哪壶
呼叫鸡谈造谣, 犹如站街女谈卖淫, 那是行家里手
#12 Re: DuckDB 1.0.0发布了
一点新意都没有,数据文件小是parquet格式的功劳,处理原生的压缩CSV就是多加一层解压,数据load完最终是parquet格式。
让我来,我都比他们会忽悠。
让我来,我都比他们会忽悠。
#13 Re: DuckDB 1.0.0发布了
除了用来转文件格式,你还用DuckDB干嘛呢?
wokao 写了: 2024年 6月 5日 18:15 我早就推荐了,压根都不用学pandas之类
viewtopic.php?t=478302
最近用duckdb把750GB的房里美的CSV读进了数据库,然后转存Parquet,才20GB。
#15 Re: DuckDB 1.0.0发布了
不错,DuckDB马上就更新了Julia的packagewokao 写了: 2024年 6月 6日 09:20 计算非常快,而且是对巨量的数据。我用Julia自己的DataFrame就死掉了(用Pandas会死掉得更惨),用DuckDB没问题。
还有一个我早说过了,就是根本不用学各种语言自己的DataFrame了,SQL易懂而且成熟得多。
团队还是很拼的

工具机谈智商, 犹如妓女谈贞操, 哪壶不开提哪壶
呼叫鸡谈造谣, 犹如站街女谈卖淫, 那是行家里手
#16 Re: DuckDB 1.0.0发布了
那你会用DuckDB的SQL来实现机器学习算法么?
从一个最近的文章看,貌似这是可行的。DuckDB的SQL支持递归,所以可以用来实现算法,比如Gradient Descent啥的。
从一个最近的文章看,貌似这是可行的。DuckDB的SQL支持递归,所以可以用来实现算法,比如Gradient Descent啥的。
wokao 写了: 2024年 6月 6日 09:20 计算非常快,而且是对巨量的数据。我用Julia自己的DataFrame就死掉了(用Pandas会死掉得更惨),用DuckDB没问题。
还有一个我早说过了,就是根本不用学各种语言自己的DataFrame了,SQL易懂而且成熟得多。
#19 Re: DuckDB 1.0.0发布了
你在数据库里做计算?lol
wokao 写了: 2024年 6月 6日 09:20 计算非常快,而且是对巨量的数据。我用Julia自己的DataFrame就死掉了(用Pandas会死掉得更惨),用DuckDB没问题。
还有一个我早说过了,就是根本不用学各种语言自己的DataFrame了,SQL易懂而且成熟得多。
If printing money would end poverty, printing diplomas would end stupidity.



