layout | title | tags |
---|---|---|
post |
Python 数据分析之 Pandas 介绍 |
Python |
Pandas 是 Python 中的一个数据分析库,是为了解决数据分析任务而创建的。Pandas 提供了大量能使我们快速便捷地处理数据的函数和方法,它是使 Python 成为强大而高效的数据分析编程语言的重要因素之一。
具体的 Pandas 使用方法可以查看官方文档:10 Minutes to pandas http://pandas.pydata.org/pandas-docs/stable/getting_started/10min.html
由于 Python 语言的一些特点,Pandas 在处理数据的时候只能使用单核,在大数据量的情况会出现处理较慢的情况,通过项目 「modin」只需简单的改动一行代码就能提升处理速度。
读取一个 700MB 的文件就会有几倍的加速效果。
Modin is a DataFrame designed for datasets from 1KB to 1TB+.