Python数据分析工具
- Python 本身的数据分析功能不强,需要安装一些第三方扩展库来增强它的能力。常用
的库有Numpy 、Scipy 、Matplotlib 、Pandas 、Scikit-Learn 、Keras 和Gensim 等,下面将对
这些库的安装和使用进行简单的介绍。 - 如果你安装的是Anaconda 发行版,那么它已经自带了以下库: Numpy 、Scipy 、Matplotlib
、Pandas 和Scikit-Leam。

1 .Numpy
- Python 并没有提供数组功能。虽然列表可以完成基本的数组功能,但它不是真正的数
组,而且在数据量较大时,使用列表的速度就会慢得让人难以接受。为此, Numpy 提供了真
正的数组功能,以及对数据进行快速处理的函数。Numpy 还是很多更高级的扩展库的依赖
库,Scipy 、Matplotlib 、Pandas 等库都依赖于它。值得强调的是, Numpy 内
置函数处理数据的速度是C 语言级别的,因此在编写程序的时候,应当尽量使用它们内置的
函数,避免出现效率瓶颈的现象(尤其是涉及循环的问题) 。



















