numpy 可以高效的处理数据,提供数组支持,很多模块都以来他,比如pandas,scipy,matploylib都以来他,所以这个模块是基础。numpy+mkl
pandas 用于进行数据探索和数据分析
scipy 主要进行数值计算,同时支持矩阵运算,并提供了很多高等数据处理功能,比如积分,傅里叶变换,微分方程求解等
matplotlib 作图模块,解决可视化问题
statsmodels 主要用于统计分析。
Gensim 这个模块主要用于文本挖掘。
sklearn 机器学习
keras 深度学习
jieba 用于分词,对于英文可以空格分词,中文分词需要词典;jieba中还有多种模式,同时jieba还可以关键词的提取
tflearn 深度学习,对tensorflow进一步封装
图像处理工具 opencv
可以通过http://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy 或者 https://pypi.org/下载相应模块
如果以上下载过慢,可以使用豆瓣的源,效果很不错
https://pypi.douban.com/simple/
使用pip安装可以
pip install -i https://pypi.douban.com/simple/ tensorflow-gpu
这样就OK啦