在正式讲解知识点之前,我们要进行一下准备工作即选择相应的工具,俗话说的好“工欲善其事必先利其器”,选择一个好的工具你已经向成功迈出一大步。有 Python 基础的同学对 IPython 一定不陌生,但是可能对后者 Jupyter notebook 与 Anconda 不甚了解,下面就对这本教程中常用工具做简单的介绍。
IPython(https://ipython.org/) 它是 Python 的交互式解释器,我相信这个工具大家都是用过,如果你没有使用过,那很抱歉,亲,你需要先去本网站学习《 Python入门基础教程》。
交互可以简单理解为人机交流,就比如你点击打开手机上的 App,然后这个 App要给你一个反馈,无非两种情况,APP 顺利打开或者出现了卡死的情况,这就是对交互最简单的理解。有的 IDE 已经集成了 IPython,比如说 Pycharm,但是也看个人习惯,比如就总是喜欢用终端的的 IPython,就像有些程序员不喜欢用 IDE,而喜欢用文本编辑器一样。
2001年,Fernando Pérez 为了得到一个更为高效的交互式 Python 解释器发起了 IPython项目。后来它逐渐被公认为现代科学计算中最重要的 Python 工具之一。
IPython 本身并没有提供任何的计算或数据分析功能,其设计目的是在交互式计算和软件开发这两个方面最大化地提高生产力。此外,它跟操作系统 shell 和文件系统之间也有着非常紧密的集成。因此 IPython 将有助于提高工作效率。在 2014 年 Fernando Pérez 和 IPython团队又发布了一个项目,它就是 Jupyter,所以说它门两是诞生自一家的兄弟。
获得帮助魔法命令:
文件的操作相关魔法命令:
其他常用的一些魔法命令:
Jupyter Notebook(官网https://jupyter.org/)是一个开源 Web 应用程序,它使用 IPython 解释器作为内核,所以它同样支持魔法命令(magic)。它允许你执行创建和共的操作,共享内容包括实时代码、方程式、可视化效果以及叙述文本的文档。主要用途包括:数据清理和转换,数值模拟,统计建模,数据可视化,机器学习等。
Jupyter Notebook 是以网页的形式打开,可以在网页页面中直接编写代码和运行代码,代码的运行结果也会直接在代码块下显示。如在编程过程中需要编写说明文档,可在同一个页面中直接编写,便于作及时的说明和解释。Jupyter 不仅适用于 Python,它还可以支持 40 多种编程语言,而 IPython 内核只不过是在使用 Python 时才使用。Jupyter Notebook 对于数据分析和数据可视化是一个非常有用的工具。
安装非常的简单可以是直接采用 pip 的形式进行安装:
安装完成后使用如下方式进行启动:
启动后会自动跳转到 Jupyter Ntoebook 的网页页面,如下所示:
同时在 CMD 命令行打印如下数据:
C:\Users\Administrator>jupyter notebook [I 17:34:41.441 NotebookApp] Serving notebooks from local directory: D:\jupyter-notebook [I 17:34:41.442 NotebookApp] The Jupyter Notebook is running at: [I 17:34:41.443 NotebookApp] http://localhost:8888/?token=4d4525c49a9a9b99cc96e019c9b0dc0bfea666d4c4535878 [I 17:34:41.446 NotebookApp] or http://127.0.0.1:8888/?token=4d4525c49a9a9b99cc96e019c9b0dc0bfea666d4c4535878 [I 17:34:41.448 NotebookApp] Use Control-C to stop this server and shut down all kernels (twice to skip confirmation). [C 17:34:41.550 NotebookApp]
在后续章节中我们会经常和它打交道。对于使用的其他方法,大家可以参看官网了解详细内容,或者在网络搜索自行学习,或者参考本网站《Jupyter Notebook》一节。
下面给大家简单总结一下 Jupyter Notebook主要特点,如下所示:
Jupyter Notebook 系统允许你是用 Markdown 和 HTML 创建包含代码和文本的富文本,其他编程语言也针对 Jupyter 实现了内核,允许你在 Jupyter 中使用多中语言而绝对不仅仅是 Python 语言,所以千万不要小瞧它哦。在以后的章节知识讲解中,你会对它有更深入的认识。
Anaconda(https://www.anaconda.com/) 自称是“全球最受欢迎的数据科学平台”,它是一个开源的 Python 发行版本,其包含了conda、Python 等 180 多个科学包及其依赖项。 因为包含了大量的科学包,所以 Anaconda 的下载文件比较大。可参见《Python Anaconda是什么?》一文详细了解。
大家可以直接在官网下载然后傻瓜式安装即可,可参见《Anaconda下载和安装教程(图解)》一文。Anaconda 的功能非常的强大,当你下载完成后,这个平台已经为你集成了所有的和科学计算相关的包,你可以使用下面的命令查看:
通过 conda 创建一个虚拟“房间”,可以方便未来对不同版本的包进行管理,比如 Python 2.x 与 Python 3.x 具体方法如下:
这个命令将会自动创建 python37 目录中并配置 Python 3.7.4 版本的虚拟环境。大家可以参考官网文档了解其他命令或在命令行工具中输入 conda --help 查看其他命令,这里不做具体介绍了。
上述就是在数据分析中经常用到的工具,当然 IDE Pycharm(推荐使用) 也必不可少,希望大家可以提前在自己的电脑上安装好工具,如果安装过程中遇到问题,要多查多问学会解决问题,本教程适合 Python 3.x 以上版本并以 Windows 做为学习平台,推荐大家使用 3.6 以上稳定支持版本。本教程中使用了 Python 3.7 版本,关于 Python 相关问题可以参考本网站教程《 Python入门基础教程》,其余可参看网络资源或者官方文档。