Python数据预处理技术与实践
上QQ阅读APP看书,第一时间看更新

1.2 开发工具与环境

1.2.1 Anaconda介绍与安装

Anaconda是一种Python语言的免费增值开源发行版,用于进行大规模数据处理、预测分析和科学计算,致力于简化包的管理和部署。Anaconda包含了Conda、Python在内的超过180个科学包及其依赖项。Anaconda使用软件包管理系统Conda进行包管理。

1. Anaconda的优点

Anaconda是一个用于科学计算的Python发行版,支持Linux、Mac、Windows系统,提供了包管理与环境管理的功能,可以很方便地解决多版本Python并存、切换以及各种第三方包的安装问题。Anaconda利用工具/命令Conda来进行Package和Environment的管理,并且已经包含了Python和相关的配套工具。这里先解释一下Conda、Anaconda这些概念的差别。Conda可以理解为一个工具,也是一个可执行命令,其核心功能是包管理与环境管理。包管理与pip的使用类似,环境管理则允许用户方便地安装不同版本的Python并可以快速切换。Anaconda则是一个打包的集合,里面预装好了Conda、某个版本的Python、众多包(Package)、科学计算工具等,所以也称为Python的一种发行版。其实还有Miniconda,顾名思义,它只包含最基本的内容——Python与Conda,以及相关的必须依赖项,对于存储空间要求严格的用户Miniconda是一个不错的选择。其有以下优点:

  • 开源。
  • 安装过程简单。
  • 高性能使用Python和R语言。
  • 免费的社区支持。
  • Conda包管理。
  • 1,000+开源库
2. 安装Anaconda

Anaconda安装包下载地址为:https://www.anaconda.com/download/,进入下载页面会显示出Python 3.0以上版本和Python 2.0两种版本,如图1-1所示。关于Python 3和Python 2的区别请查看网址:http://www.runoob.com/python/python-2x-3x.html)。推荐下载Python 3.0以上版本,请读者根据自己的操作系统是32位还是64位选择对应的版本下载。本书是基于Windows 10操作系统安装的。

(1)安装Anaconda集成环境,双击下载后的Anaconda安装文件,如图1-2所示。

(2)然后一直单击“Next”按钮,直到完成配置(环境变量自动配置),配置完成后,查看是否安装成功。打开主菜单->所有应用查看安装,出现如图1-3所示的菜单命令则表示安装成功。

图1-1 不同Anaconda版本

图1-2 Anaconda安装

(3)按WIN+R组合键输入“cmd”命令以启动命令行环境,然后输入“conda –V”查看版本号,如图1-4所示。

图1-3 安装后的Anaconda

图1-4 查看Anaconda版本

(4)可以看到本机Anaconda版本是4.5.12,上文介绍了其集成了诸多科学包及其依赖项,看看具体包括哪些?在“命令提示符”环境下,输入“conda list”,运行结果如图1-5所示(截取部分包)。

图1-5 查看Anaconda预安装包

(5)Anaconda里面有一个包名为“pip”,这个包和Linux的包安装命令是一样的,当需要安装第三方包的时候,直接使用这个命令即可,比如,需要进行中文分词,会依赖Python的分词包jieba,可以执行如下命令:

     pip install jieba

如图1-6所示。

图1-6 pip安装结巴分词包

(6)如果不想使用这个包了,也可以直接卸载掉,命令如下:

     pip uninstall jieba

如图1-7所示。

图1-7 pip卸载结巴分词包

至此,完成了Anaconda的安装配置以及包文件的自定义下载。需要注意的是,Anaconda自身集成了Python、pip、nltk、NumPy、Matplotlib等一系列常用包。现在,已经可以使用Python了,考虑到熟悉Python开发的人员,常用Pycharm开发工具,熟悉Java的开发人员常用Eclipse开发工具,熟悉C#的开发人员常用VS开发工具,因此只要将Anaconda集成到PyDev、Pycharm、Eclipse、VS等编译环境中即可。总之,Anaconda是一款极为简便的集成软件包,可以将其与Sublime、PyCharm、MyEclipse、Visual Studio等编译环境很巧妙地融合起来(本书采用Anaconda+Sublime Text),也可以方便地导入第三方工具包,从而极大地简化软件开发工作的流程。

1.2.2 Sublime Text

1. Sublime Text简介

Sublime Text是一款跨平台的文本编辑器,同时支持Windows、Linux、Mac OS X等操作系统和基于Python的插件。Sublime Text是专有软件,可通过包(Package)扩充本身的功能。大多数的包使用自由软件授权发布,并由社区构建和维护。Sublime Text是由程序员Jon Skinner于2008年1月份开发出来的,它最初被设计为一个具有丰富扩展功能的Vim。它具有漂亮的用户界面和强大的功能,例如代码缩略图、Python的插件、代码段等。还可自定义键绑定、菜单和工具栏。Sublime Text的主要功能包括:拼写检查、书签、完整的Python API、Goto功能、即时项目切换、多选择、多窗口,等等。

Sublime Text支持众多编程语言,并支持语法上色。内置支持的编程语言包含:ActionScript、AppleScript、ASP、batch files、C、C++、C#、Clojure、CSS、D、Diff、Erlang、Go、Graphviz (DOT)、Groovy、Haskell、HTML、Java、JSP、JavaScript、JSON、LaTeX、Lisp、Lua、Makefiles、Markdown、MATLAB、Objective-C、OCaml、Perl、PHP、Python、R、Rails、Regular Expressions、reStructuredText、Ruby、Scala、shell scripts (Bash)、SQL、Tcl、Textile、XML、XSL和YAML。用户可通过下载外挂支持更多的编程语言。

2. Sublime Text的优点

Sublime Text主要有如下优点:

  • 主流前端开发编辑器。
  • 体积较小,运行速度快。
  • 文本功能强大。
  • 支持编译功能且可在控制台看到输出。
  • 内嵌Python解释器支持插件开发以达到可扩展目的。
  • Package Control(包控制):Sublime Text支持的大量插件可通过其进行管理。
3. Sublime Text的安装

本文介绍Sublime Windows 10系统下的安装配置,关于Linux和Mac OS下的安装基本一致,读者可自行尝试。Sublime Text 3安装包下载地址是:http://www.sublimetext.com/3。单击该网址进入Sublime Text主页,选择对应的操作系统与版本,如图1-8所示。

图1-8 下载Sublime Text 3

(1)双击下载好的Sublime Text 3工具包,出现如图1-9所示的界面。

图1-9 安装Sublime

(2)一直单击Next按钮安装即可,中间保存路径可以自定义。安装成功后的结果如图1-10所示。

图1-10 安装完成Sublime

(3)安装插件Package Control。

①自动安装Package Control。打开https://packagecontrol.io/installation,复制Sublime Text 3中的代码,如图1-11所示。

图1-11 安装插件Package Control

按“Ctrl+`”组合键,将上述文本代码内容复制粘贴到文本框中,按Enter即可。如图1-12所示。

图1-12 执行Package Control代码

②如果Package Control官网无法打开,也可以手动安装Package Control。

在百度网盘下载Package Control的安装包(链接:https://pan.baidu.com/s/14hs2-OF5L_l8UHKUkPGayQ)提取码:m7a9。下载完成后里面包含两个文件分别是:

文件1:Package Control.sublime-package

文件2:channel_v3.json

然后,打开Sublime存放插件的目录:在Sublime Text → Preference → Browse Packages...找到“Installed Packages”文件夹,并将以上两个文件复制进去,然后重启,如图1-13所示。

图1-13 存放Sublime插件

最后,在Sublime下打开Preference → Package Settings → Package Control →Setting-User,添加如下代码,如图1-14所示。

图1-14 配置Sublime插件

(4)成功安装后,在Sublime Text 3中同时按住Ctrl+Shift+P组合键。最终安装成功,如图1-15所示。

图1-15 安装所需插件

(5)单击“Package Control:Install Package”进入查找Python环境配置插件“SublimeREPL”,下载安装完成后,单击“Preferences->Browse Package...”查看安装的包,如图1-16所示。

图1-16 安装运行环境

(6)单击“Package Control:Install Package”查找Python环境配置插件Anaconda,如图1-17所示。

图1-17 集成Anaconda

(7)自定义快捷键配置。打开Preferences → Key Bindings输入如下代码,其中,F5运行程序,F6切换IDEL工具,Ctrl+D自定义删除行,其他快捷键是通用的,网上有很多快捷键的资料,这里不再赘述。

(8)激活版本:Help >Enter LICENSE。

至此,完成了Sublime Text 3的安装配置工作,有关详细插件安装的说明,请参考网址:http://www.open-open.com/news/view/26d731,有关快捷键的使用,请查看网址:https://segmentfault.com/a/1190000004463984。

注 意

读者也可以使用PyCharm、Eclipse等常用的Python开发工具。