网络数据采集技术:Java网络爬虫实战
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2章 网络爬虫涉及的Java基础知识

2.1 开发环境的搭建

2.1.1 JDK的安装及环境变量配置

学习和使用Java,需要下载和安装Java开发工具包JDK。

本书安装和使用的JDK版本为JDK 8,操作系统为Windows10 64位。

图2.1 JDK下载页面

单击如图2.1所示页面的下载按钮(DOWNLOAD),跳转到如图2.2所示的下载页面,选择接受许可。同时,根据读者使用的操作系统,选择下载相应的JDK,笔者下载的JDK版本为jdk-8u181-windows-x64.exe。

JDK下载完成后,双击jdk-8u181-windows-x64.exe,根据提示信息进行安装。安装过程中,读者可自行选择安装路径,如笔者选择安装的目录为G:\software\Java。在安装JDK的同时,也安装了JRE,如图2.3所示。

图2.2 不同系统对应的JDK下载

图2.3 选择安装目录

JDK提供了Java编译器(javac.exe)和Java解释器(java.exe),其位于Java安装目录的\bin文件目录中,为了更加方便地使用编译器以及解释器,需要在系统环境变量中添加相应的目录。在Windows 10中,依次单击“此电脑”→“高级系统设置”,在“高级”选项卡中单击“环境变量”,出现如图2.4所示界面。在系统变量中,添加如下变量名并设置变量值。

在cmd(Command,命令提示符)中,输入java-version命令,如果出现如图2.5所示的内容,说明环境变量配置成功。

图2.4 配置环境变量

图2.5 验证配置的环境变量

2.1.2 Eclipse的下载

开发Java项目,需要使用集成开发环境(Integrated Development Environment,IDE)。Eclipse便是一款免费开源的Java IDE。图2.6所示的Eclipse IDE for Java EE Developers为笔者使用的开发工具。

图2.6 Eclipse IDE for Java EE Developers

首先,下载如图2.6所示的Eclipse,并解压。解压完成后,单击eclipse.exe可打开此工具。依次单击Eclipse窗口中的“Window”→“Perferences”→“Java”→“Installed JREs”→“Add”→“Standard VM”,配置开发需要的JDK,如图2.7所示。

图2.7 Eclipse配置JDK 8

配置完成后,可以新建一个Java项目,开发Java程序,如图2.8所示。

图2.8 Eclipse开发Java程序