网络数据采集技术:Java网络爬虫实战
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.3 数组

数组是指一组数据的集合,数组中每个数据称为元素或单元。声明数组包括数组类型以及数组名称,如声明一个int类型的一维数组。

声明数组只是给出了数组的类型以及数组名,要想使用数组,还需要使用new语句创建数组,并为数组分配内存,格式如下:

数组名 =new数据类型[数组元素个数]

例如:

数组分配空间后,可通过索引的方式初始化数组,索引从0开始,如上面的int类型数组索引到3为止。

数组通过索引符访问自身元素,如arr[0]、arr[1]等,索引从0开始。

上述数组的声明、创建和初始化是分开进行的,我们也可以同时进行这三个操作,例如:

另外,Java支持多维数组的使用,如Java编写文本处理算法时(如主题模型),经常使用二维数组。

再者,数组都有length属性,表示操作数组的长度,length属性只能读取不能修改,如输出某一数组的长度。

在Java网络爬虫中,经常涉及数组操作。如采集图片、PDF和压缩文件时,需要对byte(字节)类型的数组进行操作;使用split()方法对字符串类型数据进行分解时,涉及String数组的操作。