1.2.4 URL
URL(Uniform Resource Locator,统一资源定位器)是一种在Web上用来标志资源地址的编码方法。在互联网上,每个有用的事物称为一样“资源”,并且由一个全局“统一资源标识符(URI)”标识;这些资源通过HTTP协议传送给用户,而后者通过点击链接来获得资源。
通俗地说,URL就是Web地址,俗称“网址”。Internet上的每一个文件都具有一个唯一的名称标识,如http://www.sxu.edu.cn/index.html代表山西大学的万维网URL地址,通常称之为URL地址。就像计算机文件系统的路径一样,不管是什么资源都有它的URL地址。这种地址可以是本地磁盘,也可以是局域网上的某一台计算机,更多的是指Internet上的网页资源。
URL的一般格式为(带方括号[ ]的为可选项):
● protocol(协议):指定使用的传输协议。表1-2列出了URL协议的基本类型和格式,其中http协议是目前WWW中应用最广的协议。
表1-2 URL协议的类型和格式
● hostname(主机名):指存放资源的服务器的IP地址或主机域名。
● port(端口号):可选,省略时使用方案的默认端口,各种传输协议都有默认的端口号,如http的默认端口为80。如果输入时省略,则使用默认端口号。有时出于安全或其他考虑,可以在服务器上对端口进行重定义,即采用非标准端口号。此时,URL中就不能省略端口号这一项。
● path(路径):由零或多个“/”符号隔开的字符串,用来表示主机上的一个目录或者是文件的地址。
● parameters(参数):这是用于指定特殊参数的可选项。
● ?query(查询):可选,用于给动态网页(如使用CGI、PHP、JSP、ASP、ASP.NET等技术制作的网页)传递参数,可有多个参数,用“&”符号隔开,每个参数的名和值用“=”符号隔开。
小知识:在路径后面有时会紧跟一个查询串或结构标志。意义如下:
● 若路径后面跟着一个问号“?”,说明这是一个查询串,查询串是用来定位索引文档的字符串,查询串中的空格用加号代替,这样,如果想书写真正的加号,就不得不采取特殊的措施对它重新编码。
● 结构标志是URL后面紧跟的井字(#)的名称标志,浏览器把它解释为资源定位地址,并不把它传送给服务器。