Python网络爬虫技术与应用
上QQ阅读APP看书,第一时间看更新

2.2 HTML基本原理

2.2.1 HTML简介

1.HTML解释

(1)HTML是指超文本标记语言(Hyper Text Markup Language)。

(2)HTML不是一种编程语言,而是一种标记语言(Markup Language)。(3)标记语言是一套标记标签(Markup Tag)。

(4)HTML使用标记标签来描述网页。

2.HTML标签

(1)HTML标签是由尖括号包围的关键词,如<html>。

(2)HTML标签通常是成对出现的,如<b>和</b>。

(3)标签对中的第一个标签是开始标签,第二个标签是结束标签。

(4)开始标签和结束标签也被称为开放标签和闭合标签。

3.HTML文档=网页

(1)HTML的基本原理是HTML文档描述网页。

(2)HTML文档包含HTML标签和纯文本。

(3)HTML文档也被称为网页。