1.4 HTML文档结构

Web页面(网页)也是一种文档,HTML就是用来编写这些文档的一种标记语言,文档的结构和格式的定义是由HTML元素来完成的,HTML元素是由单个或一对标签定义的包含范围。一个标签就是左右分别有一个小于号(<)和大于号(>)的字符串。开始标签是指不以斜杠(/)开头的标签,其内是一串允许的属性/值对。结束标签则是以一个斜杠(/)开头的,如图1-4所示。

图1-4 HTML元素的组成

注意

HTML标记(markup)和标签并不是同义的,HTML标记包括开始标签(tag)、结束标签、空元素标签、实体引用、字符引用、注释、文档类型声明等。

学习HTML语言的重点就是掌握HTML元素及其属性的作用。

一个标准的HTML文件应该以<html>开始标签开始文档,中间包含<head>与<body>等元素,其中<head>部分中可以定义页面的标题、简介、编码格式等内容,<body>部分为在浏览器中显示的页面正文。下面的代码为一个不包含内容的标准HTML文档结构:

        <html>
        <head>
        </head>
        <body>
        </body>
        </html>

通过<title>元素可以指定页面的标题,标题会出现在浏览器的标题栏中,如果通过浏览器收藏本页面,页面标题也会作为收藏夹中页面的名称。文档的内容是通过<body>元素来指定的,在<body>元素的开始标签<body>和结束标签</body>之间放置文档的内容。如果需要在页面上添加注释,可以使用符号<!--和-->包含注释内容,下面是一段设置了标题和内容的HTML文件代码:

例01_1.html

        <html>
        <head>
            <title>页面标题</title>
        </head>
        <body>
            <!-- 这是一段注释 -->
            这是在HTML中显示的文本。
            注意:浏览器遇到连续的空格或换行时只会在页面上显示一个空格
        </body>
        </html>

执行代码,结果如图1-5所示。

图1-5 代码在IE浏览器中的显示结果

如果显示的文本中包含一些特殊字符(比如可能会与标记符号冲突的<和>符号)时需要通过字符引用的方式才能输入。在HTML中有两种字符引用类型:字符引用和实体引用。

字符引用和实体引用都是以一个和号(&)开始并以一个分号(;)结束。如果使用的是字符引用,需要在和号(&)之后加上一个井号(#),之后是所需字符的十进制代码或十六进制代码(ISO10646字符集中字符的编码)。如果使用的是实体引用,在和号(&)之后写上字符的助记符。常用特殊字符的字符引用和实体引用如表1-1所示。

表1-1 常用特殊字符的字符引用和实体

下面是使用字符引用显示的例子:

例01_2.html

        <html>
        <head>
            <title>页面标题</title>
        </head>
        <body>
            &nbsp;&nbsp;&nbsp;&nbsp;HTML中标题元素为&lt;title&gt;
            &nbsp;&nbsp;&nbsp;&nbsp;所有的转义字符都以&amp;符号作为开始
        </body>
        </html>

执行代码,结果如图1-6所示。

图1-6 代码在IE浏览器中的显示结果