1.3 认识HTML5

HTML5中语法结构和HTML的语法结构基本一致,下面将分别介绍HTML5的文档结构与基本语法。

1.3.1 HTML5的文档结构

编写HTML文件时,必须遵循HTML的语法规则。一个完整的HTML文件由标题、段落、列表、表格、单词和嵌入的各种对象所组成。这些逻辑上统一的对象统称为元素,HTML使用标签来分割并描述这些元素。实际上整个HTML文件就是由元素与标签组成的。

HTML文件基本结构如下。

<html>                                   <!--HTML文件开始--> 
  <head>                                 <!--HTML文件的头部开始--> 
    头部内容 
  </head>                                <!--HTML文件的头部结束--> 
  <body>                                 <!--HTML文件的主体开始--> 
    主体内容 
  </body>                                <!--HTML文件的主体结束--> 
</html>                                  <!--HTML文件结束-->

可以看到,代码分为3部分。

➢ <html>……</html>

告诉浏览器HTML文件开始和结束,<html>标签出现在HTML文档的第一行,用来表示HTML文档的开始。</html>标签出现在HTML文档的最后一行,用来表示HTML文档的结束。两个标签一定要一起使用,网页中的所有其他内容都需要放在<html>与</html>之间。

➢ <head>……</head>

网页的头标签,用来定义HTML文档的头部信息,该标签也是成对使用的。

➢ <body>……</body>

在<head>标签之后就是<body>与</body>标签了,该标签也是成对出现的。<body>与</body>标签之间为网页主体内容和其他用于控制内容显示的标签。

1.3.2 HTML5的基本语法

绝大多数元素都有起始标签和结束标签,在起始标签和结束标签之间的部分是元素体,例如,<body>…</body>。每一个元素都有名称和可选择的属性,元素的名称和属性都在起始标签内进行设置。

➢ 普通标签

普通标签是由一个起始标签和一个结束标签所组成的,其语法格式如下。

<x>内容</x>

其中,x代表标签名称。<x>和</x>就如同一组开关:起始标签<x>为开启某种功能,而结束标签</x>(通常为起始标签加上一个斜线/)为关闭功能,受控制的内容便放在两标签之间,例如,下面的代码。

<b>加粗文字</b>

标签之中还可以附加一些属性,用来实现或完成某些特殊效果或功能,例如,下面的代码。

<x a1="v1",a2="v2",……an="vn">内容</x>

其中,a1,a2……,an为属性名称,而v,v2……,vn则是其所对应的属性值。属性值加不加引号,目前所使用的浏览器都可接受,但根据W3C的新标准,属性值是需要加引号的,所以最好养成加引号的习惯。

➢ 空标签

虽然大部分的标签是成对出现的,但也有一些是单独存在的,这些单独存在的标签称为空标签,其语法格式如下。

<x>

同样,空标签也可以附加一些属性,用来完成某些特殊效果或功能,例如,下面的代码。

<x al="v1",a2="v2",……,an="vn">

例如,下面的代码。

<hr color="#0000FF" >

提示

其实HTML5还有其他更为复杂的语法,使用技巧也非常多,作为一种语言,它有很多的编写原则并且以很快的速度发展着。

1.3.3 HTML5精简的头部

HTML5避免了不必要的复杂性,DOCTYPE和字符集都极大地简化了。

DOCTYPE声明是HTML文件中必不可少的内容,它位于HTML文档的第一行,声明了HTML文件遵循的规范。HTML 4.01的DOCTYPE声明代码如下。

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.
w3.org/TR/html4/loose.dtd">

这么长的一串代码恐怕极少有人能够默写出来,通常都是通过复制/粘贴的方式添加这段代码。而在HTML5中的DOCTYPE代码则非常简单,如下所示。

<!DOCYPT html>

这样就简洁了许多,不需要再复制/粘贴代码了。同时这种声明,也标志性地让人感觉到这是符合HTML5规范的页面。如果使用了HTML5的DOCTYPE声明,则会触发浏览器以标准兼容的模式来显示页面。

字符集的声明也是非常重要的,它决定了页面文件的编码方式。在过去,都是使用如下的方式来指定字符集的,代码如下。

<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

HTML5对字符集的声明也进行了简化处理,简化后的声明代码如下。

<meta charset="utf-8">

在HTML5中,以上两种字符集的声明方式都可以使用,这是由HTML5向下兼容的原则决定的。