03.HTML 基础
目录介绍
- 01.基本标签
- 02.文档类型
<!doctype>
- 03.根元素
<html>
- 04.头部
<head>
- 05.元数据
<meta>
- 06.标题
<title>
- 07.主体内容
<body>
- 08.空格和换行
- 09.注释
01.基本标签
符合 HTML 语法标准的网页,应该满足下面的基本结构。
<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="utf-8">
<title></title>
</head>
<body>
</body>
</html>
不管多么复杂的网页,都是从上面这个基本结构衍生出来的。
前面说过,HTML 代码的缩进和换行,对于浏览器不产生作用。所以,上面的代码完全可以写成一行,渲染结果不变。上面这样分行写,只是为了提高可读性。
下面就依次介绍,这个基本结构的主要标签。它们构成了网页的骨架。
02.文档类型<!doctype>
网页的第一个标签通常是<!doctype>
,表示文档类型,告诉浏览器如何解析网页。
一般来说,只要像下面这样,简单声明doctype
为html
即可。浏览器就会按照 HTML 5 的规则处理网页。
<!doctype html>
有时,该标签采用完全大写的形式,以便区别于正常的 HTML 标签。因为<!doctype>
本质上不是标签,更像一个处理指令。
<!DOCTYPE html>
03.根元素<html>
<html>
标签是网页的顶层容器,即标签树结构的顶层节点,也称为根元素(root element),其他元素都是它的子元素。一个网页只能有一个<html>
标签。
该标签的lang
属性,表示网页内容默认的语言。
<html lang="zh-CN">
上面代码表示,网页是中文内容。如果是英文内容,zh-CN
要改成en
。更详细的介绍,参见《元素的属性》一章。
04.头部<head>
<head>
标签是一个容器标签,用于放置网页的元信息。它的内容不会出现在网页上,而是为网页渲染提供额外信息。
<!doctype html>
<html>
<head>
<title>网页标题</title>
</head>
</html>
<head>
是<html>
的第一个子元素。如果网页不包含<head>
,浏览器会自动创建一个。
<head>
的子元素一般有下面七个,后文会一一介绍。
<meta>
:设置网页的元数据。<link>
:连接外部样式表。<title>
:设置网页标题。<style>
:放置内嵌的样式表。<script>
:引入脚本。<noscript>
:浏览器不支持脚本时,所要显示的内容。<base>
:设置网页内部相对 URL 的计算基准。
05.元数据<meta>
<meta>
标签用于设置或说明网页的元数据,必须放在<head>
里面。一个<meta>
标签就是一项元数据,网页可以有多个<meta>
。<meta>
标签约定放在<head>
内容的最前面。
不管什么样的网页,一般都可以放置以下两个<meta>
标签。
<head>
<meta charset="utf-8">
<meta name="viewport" content="width=device-width, initial-scale=1">
<title>Page Title</title>
</head>
上面例子中,第一个<meta>
标签表示网页采用 UTF-8 格式编码,第二个<meta>
标签表示网页在手机端可以自动缩放。
<meta>
标签有五个属性,下面依次介绍。
(1)charset 属性
<meta>
标签的charset
属性,用来指定网页的编码方式。该属性非常重要,如果设置得不正确,浏览器可能无法正确解码,就会显示乱码。
<meta charset="utf-8">
上面代码声明,网页为 UTF-8 编码。虽然开发者可以使用其他的编码方式,但正确的做法几乎总是应该采用 UTF-8。
注意,这里声明的编码方式,应该与网页实际的编码方式一致,即声明了utf-8
,网页就应该使用 UTF-8 编码保存。如果这里声明了utf-8
,实际却是使用另一种编码(比如 GB2312),并不会导致浏览器的自动转码,网页可能会显示为乱码。
(2)name 属性,content 属性
<meta>
标签的name
属性表示元数据的名字,content
属性表示元数据的值。它们合在一起使用,就可以为网页指定一项元数据。
<head>
<meta name="description" content="HTML 语言入门">
<meta name="keywords" content="HTML,教程">
<meta name="author" content="张三">
</head>
上面代码包含了三个元数据:description
是网页内容的描述,keywords
是网页内容的关键字,author
是网页作者。
元数据有很多种,大部分涉及浏览器内部工作机制,或者特定的使用场景,这里就不一一介绍了。下面是一些例子。
<meta name="viewport" content="width=device-width, initial-scale=1">
<meta name="application-name" content="Application Name">
<meta name="generator" content="program">
<meta name="subject" content="your document's subject">
<meta name="referrer" content="no-referrer">
(3)http-equiv 属性,content 属性
<meta>
标签的http-equiv
属性用来补充 HTTP 回应的头信息字段,如果服务器发回的 HTTP 回应缺少某个字段,就可以用它补充。<meta>
标签的content
属性是对应的字段内容。这两个属性与 HTTP 协议相关,属于高级用法,这里就不详细介绍了。
<meta http-equiv="Content-Security-Policy" content="default-src 'self'">
上面代码设定 HTTP 回应的Content-Security-Policy
字段。
下面是另一些例子。
<meta http-equiv="Content-Type" content="Type=text/html; charset=utf-8">
<meta http-equiv="refresh" content="30">
<meta http-equiv="refresh" content="30;URL='http://website.com'">
06.标题<title>
<title>
标签用于指定网页的标题,会显示在浏览器窗口的标题栏。
<head>
<title>网页标题</title>
</head>
搜索引擎根据这个标签,显示每个网页的标题。它对于网页在搜索引擎的排序,有很大的影响,应该精心安排,反映网页的主题。
<title>
标签的内部,不能再放置其他标签,只能放置无格式的纯文本。
07.主体内容<body>
<body>
标签是一个容器标签,用于放置网页的主体内容。浏览器显示的页面内容,都放置在它的内部。它是<html>
的第二个子元素,紧跟在<head>
后面。
<html>
<head>
<title>网页标题</title>
</head>
<body>
<p>hello world</p>
</body>
</html>
08.空格和换行
HTML 语言有自己的空格处理规则。标签内容的头部和尾部的空格,一律忽略不计。
<p> hello world </p>
上面代码中,hello
前面的空格和world
后面的空格,浏览器一律忽略不计。
标签内容里面的多个连续空格(包含制表符\t
),会被浏览器合并成一个。
<p>hello world</p>
上面代码中,hello
与world
之间有多个连续空格,浏览器会将它们合并成一个。网页渲染的结果是,hello
与world
之间只有一个空格。
浏览器还会将文本里面的换行符(\n
)和回车符(\r
),替换成空格。
<p>hello
world
</p>
上面代码中,hello
与world
之间有多个换行,浏览器会将它们替换成空格,然后再将多个空格合并成一个。网页渲染的结果是,hello
与world
之间有一个空格。
这意味着,HTML 源码里面的换行,不会产生换行效果。
09.注释
HTML 代码可以包含注释,浏览器会自动忽略注释。注释以<!--
开头,以-->
结尾,下面就是一个注释的例子。
<!-- 这是一个注释 -->
注释可以是多行的,并且内部的 HTML 都不再生效了。
<!--
<p>hello world</p>
-->
上面代码是一个注释的区块,内部的代码都是无效的,浏览器不会解析,更不会渲染它们。
注释有助于理解代码的含义,复杂的代码块前面最好加上注释。