04.HTML 文本
目录介绍
- 01.区块
<div>
- 02.段落
<p>
- 03.内联元素
<span>
- 03.换行
<br>
- 04.水平线
<hr>
- 05.文本格式化标签
- 06.计算机输出标签
- 07.引文和引用
历史上,网页的主要功能是文本展示。所以,HTML 提供了大量的文本处理标签。
01.区块<div>
<div>
是一个通用标签,表示一个区块(division)。它没有语义,如果网页需要一个块级元素容器,又没有其他合适的标签,就可以使用这个标签。
它的最常见用途就是提供 CSS 的钩子,用来指定各种样式。所以在早期,下面层层包裹的<div>
就很常见。
<div class="main">
<div class="article">
<div class="title">
<h1>文章标题</h1>
</div>
</div>
</div>
上面代码读起来很费力,因为不带有语义。后来,HTML 5 就提出了语义标签,改进了上面的代码。
<main>
<article>
<header>
<h1>文章标题</h1>
</header>
</article>
</main>
<div>
是无语义的块级元素。下面的例子使用<div>
,将图像和文字组合在一起,构成一个警告区块。
<div>
<img src="warning.jpg" alt="警告">
<p>小心</p>
</div>
只要样式上需要多个块级元素组合在一起,就可以使用<div>
。但是,这应该是最后的措施,带有语义的块级标签(比如<article>
、<section>
、<aside>
、<nav>
等)始终应该优先使用,当且仅当没有其他语义元素合适时,才可以使用<div>
。
02.段落<p>
<p>
标签是一个块级元素,代表文章的一个段落(paragraph)。不仅是文本,任何想以段落显示的内容,比如图片和表单项,都可以放进<p>
元素。
<p>hello world</p>
上面代码就是一个简单的段落。
03.内联元素<span>
<span>
是一个通用目的的行内标签(即不会产生换行),不带有任何语义。它通常用作 CSS 样式的钩子,如果需要对某些行内内容指定样式,就可以把它们放置在<span>
。
<p>这是一句<span>重要</span>的句子。</p>
上面代码中,句子里面需要强调的部分,就可以放在<span>
。
03.换行<br>
<br>
让网页产生一个换行效果。该标签是单独使用的,没有闭合标签。
hello<br>world
浏览器渲染上面代码时,会分成两行,hello
和world
各占一行。
<br>
对于诗歌和地址的换行非常有用。
<p>
床前明月光,<br>
疑是地上霜。<br>
举头望明月,<br>
低头思故乡。
</p>
上面的代码如果不用<br>
,会显示成一行。
注意,块级元素的间隔,不要使用<br>
来产生,而要使用 CSS 指定。
<p>第一段</p>
<br>
<br>
<p>第二段</p>
上面的代码希望段落之间有两个换行,这时不应该使用<br>
,而应该使用 CSS。
<wbr>
标签跟<br>
很相似,表示一个可选的断行。如果一行的宽度足够,则不断行;如果宽度不够,需要断行,就在<wbr>
的位置的断行。它是为了防止浏览器在一个很长的单词中间,不正确地断行或者不断行,所以事先标明可以断行的位置,主要用于欧洲一些单词很长的语言或者 URL 的断行。
<p>
Fernstraßen<wbr>bau<wbr>privat<wbr>finanzierungs<wbr>gesetz
</p>
上面代码是一个很长的德语单词,为了防止不正确断行,事先用<wbr>
告诉浏览器,可以选择在哪里断行。
04.水平线<hr>
<hr>
用来在一篇文章中分隔两个不同的主题,浏览器会将其渲染为一根水平线。该标签是单独使用的,没有闭合标签。
<p>第一个主题</p>
<hr>
<p>第二个主题</p>
上面代码的渲染结果是,两段之间会出现一根水平线。
该标签是历史遗留下来的,建议尽量避免使用。主题之间的分隔可以使用<section>
,如果想要水平线的效果,可以使用 CSS。
05.文本格式化标签
5.1 定义加重语气<strong>
<strong>
是一个行内元素,表示它包含的内容具有很强的重要性,需要引起注意。浏览器会以粗体显示内容。
<p>开会时间是<strong>下午两点</strong>。</p>
5.2 定义粗体文本<b>
<b>
与<strong>
很相似,也表示它包含的内容需要引起注意,浏览器会加粗显示。它是 Boldface 的缩写。
<p>开会时间是<b>下午两点</b>。</p>
它与<strong>
的区别在于,由于历史原因,它没有语义,是一个纯样式的标签,违反了语义与样式分离的原则,因此不建议使用,应该优先使用<strong>
标签。
5.3 着重文字<em>
<em>
是一个行内标签,表示强调(emphasize),浏览器会以斜体显示它包含的内容。
<p>我们<em>已经</em>讨论过这件事情了。</p>
虽然浏览器通常会以斜体显示<em>
,但无法保证一定如此,所以最好还是用 CSS 指定一下这个标签的样式。
5.4 斜体字<i>
<i>
标签与<em>
相似,也表示与其他地方有所区别,浏览器会以斜体显示。它是 Italic 的缩写。
<p>我心想,这件事是<i>真的</i>吗?</p>
<i>
标签的语义不强,更接近是一个纯样式的标签,建议优先使用<em>
标签代替它。
5.5 小号字<small>
<small>
是一个行内标签,浏览器会将它包含的内容,以小一号的字号显示,不需要使用 CSS 样式。它通常用于文章附带的版权信息或法律信息。
<p>文章正文</p>
<p><small>以上内容使用创意共享许可证。</small></p>
5.6 下标字<sub>
,
<sub>
标签将内容变为下标,<sup>
标签将内容变为上标。它们都是行内元素,主要用于数学公式、分子式等。
<p>水分子是 H<sub>2</sub>O。</p>
5.7 插入字<ins>
<ins>
标签是一个行内元素,表示原始文档添加(insert)的内容。
<ins><p>会议定于5月9日举行。</p></ins>
浏览器默认为<ins>
标签的内容加上下划线。
这个标签都有以下属性。
cite
:该属性的值是一个 URL,表示该网址可以解释本次删改。datetime
:表示删改发生的时间。
<ins cite="./why.html" datetime="2018-05">
<p>项目比原定时间提前两周结束。</p>
</ins>
5.8 删除字<del>
<del>
与之类似,表示删除(delete)的内容。它们通常用于展示文档的删改。
<del><p>会议定于5月8日举行。</p></del>
浏览器默认为<del>
标签的内容加上删除线,
06.计算机输出标签
6.1 计算机代码<code>
<code>
标签是一个行内元素,表示标签内容是计算机代码,浏览器默认会以等宽字体显示。
<code>alert()</code>的作用是让网页弹出一个提示框。
如果要表示多行代码,<code>
标签必须放在<pre>
内部。<code>
本身仅表示一行代码。
<pre>
<code>
let a = 1;
console.log(a);
</code>
</pre>
6.2 键盘码<kbd>
<kbd>
标签是一个行内元素,原意是用户从键盘输入的内容,现在扩展到各种输入,包括语音输入。浏览器默认以等宽字体显示标签内容。
<p>Windows 可以按下 <kbd>Ctrl</kbd> + <kbd>Shift</kbd> + <kbd>Del</kbd> 重启。</p>
<kbd>
可以嵌套,方便指定样式。
<p>Windows 可以按下
<kbd> <kbd>Ctrl</kbd> + <kbd>Shift</kbd> + <kbd>Del</kbd> </kbd>
重启。</p>
6.3 代码样本<samp>
<samp>
标签是一个行内元素,表示计算机程序输出内容的一个例子。浏览器默认以等宽字体显示。
<p>如果使用没有定义的变量,浏览器会报错:
<samp>Uncaught ReferenceError: foo is not defined</samp>。
</p>
6.4 定义变量<var>
<var>
标签表示代码或数学公式的变量。
<p>勾股定理是
<var>a</var><sup>2</sup> + <var>b</var><sup>2</sup> = <var>c</var><sup>2</sup>
。</p>
6.5 预格式文本<pre>
<pre>
是一个块级元素,表示保留原来的格式(preformatted),即浏览器会保留该标签内部原始的换行和空格。浏览器默认以等宽字体显示标签内容。
<pre>hello
world</pre>
上面代码中,换行和连续空格都会由于<pre>
标签,而被保留下来,浏览器按照原样输出。
注意,HTML 标签在<pre>
里面还是起作用的。<pre>
只保留空格和换行,不会保留 HTML 标签。
<pre><strong>hello world</strong></pre>
上面代码中,<pre>
标签的内容会加粗显示。
07.引文和引用
7.1 缩写<abbr>
<abbr>
标签是一个行内元素,表示标签内容是一个缩写。它的title
属性给出缩写的完整形式,或者缩写的描述。鼠标悬停在该元素上方时,title
属性值作为提示,会完整显示出来。
<abbr title="HyperText Markup Language">HTML</abbr>
注意,某些浏览器可能对该标签提供圆点下划线。
7.2 <address>
<address>
标签是一个块级元素,表示某人或某个组织的联系方式。
<p>作者的联系方式:</p>
<address>
<p><a href="mailto:foo@example.com">foo@example.com</a></p>
<p><a href="tel:+555-34762301">+555-34762301</a></p>
</address>
该标签有几个注意点。
(1)如果是文章里提到的地址(比如提到搬家前的地址),而不是联系信息,不要使用<address>
标签。
(2)<address>
的内容不得有非联系信息,比如发布日期。
(3)<address>
不能嵌套,并且内部不能有标题标签(<h1>
~<h6>
),也不能有<article>
、<aside>
、<section>
、<nav>
、<header>
、<footer>
等标签。
(4)通常,<address>
会放在<footer>
里面,下面是一个例子。
<footer>
<address>
文章的相关问题请联系<a href="mailto:zhangsan@example.com">张三
McClure</a>。
</address>
</footer>
7.3 文字方向<bdo>
,<bdi>
大部分文字的阅读方向是从左到右,但是有些文字的方向是从右到左,比如阿拉伯语、希伯来语等。<bdo>
标签是一个行内元素,表示文字方向与网页主体内容的方向不一致。
<p>床前明月光,<bdo dir="rtl">霜上地是疑</bdo>。</p>
上面代码中,<bdo>
标签里面的文字,会以相反的方向渲染,结果就是“床前明月光,疑是地上霜”。
<bdo>
的dir
属性,指定具体的文字方向。它有两个值,ltr
表示从左到右,rtl
表示从右到左。
<bdi>
标签用于不确定文字方向的情况。比如,网页有一个部分是用户输入的内容,但是不知道输入内容的文字方向。这种情况就可以使用<bdi>
标签,告诉浏览器,不确定文字的方向,由浏览器自己决定。
<p><bdi>床前明月光,疑是地上霜。</bdi></p>
7.4 长引用<blockquote>
<blockquote>
是一个块级标签,表示引用他人的话。浏览器会在样式上,与正常文本区别显示。
<blockquote cite="https://quote.example.com">
<p>天才就是 1% 的天赋和99%的汗水。</p>
</blockquote>
7.5 短引用<q>
<q>
是一个行内标签,也表示引用。它与<blockquote>
的区别,就是它不会产生换行。
<p>
莎士比亚的《哈姆雷特》有一句著名的台词:
<q cite="https://quote.example.com">活着还是死亡,这是一个问题。</q>
</p>
上面例子中,引言部分跟前面的说明部分是在同一行里面。
另外,跟<blockquote>
一样,<q>
也有cite
属性,表示引言的来源网址。
注意,浏览器默认会斜体显示<q>
的内容,并且会自动添加半角的双引号。所以,引用中文内容时要小心。
7.6 引用&引证<cite>
<blockquote>
标签有一个cite
属性,它的值是一个网址,表示引言来源,不会显示在网页上。
<cite>
标签表示引言出处或者作者,浏览器默认使用斜体显示这部分内容。
<blockquote cite="https://quote.example.com">
<p>天才就是 1% 的天赋和99%的汗水。</p>
</blockquote>
<cite>-- 爱迪生</cite>
<cite>
不一定跟<blockquote>
一起使用。如果文章中提到资料来源,也可以单独使用。
<p>更多资料请看<cite>维基百科</cite>。</p>
<u>
,<s>
<u>
标签是一个行内元素,表示对内容提供某种注释,提醒用户这里可能有问题,基本上只用来表示拼写错误。浏览器默认以下划线渲染内容。
<p>
一个容易写错的成语是把<em>安分守己</em>写成<u>安份守己</u>。
</p>
上面代码中,<u>
提示用户这是一个拼写错误,“安份守己”的下方会有一个下划线。
注意,<u>
会产生下划线,由于链接也默认带有下划线,所以必须非常小心使用<u>
标签,避免用户误以为可以点击。万一确有必要使用,最好使用 CSS 改变<u>
的默认样式。
<s>
标签是一个行内元素,为内容加上删除线。
<p>今天特价商品:<s>三文鱼</s>(售完)</p>
上面代码中,“三文鱼”会有一根删除线。
<mark>
<mark>
是一个行内标签,表示突出显示的内容。Chrome 浏览器默认会以亮黄色背景,显示该标签的内容。
<p>我们讨论以后决定,<mark>运行会在下周三举办</mark>。</p>
<mark>
很适合在引用的内容(<q>
或<blockquote>
)中,标记出需要关注的句子。
<blockquote>
床前明月光,疑是地上霜。<mark>举头望明月,低头思故乡。</mark>
</blockquote>
除了标记感兴趣的文本,<mark>
还可以用于在搜索结果中,标记出匹配的关键词。
注意,不要只为了高亮的效果,而使用这个标签,因为不能保证浏览器的处理方式。如果要保证高亮,还是要使用 CSS 样式。
<time>
,<data>
<time>
是一个行内标签,为跟时间相关的内容提供机器可读的格式。
<p>运动会预定<time datetime="2015-06-10">下周三</time>举行。</p>
上面代码中,<time>
表示下周三的具体日期。这方便搜索引擎抓取,或者下一步的其他处理。
<time>
的datetime
属性,用来指定机器可读的日期,可以有多种格式。
- 有效年份:
2011
- 有效月份:
2011-11
- 有效日期:
2011-11-18
- 无年份的日期:
11-18
- 年度的第几周:
2011-W47
- 有效时间:
14:54
、14:54:39
、14:54:39.929
- 日期和时间:
2011-11-18T14:54:39.929
<p>音乐会在<time datetime="20:00">晚上八点</time>开始。</p>
<data>
标签与<time>
类似,也是提供机器可读的内容,但是用于非时间的场合。
<p>本次马拉松比赛第一名是<data value="39">张三</data></p>。
上面代码中,选手的机读数据就放在<data>
标签的value
属性。
<dfn>
<dfn>
是一个行内元素,表示标签内容是一个术语(definition),本段或本句包含它的定义。
<p>
通过 TCP/IP 协议连接的全球性计算机网络,叫做 <dfn>Internet</dfn>。
</p>
为了脚本操作的方便,可以把术语的定义写入<dfn>
标签的title
属性。
<p>
通过 TCP/IP 协议连接的全球性计算机网络,叫做
<dfn title="全球性计算机网络">Internet</dfn>。
</p>
上面代码中,title
属性的一个作用是,鼠标悬浮的时候,术语的解释会以提示的形式显示出来。
某些时候,术语本身是一个缩写,这时<dfn>
和<abbr>
可以结合使用。
<p>
<dfn><abbr title="acquired immune deficiency syndrome">AIDS</abbr></dfn>
的全称是获得性免疫缺陷综合征。
</p>
<ruby>
<ruby>
标签表示文字的语音注释,主要用于东亚文字,比如汉语拼音和日语的片假名。它默认将语音注释,以小字体显示在文字的上方。
<ruby>
汉<rp>(</rp><rt>han</rt><rp>)</rp>
字<rp>(</rp><rt>zi</rt><rp>)</rp>
</ruby>
上面代码的渲染结果是,汉字
上方有小字体的拼音han zi
。
<ruby>
标签是一个行内元素,也是一个容器标签。如果要使用语音注释,就必须把文字和注释都放在这个标签里面。
<ruby>
的内部还有许多配套的标签。
(1)<rp>
<rp>
标签的用处,是为不支持语音注释的浏览器,提供一个兼容方案。对于那些支持语音注释的浏览器,该标签的内容不显示。
<rp>
标签一般用于放置圆括号,如果遇到不支持的浏览器,就会将语音注释显示在括号里面。
<ruby>
汉<rp>(</rp><rt>han</rt><rp>)</rp>
字<rp>(</rp><rt>zi</rt><rp>)</rp>
</ruby>
上面代码在不支持语音注释的浏览器中,渲染结果为汉(han)字(zi)
。遇到支持语音注释的浏览器,就不会显示圆括号。
(2)<rt>
<rt>
标签用于放置语音注释。
(3)<rb>
<rb>
标签用于划分文字单位,与语音注释一一对应。
<ruby>
<rb>汉</rb><rb>字</rb>
<rp>(</rp>
<rt>han</rt>
<rt>zi</rt>
<rp>)</rp>
</ruby>
上面例子中,汉字
这两个字是写在一起的,<rb>
标签用于每个字划分出来,跟<rt>
标签一一对应。
注意,Chrome 浏览器目前不支持这个标签。
(4)<rbc>
,<rtc>
<rbc>
标签表示一组文字,通常包含多个<rb>
元素。<rtc>
标签表示一组语音注释,跟<rbc>
对应。
<ruby style="ruby-position: under;">
<rbc>
<rb>汉</rb><rp>(</rp><rt>han</rt><rp>)</rp>
<rb>字</rb><rp>(</rp><rt>zi</rt><rp>)</rp>
</rbc>
<rtc style="ruby-position: over;">
<rp>(</rp><rt>Chinese</rt><rp>)</rp>
</rtc>
</ruby>
上面例子中,汉字
这两个字有两组语音注释,分别是汉语拼音与英语。一组语音注释放在<rbc>
标签中,另一组语音注释放在<rtc>
,用来对应<rbc>
。同时,分别使用style
属性,指定汉语拼音显示在文字下方,英语显示在文字上方。
注意,Chrome 浏览器目前不支持这两个标签。