爬虫前需要掌握一点html

论坛 期权论坛 期权     
卡萨布兰卡JM   2019-7-21 06:21   2378   0
再忙也要听听歌!
--来日你我再度相见,仍是旧日动人笑面

HTTP基础知识对于爬虫的作用

HTTP–超文本传输协议(HyperText Transfer Protocol)是互联网中应用最为广泛的一种网络协议,设计的最初目的就是为了提供一种发布和接受HTML页面的方法,而爬虫的本质就是通过程序发生HTTP请求,并返回HTML文档,遵守HTTP的传输协议是爬虫的基础。

了解一些常用的html标签知识对今后的爬虫大有帮助!下面简单介绍一下一些常用的标签。

html常用的标签:
-:表示一个标题
  align:居中作用
:段落标签
:水平线标签
:换行标签
:下标
:上标
:原样标签:会保留,定格

项目列表标签:(dl dt dd)
行内标签:(span)
块标签:div标签会独立占一行

  html的标签作用:用于描述一个网页的结构

  如果需要操作数据的样式:通过标签的属性操作。

  标签的类型:
  1.有开始标签与结束标签。需要把网页的的数据内容封装到标签中。
  2.开始标签与结束标签都是在同一个标签体内的。

示例:
  1. [/code][code]
复制代码
复制代码
  1.   
复制代码
  1.   
复制代码
  1.   
复制代码
  1.   
复制代码
  1.   
复制代码
  1.   html常用的标签
复制代码
复制代码
复制代码
  1.            一步成诗
复制代码
  1. 东风夜放花千树,树下总有地,纵然宝马雕车飘香满路,路上可有你,走在大城市 过着小日,只怕越来越只有事 没有情,只怕永远都会怀疑 我走在何夕,你却在何地,算什么距离 靠什么运气,我和你之间 差了一步还是千里,由什么开始 没什么道理,有没有之间 不要忘记,有人走过七步成他的诗,愿我一步有我的你,春花陪我在这里,一个人等着更美丽,秋月在哪里,一个人等着爱你,众里寻他千百度,万里无故事
复制代码
  1. 东风夜放花千树,树下总有地,纵然宝马雕车飘香满路,路上可有你,走在大城市 过着小日,只怕越来越只有事 没有情,只怕永远都会怀疑 我走在何夕,你却在何地,算什么距离 靠什么运气,我和你之间 差了一步还是千里,由什么开始 没什么道理,有没有之间 不要忘记,有人走过七步成他的诗,愿我一步有我的你,春花陪我在这里,一个人等着更美丽,秋月在哪里,一个人等着爱你,众里寻他千百度,万里无故事错。
复制代码
复制代码
  1. 水的化学式 H2O
复制代码
  1. 2的16次方  216
复制代码
复制代码
复制代码
  1.   有序的列表标签
复制代码
  1.   无序的列表标签
复制代码
  1.                             静夜思
复制代码
  1.                     床前明月光,疑是地上霜。
复制代码
  1.                     举头望明月,低头思故乡。
复制代码
  1. [/code][code]
复制代码
  1. 今晚吃什么好
复制代码
  1.   
复制代码
  1.     烤鸭
复制代码
  1. [/code][code]    烤猪
复制代码
  1.   
复制代码
  1. 中午吃什么好
复制代码
  1.   
复制代码
  1.     木桶饭
复制代码
  1.     猪脚饭
复制代码
  1.   
复制代码
  1. 公司的组织结构
复制代码
  1.   
复制代码
  1.     技术总监
复制代码
  1.     码农1号
复制代码
  1.     码农2号
复制代码
  1.     人事总监
复制代码
  1.     妹子1号
复制代码
  1.     妹子2号
复制代码
  1.     妹子3号
复制代码
  1. 我们在学习html明天放假
复制代码
  1.   
复制代码
复制代码
[code][/code]
效果:





实体标签
为什么要学实体标签:
因为>
分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:
帖子:
精华:
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP