目的 : 掌握使用requests库生成GET请求 掌握使用requests库上传请求头中的User-Agent信息 掌握使用requests库查看返回的请求头 掌握使用requests库查看返回的状态码 掌握使用requests库识别网页页面内容编码,并正确显示页面内容 设备 : 计算机、windows7、Python、Pycharm 课时 : 2 课时 地点 : 专业机房 任务一: 编写代码,用requests库实现京东的页面内容抓取 1 、任务步骤: 确定爬取的目标网页链接。 在pycharm中编写代码实现爬虫功能。 2 、任务提交要求: 提交爬取的目标网站页面截图。 提交爬取的代码以及运行结果的截图。 程序第一行为注释,内容为:小组 + 姓名 任务二:编写代码,用requests库实现抓取百度搜索“python”关键字的页面 1 、任务步骤: 确定爬取的目标网页链接。 在pycharm中编写代码实现爬虫功能。 2 、任务提交要求: 提交爬取的目标网站页面截图。 提交爬取的代码以及运行结果的截图。 程序第一行为注释,内容为:小组 + 姓名 任务三: 编写代码,用requests库实现爬取亚马逊的页面 1 、任务步骤: 确定爬取的目标网页链接。 在pycharm中编写代码实现爬虫功能。 2 、任务提交要求: 提交爬取的目标网站页面截图。 提交爬取的代码以及运行结果的截图。 程序第一行为注释,内容为:小组 + 姓名