书写筑明天

Dong Boyang weblog


  • 首页

  • 标签

  • 分类

  • 归档

  • 日程表

AsaTung:信息标记的三种形式与信息提取的一般方法概述

发表于 2019-07-17 | 更新于 2023-04-09

Ⅰ.信息的标记

  • 标记后的信息可形成信息组织结构,增加了信息维度
  • 标记的结构与信息一样具有重要价值
  • 标记后的信息可用于通信、存储或展示
  • 标记后的信息更有利于程序理解和应用
阅读全文 »

AsaTung:python网络爬虫与信息提取学习笔记

发表于 2019-04-18 | 更新于 2023-04-09

一. Requests库

1. requests库的安装: “以管理者身份”运行cmd,执行以下代码:

python -m pip install requests

2.HTTP协议

HTTP是一个基于“请求与响应”模式的无状态的应用层协议,采用URL作为定位网络资源的标识。URL是通过HTTP协议存取资源的Internet路径,一个URL对应一个数据资源。

HTTP协议可以对资源进行操作,有如下方法:

  • GET -请求获取URL位置的资源
  • HEAD -请求获取URL位置资源的响应消息报告,即获得该资源的头部信息
  • POST -请求向URL位置的资源后附加新的数据
  • PUT -请求向URL位置存储一个资源,覆盖原URL位置的资源
  • PATCH -请求局部更新URL位置的资源,即改变该处资源的部分内容
  • DELETE -请求删除URL位置存储的资源

通过URL和命令管理资源,操作都是独立无状态。

阅读全文 »
12

12 日志
8 标签
© 2023
<% if (page.mathjax){ %> <%- partial('mathjax') %> <% } %>