python api怎么用

1,290次阅读

没有评论

python

API：

Web应用编程接口（API）自动请求网站的特定信息而不是整个网页。因此即便数据瞬息万变，它呈现的信息也都是最新的。

一、使用Web API

Web API是网站的一部分，用于与使用非常具体的URL请求特定信息的程序交互。这种请求称为API调用。请求的数据将以易于处理的格式（如JSON或CSV）返回。依赖于外部数据源的大多数应用程序都依赖于API调用。

1、Git 和GitHub

我们将使用GitHub的API来请求有关该网站中Python项目的信息，GitHub（https://github.com/）的名字源自Git，Git是一个分布式版本控制系统，让程序员团队能够协作开发项目。

Git帮助大家管理为项目所做的工作，避免一个人所做的修改影响其他人所做的修改。

你在项目中实现新功能时，Git将跟踪你对每个文件所做的修改。确定代码可行后，你提交所做的修改，而Git将记录项目最新的状态。

（1）在Windows 系统中安装Git

要在Windows系统中安装Git，请访问http://msysgit.github.io/，并单击Download。

（2）配置Git

Git跟踪谁修改了项目，哪怕参与项目开发的人只有一个。为此，Git需要知道你的用户名和电子邮件地址。你必须提供用户名，但可以使用虚构的电子邮件地址：

$ git config --global user.name "username"
$ git config --global user.email "username@example.com"

（3）创建项目

在你的系统中创建一个文件夹，并将其命名为git_practice。在这个文件夹中，创建一个简单的Python程序：

hello_world.py

print("Hello Git world!")

我们将使用这个程序来探索Git的基本功能。

（4）忽略文件

扩展名为.pyc的文件是根据.py文件自动生成的，因此我们无需让Git跟踪它们。这些文件存储在目录__pycache__中。为让Git忽略这个目录，创建一个名为.gitignore的特殊文件（这个文件名以句点打头，且没有扩展名），并在其中添加下面一行内容：

.gitignore

__pycache__/

这让Git忽略目录__pycache__中的所有文件。使用文件.gitignore可避免项目混乱，开发起来更容易。

（5）初始化仓库

你创建了一个目录，其中包含一个Python文件和一个.gitignore文件，可以初始化一个Git仓库了。为此，打开一个终端窗口，切换到文件夹git_practice，并执行如下命令：

git_practice$ git init
Initialized empty Git repository in git_practice/.git/
git_practice$

输出表明Git在git_practice中初始化了一个空仓库。仓库是程序中被Git主动跟踪的一组文件。

Git用来管理仓库的文件都存储在隐藏的.git/中，你根本不需要与这个目录打交道，但千万不要删除这个目录，否则将丢弃项目的所有历史记录。

（6）检查状态

执行其他操作前，先来看一下项目的状态：

git_practice$ git status.

在Git中，分支是项目的一个版本。从这里的输出可知，我们位于分支master上。你每次查看项目的状态时，输出都将指出你位于分支master上。

接下来的输出表明，我们将进行初始提交。提交是项目在特定时间点的快照。

python

# Untracked files:

Git指出了项目中未被跟踪的文件，因为我们还没有告诉它要跟踪哪些文件。

nothing added to commit but untracked files present (use “git add” to track)

我们被告知没有将任何东西添加到当前提交中，但我们可能需要将未跟踪的文件加入到仓库中

2、使用API 调用请求数据

GitHub的API让你能够通过API调用来请求各种信息。这个调用返回GitHub当前托管了多少个Python项目，还有有关最受欢迎的Python仓库的信息。

https://api.github.com/search/repositories?q=language:python&sort=stars

第一部分（https://api.github.com/）将请求发送到GitHub网站中响应API调用的部分

第二部分（search/repositories）让API搜索GitHub上的所有仓库。

第三部分（repositories后面的？）指出我们要传递的实参

第四部分（q=）q表示查询，= 符号让我们能够开始指定查询（q=）

第五部分（language:python）指出只想获取主要语言为python的仓库的信息

第六部分（&sort=stars）指定将项目按其获得的星级进行排序。

3、安装requests

requests包让Python程序能够轻松地向网站请求信，息以及检查返回的响应

python

1. 导入了模块requests

2. 存储API调用的URL

3. 使用requests来执行调用，调用get()并将URL传递给它，再将响应对象存储在变量r中，响应对象包含一个名为status_code的属性，它让我们知道请求是否成功了。

4. 打印status_code，核实调用是否成功了。

5. API返回JSON格式的信息，因此我们使用方法json()将这些信息转换为一个Python字典。我们将转换得到的字典存储在response_dict中。

最后，打印response_dict中的键。

4、处理响应字典

将API调用返回的信息存储到字典中后，就可以处理这个字典中的数据了。

生成一些概述这些信息的输出，可确认收到了期望的信息，进而可以开始研究感兴趣的信息。

python

print("Total repositories:", response_dict['total_count'])

打印了与’total_count’相关联的值，它指出了GitHub总共包含多少个Python仓库。

与’items’相关联的值是一个列表，其中包含很多字典，而每个字典都包含有关一个Python仓库的信息。

repo_dicts = response_dict['items']
print("Repositories returned:", len(repo_dicts))

我们将这个字典列表存储在repo_dicts中。接下来，我们打印repo_dicts的长度，以获悉我们获得了多少个仓库的信息。

repo_dict = repo_dicts[0]

为更深入地了解返回的有关每个仓库的信息，我们提取了repo_dicts中的第一个字典，并将其存储在repo_dict中。

print("\nKeys:", len(repo_dict))

我们打印这个字典包含的键数，看看其中有多少信息。

for key in sorted(repo_dict.keys()):
    print(key)

我们打印这个字典的所有键，看看其中包含哪些信息。

python

5、概述最受欢迎的仓库

对这些数据进行可视化时，我们需要涵盖多个仓库。打印API调用返回的每个仓库的特定信息，以便能够在可视化中包含所有这些信息。

python

6、监视API 的速率限制

大多数API都存在速率限制，即你在特定时间内可执行的请求数存在限制。要获悉你是否接近了GitHub的限制，请在浏览器中输入https://api.github.com/rate_limit

python

“search”: {

搜索API的速率限制

“limit”: 10,

极限为每分钟10个请求

“remaining”: 8,

在当前这一分钟内，我们还可执行8个请求。

“reset”: 1426078803

reset值指的是配额将重置的Unix时间或新纪元时间（1970年1月1日午夜后多少秒）

用完配额后，你将收到一条简单的响应，由此知道已到达API极限。到达极限后，你必须等待配额重置。

注意：很多API都要求你注册获得API密钥后才能执行API调用。编写本书时，GitHub没有这样的要求，但获得API密钥后，配额将高得多。

Python教程学习网，免费的在线学习python平台，欢迎关注！

神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试

发表于：Python基础教程、Python爬虫

2020-01-25

# python入门

复制链接

赏

python api怎么用

相关文章：

HTTP代理设置详解：一步步配置指南

什么是Socks5代理IP及其优势

Socks5代理配置教程及注意事项

什么是代理服务器IP：如何选择合适的

国外代理服务器的优势及选择建议

如何找到可靠的免费代理服务器

在线代理服务器的使用与推荐

HTTP代理服务器的设置及应用实例

静态代理IP怎么填写：步骤与示例

海外静态IP的代理选择与配置