DevWeekly/docs/9-pyhubweekly.md

6.7 KiB
Raw Permalink Blame History

前言

PyHubWeekly每周定期更新精选GitHub上优质的Python项目/小工具。

如果喜欢,麻烦给个Star支持一下吧。此外,欢迎大家通过提交issue来投稿和推荐自己的项目~

本期为大家推荐GitHub上5个优质的Python项目它们分别是

  • pre-commit
  • beets
  • Picard
  • pydantic
  • airflow

下面分别来介绍一下上述5个GitHub项目。

pre-commit

Star4k

代码规范检查是项目上线过程中必不可少的一环,在大多数情况下,我们都是把代码提交到代码库再进行静态检查。但是,为什么不从最源头把这个问题解决呢?

pre-commit是一款由Python开发的git hooks工具,它能够在合入代码,提交commit时对代码进行规范检查和格式化,这样就能够从根源上解决代码规范的问题,而不是把代码合入到代码库中再统一解决,这样不仅耗时,而且繁琐。

我们下面以Python项目中使用为例进行介绍但是它不仅适用于Python它能够适用于所有编程语言

安装

pip install pre-commit

配置文件

安装之后需要修改一下配置文件,.pre-commit-config.yaml

repos:
-   repo: https://github.com/pre-commit/pre-commit-hooks
    rev: v2.3.0
    hooks:
    -   id: check-yaml
    -   id: end-of-file-fixer
    -   id: trailing-whitespace
-   repo: https://github.com/psf/black
    rev: 19.3b0
    hooks:
    -   id: black

使用

pre-commit install
git commit -m "Add super awesome feature"

提交commit之后就可以看到,它会用到两个工具blackflake8。black我在第七期介绍过这款工具它是一款高效的代码格式化工具用于修改代码格式。flake8是一款格式检查工具。

beets

Star9.2k

beets是一款音乐收藏辅助工具,它能够让音乐收藏一劳永逸。它会对你的集合进行分类,并在此过程中自动增强其元数据。然后,它通过提供的一组工具来操作和访问你的音乐。

安装

pip install beets

具体使用教程可以查看文档

Picard

Star2k

Picard是一款由Python开发的跨平台音乐标记工具它能够在Linux/Mac OS X/Windows多个平台上进行使用。

Picard支持大多数音频文件格式能够使用音频AcoustIDs执行CD查找和磁盘ID提交并且具有出色的Unicode支持。

pydantic

Star2.5k

使用过Python的应该都很清楚Python是一种对数据类型非常弱化的一种编程语言。在编写Python程序时你不需要去关心数据的类型。但是这对于阅读代码和调试代码却带来了很多麻烦因此我们还是需要养成C++/Java那样的好习惯应该关注数据类型。

pydantic是一款使用Python类型提示对Python项目进行数据验证和设置管理的工具。

安装

pip install -U pydantic

示例

from datetime import datetime
from typing import List, Optional
from pydantic import BaseModel

class User(BaseModel):
    id: int
    name = 'John Doe'
    signup_ts: Optional[datetime] = None
    friends: List[int] = []

external_data = {'id': '123', 'signup_ts': '2017-06-01 12:22', 'friends': [1, '2', b'3']}
user = User(**external_data)
print(user)
#> User id=123 name='John Doe' signup_ts=datetime.datetime(2017, 6, 1, 12, 22) friends=[1, 2, 3]
print(user.id)
#> 123

通过上述示例我们可以看出通过继承pydantic中的BaseModel能够对传入的参数进行数据类型的校验和修正这样能够避免开发过程中难以定位的问题。

airflow

Star16k

airflow一个通过编程方式编写、调度和监视工作流的平台。

为什么调度、监视工作流的方式有很多却偏偏选择airflow呢

因为当工作流被定义为代码时它们变得更加可维护、版本化、可测试性和协作性通过定义airflow有向无环图工作流可以实现如下优点

  • 动态
  • 可扩展
  • 简洁清晰


推荐阅读


欢迎关注我的公众号“平凡而诗意”,原创技术文章第一时间推送,如果喜欢,麻烦点一下“在看”~