1、Pandas:是一个Python包,旨在通过“标记”和“关系”数据进行工作,简单直观。它设计用于快速简单的数据操作、聚合和可视化,是数据整理的完美工具。
2、Numpy:是专门为Python中科学计算而设计的软件集合,它为Python中的n维数组和矩阵的操作提供了大量有用的功能。该库提供了NumPy数组类型的数学运算向量化,可以改善性能,从而加快执行速度。
3、SciPy:是一个工程和科学软件库,包含线性代数,优化,集成和统计的模块。SciPy库的主要功能是建立在NumPy上,通过其特定子模块提供有效的数值例程,并作为数字积分、优化和其他例程。
4、Matplotlib:为轻松生成简单而强大的可视化而量身定制,它使Python成为像MatLab或Mathematica这样的科学工具的竞争对手。
5、Seaborn:主要关注统计模型的可视化(包括热图),Seaborn高度依赖于Matplotlib。
6、Bokeh:独立于Matplotlib,主要焦点是交互性,它通过现代浏览器以数据驱动文档的风格呈现。
7、Plotly:是一个基于Web用于构建可视化的工具箱,提供API给一些编程语言(Python在内)。
8、Scikits:是Scikits
Stack额外的软件包,专为像图像处理和机器学习辅助等特定功能而设计。它建立在SciPy之上,中集成了有质量的代码和良好的文档、简单易用并且十分高效,是使用Python进行机器学习的实际行业标准。
9、Theano:是一个Python软件包,它定义了与NumPy类似的多维数组,以及数学运算和表达式。此库是被编译的,可实现在所有架构上的高效运行。
10、TensorFlow:是数据流图计算的开源库,旨在满足谷歌对训练神经网络的高需求,并且是基于神经网络的机器学习系统DistBelief的继任者,可以在大型数据集上快速训练神经网络。
11、Keras:是一个用Python编写的开源的库,用于在高层的接口上构建神经网络。它简单易懂,具有高级可扩展性。
12、NLTK:主要用于符号学和统计学自然语言处理(NLP)的常见任务,旨在促进NLP及相关领域(语言学,认知科学人工智能等)的教学和研究。
13、Gensim:是一个用于Python的开源库,为有向量空间模型和主题模型的工作提供了使用工具。这个库是为了高效处理大量文本而设计,不仅可以进行内存处理,还可以通过广泛使用NumPy数据结构和SciPy操作来获得更高的效率。
…………
Python常用库大全,看看有没有你需要的。
环境管理
管理 Python版本和环境的工具
p–非常简单的交互式 python版本管理工具。
pyenv–简单的 Python版本管理工具。
Vex–可以在虚拟环境中执行命令。
virtualenv–创建独立 Python环境的工具。
virtualenvwrapper- virtualenv的一组扩展。
包管理
管理包和依赖的工具。
pip– Python包和依赖关系管理工具。
pip-tools–保证 Python包依赖关系更新的一组工具。
conda–跨平台,Python二进制包管理工具。
Curdling–管理 Python包的命令行工具。
wheel– Python分发的新标准,意在取代 eggs。
包仓库
本地 PyPI仓库服务和代理。
warehouse–下一代 PyPI。
Warehousebandersnatch– PyPA提供的 PyPI镜像工具。
devpi– PyPI服务和打包/测试/分发工具。
localshop–本地 PyPI服务(自定义包并且自动对 PyPI镜像)。
分发
打包为可执行文件以便分发。
PyInstaller–将 Python程序转换成独立的执行文件(跨平台)。
dh-virtualenv–构建并将 virtualenv虚拟环境作为一个 Debian包来发布。
Nuitka–将脚本、模块、包编译成可执行文件或扩展模块。
py2app–将 Python脚本变为独立软件包(Mac OS X)。
py2exe–将 Python脚本变为独立软件包(Windows)。
pynsist–一个用来创建 Windows安装程序的工具,可以在安装程序中打包 Python本身。
构建工具
将源码编译成软件。
buildout–一个构建系统,从多个组件来创建,组装和部署应用。
BitBake–针对嵌入式 Linux的类似 make的构建工具。
fabricate–对任何语言自动找到依赖关系的构建工具。
PlatformIO–多平台命令行构建工具。
PyBuilder–纯 Python实现的持续化构建工具。
SCons–软件构建工具。
交互式解析器
交互式 Python解析器。
IPython–功能丰富的工具,非常有效的使用交互式 Python。
bpython-界面丰富的 Python解析器。
ptpython–高级交互式Python解析器,构建于python-prompt-toolkit之上。
文件
文件管理和 MIME(多用途的网际邮件扩充协议)类型检测。
imghdr–(Python标准库)检测图片类型。
mimetypes–(Python标准库)将文件名映射为 MIME类型。
path.py–对 os.path进行封装的模块。
pathlib–(Python3.4+标准库)跨平台的、面向对象的路径操作库。
python-magic-文件类型检测的第三方库 libmagic的 Python接口。
Unipath-用面向对象的方式操作文件和目录
watchdog–管理文件系统事件的 API和 shell工具
日期和时间
操作日期和时间的类库。
arrow-更好的 Python日期时间操作类库。
Chronyk– Python 3的类库,用于解析手写格式的时间和日期。
dateutil– Python datetime模块的扩展。
delorean-解决 Python中有关日期处理的棘手问题的库。
moment–一个用来处理时间和日期的Python库。灵感来自于Moment.js。
PyTime–一个简单易用的Python模块,用于通过字符串来操作日期/时间。
pytz–现代以及历史版本的世界时区定义。将时区数据库引入Python。
when.py–提供用户友好的函数来帮助用户进行常用的日期和时间操作。
文本处理
用于解析和操作文本的库。
通用
chardet–字符编码检测器,兼容 Python2和 Python3。
difflib–(Python标准库)帮助我们进行差异化比较。
ftfy–让Unicode文本更完整更连贯。
fuzzywuzzy–模糊字符串匹配。
Levenshtein–快速计算编辑距离以及字符串的相似度。
pangu.py–在中日韩语字符和数字字母之间添加空格。
pyfiglet-figlet的 Python实现。
shortuuid–一个生成器库,用以生成简洁的,明白的,URL安全的 UUID。
unidecode– Unicode文本的 ASCII转换形式。
uniout–打印可读的字符,而不是转义的字符串。
xpinyin–一个用于把汉字转换为拼音的库。
1、NumPy
NumPy是构建科学计算 stack的最基础的包。它为 Python中的 n维数组和矩阵的操作提供了大量有用的功能。该库还提供了 NumPy数组类型的数学运算向量化,可以提升性能,从而加快执行速度。
2、SciPy
SciPy是一个工程和科学软件库,包含线性代数、优化、集成和统计的模块。SciPy库的主
要功能建立在 NumPy的基础之上,它通过其特定的子模块提供高效的数值例程操作。SciPy的所有子模块中的函数都有详细的文档,这也是一个优势。
3、Pandas
Pandas是一个 Python包,旨在通过「标记(labeled)」和「关系(relational)」数据进行工作,简单直观。Pandas是 data wrangling的完美工具。它设计用于快速简单的数据操作、聚合和可视化。
4、Seaborn
Seaborn主要关注统计模型的可视化;这种可视化包括热度图(heat map),可以总结数据但也描绘总体分布。Seaborn基于 Matplotlib,并高度依赖于它。
5、Bokeh
Bokeh是一个很好的可视化库,其目的是交互式可视化,不过这个库独立于 Matplotlib,它通过现代浏览器以数据驱动文档(D3.js)的风格呈现。
6、Scikits
Scikits是 SciPy Stack的附加软件包,专为特定功能(如图像处理和辅助机器学习)而设计。其中最突出的一个是 scikit-learn。该软件包构建于 SciPy之上,并大量使用其数学操作,是使用 Python进行机器学习的实际上的行业标准。
7、Theano
Theano是一个 Python包,它定义了与 NumPy类似的多维数组,以及数学运算和表达式。该库是经过编译的,使其在所有架构上能够高效运行。这个库最初由蒙特利尔大学机器学习组开发,主要是为了满足机器学习的需求。
8、Keras
Keras是一个使用高层接口构建神经网络的开源库,它是用 Python编写的。它简单易懂,具有高级可扩展性。Keras极其容易上手,而且可以进行快速的原型设计,足以用于严肃的建模。
9、Gensim
Gensim是一个用于 Python的开源库,实现了用于向量空间建模和主题建模的工具。Gensim实现了诸如分层 Dirichlet进程(HDP)、潜在语义分析(LSA)和潜在 Dirichlet分配(LDA)等算法,还有 tf-idf、随机投影、word2vec和 document2vec,以便于检查一组文档(通常称为语料库)中文本的重复模式。
10、Scrapy
Scrapy是用于从网络检索结构化数据的爬虫程序的库。它现在已经发展成了一个完整的框架,可以从 API收集数据,也可以用作通用的爬虫。该库在接口设计上遵循著名的 Don』t Repeat Yourself原则——提醒用户编写通用的可复用的代码,因此可以用来开发和扩展大型爬虫。
转载请注明:片头模版 » python模块库大全(最受欢迎的)