你的位置:zooskool兽vixen-被窝网电影院手机官网-俄罗斯人 > 被窝网电影院手机官网 > 2021 年 Python 十佳 ML 库大盘点,国产选手 GitHub 半年获 5k+star,第别名是升级版 NumPy
2021 年 Python 十佳 ML 库大盘点,国产选手 GitHub 半年获 5k+star,第别名是升级版 NumPy
发布日期:2021-12-28 21:41    点击次数:183

2021 年里 AI 飞速发展,特出算法习以为常,令吾们大开眼界。

而真实要将这些算法实现,必定少不了Python这个主流机器学习说话的添持。

今年各大公司和钻研幼组都推出了一系列方便行使的高性能开源库,其中还不乏一些国产的特出作品。

在这边将盘点出最佳的 10 名,致力于帮你解决各栽题目。

倘若你还在为模型训练中的 " 杂务 " 头疼,那就快来望望吧。

1. Awkward Array

按照官方介绍,Awkward Array用于嵌套的、大幼纷歧的数据,包括肆意长度的列外、记录、同化的类型和缺失数据,行使首来相通NumPy。

望首来像是升级版的 NumPy 呀。

自然,差别长度的数组能够直接放在一首运算。

并且,官方外示Awkward Array不光行使首来更浅易,在速度和内存上也有量级的上风。

望望是不是能够安排上了~

https://pypi.org/project/awkward/

2. Jupytext

笃信行家对 Jupyter Notebook 都不生硬。

当你有了Jupytext这个幼插件就能够将 Jupyter Notebook 和IDE完善结相符,听首来是不是很棒!

从此 Jupyter Notebook 能够被存储为Markdown文件或多栽说话的脚本文件。

Jupytext 能够做的事主要有:

Jupyter Notebook 的版本控制

在你爱的文本编辑器中编辑、相符并或重构 Notebook

在 Notebook 上行使 Q&A 检查

在 Python 中行使的样子:

此项现在在 Github 上已有 5k+star。

https://github.com/mwouts/jupytext

3. Gradio

比 Streamlit 还轻量的UI 设计库,Gradio让你轻盈在涉猎器中 " 玩转 " 你的模型,能够直接在涉猎器中拖放图片,粘贴文字,录制声音,等等。

只要将 launch ( ) 函数中的参数竖立为 share=True,还能得到一个可分享的网址,拿到链接的朋侪在电脑和手机端都能掀开,活脱脱就是一个幼程序。

往往必要做Demo的幼同伴快望首来吧,此项现在在 Github 上已有 4.5k+star。

https://github.com/gradio-app/gradio

4. Hub

这个Hub在数据管理和数据预处理上可是一把益手。

它能够处理任何类型,任何大幼的数据,并且由于数据蓄积在云端上,于是能够无缝在任何机器上访问。

被压缩为二进制字节的数据能够被存储在任何地方,并且只有在必要的时候才会被获取,于是异国 TB 级硬盘也能够处理TB 级数据。

Hub 贴心地挑供了主要API,声援数据在常用工具(PyTorch 等)上的行使,数据版本控制,数据转换等功能。

此项现在在 github 上已有 4.1k+star。

https://github.com/activeloopai/Hub

5. AugLy

AugLy是 facebook 最新推出的数据添强库,同时声援语音,文本,图像和视频类型的数据,包含了100 多栽添强手段。

数据对于模型训练至关主要,而标注大周围数据相等难得。由于人力资源,和模型特性的控制,数据添强的行使越来越普及。

AugLy 的益处:

处理类型更为周详。其他的数据添强库,例如 Albumentations 和 NVIDIA DALI,主要负责图像有关数据的处理,文字数据不声援。

处理手段相等人性化。AugLy 能够将一张图片做成备忘录,在图片 / 视频上叠添文字 /Emojis,转发外交媒体上的截图,还能够协助你处理诸如拷贝检测、怨恨言论检测或版权侵权等题目。

此项现在在 Github 上已有 4.1k+star。

https://github.com/facebookresearch/AugLy

6. Evidently

Evidently是用来监测模型造就的工具,可从 Pandas DataFrame 或 csv 文件中生成交互式可视化通知和JSON 格式的造就简介。在 Jupyter Notebook 中能够行使。

现在能够挑供6 栽通知:数据漂移、数值现在的漂移、分类现在的漂移、回归模型性能、分类模型性能和概率分类模型性能。

此项现在在 Github 上已有 1.8k+star。

https://github.com/evidentlyai/evidently

7. YOLOX

倘若你熟识 YOLO 的话,那你也许会对旷视今年推出的YOLOX感有趣。

YOLO 就是谁人现在的检测算法,能够被行使在汽车自动驾驶等前沿技术中。

而YOLOX是 YOLO 的无锚版本,设计更浅易,但性能更益!它的现在的是在钻研界和工业界之间架首一座桥梁,同时弥相符两方之间的差距。

这个 Github 上的开源项现在在短短半年内已获得 5.2k+star。

https://github.com/Megvii-BaseDetection/YOLOX

8. LightSeq

正如它的名字相通,LightSeq是一款由字节跳动开发的声援 BERT、GPT、Transformer 等多多模型的超快推理引擎。

能够望到它的外现,比 FasterTransformer 还要Fast。

LightSeq 声援的模型也是专门周详。

总之就是两个字 " 益用 "。此项现在在 Github 上已有 1.9k+star。

https://github.com/bytedance/lightseq

9. Greykite

想展望COVID-19的恢复速度吗?那就来望望 LinkedIn 为了自家时间序列展望需求开发的Greykite吧。

功能周详(多栽时间趋势),界面直不悦目,展望速度快和可扩展性强是它最大的亮点。

被行使在上面的三大算法:

Silverkite ( Greykite ’ s flagship algorithm )

Facebook Prophet

Auto Arima

感有趣的话就往钻研望望吧,此项现在在 Github 上已有 1.4k+star。

https://github.com/linkedin/greykite

10. Jina and Finetuner

现在,在搜索引擎等行使上,语义识别的地位越来越高,由于它能够有效避免字词匹配的局限。

不过语义识别涉及的神经网络能够会让许多人感到头大,Jina和Finetuner能够帮你解决这些题目。

Jina 是一个神经搜索框架,使任何人都能在几分钟内竖立可扩展的深度学习搜索行使程序。

Finetuner 互助 Jina 协助你对神经网络进走调参,以获得神经搜索义务的最佳终局。

Jina 和 Finetuner 正当没什么经验,又想尝试的朋侪。

https://github.com/jina-ai/finetuner

参考链接:

https://tryolabs.com/blog/2021/12/21/top-python-libraries-2021