GPU 加速机器学习

开放测试:加速 SCIKIT-LEARN、UMAP、
以及 HDBSCAN,无需更改任何代码

零代码更改加速

使用 scikit-learn、UMAP 或 HDBSCAN 的轻松和熟悉性编写代码。只需加载 cuml.accel 并在 GPU 上运行代码即可获得最高性能。


适用于各种用例的算法

加速分类、回归、降维和聚类中最常用的估算器。

更快地训练模型

流行机器学习算法的训练时间提高高达 50 倍。减少等待时间,将更多时间用于优化模型。


设备无关代码

在 CPU 上开发,并在 GPU 上部署。反之亦然。所有这些都无需更改代码。

将 GPU 加速
带给每一位 scikit-learn 用户

如何使用

要加速 IPython 或 Jupyter Notebooks,请使用 magic 命令

%load_ext cuml.accel
import sklearn
...


要加速 Python 脚本,您可以在命令行中使用 Python 模块标志

python -m cuml.accel script.py

或者,如果您无法使用命令行标志,可以通过导入在代码中显式启用 cuml.accel

import cuml.accel
cuml.accel.install()

import sklearn
...

工作原理

幕后原理

加载 cuml.accel 后,导入 scikit-learn(或 umap-learn 或 hdbscan)将使 cuML 能够“拦截”这些 CPU 模块中的估算器。当您创建一个新的估算器来运行机器学习算法时,将转而创建一个“代理估算器”。

In [1]: %load_ext cuml.accel
In [2]: from sklearn.cluster import KMeans

In [3]: type(KMeans)
Out[3]: cuml.internals.base_helpers.BaseMetaClass;


在 cuML 中实现的估算器将尽可能调度在 GPU 上运行,否则将回退到 CPU 库。这适用于您代码中的 scikit-learn 操作,以及您可能正在使用的第三方库。


如果在 GPU 上构建了模型,然后调用了 cuML 中未实现的方法,cuml.accel 将在 CPU 上重新构建模型,并优雅地回退到等效的 scikit-learn 函数。

执行流程

开始使用
加速机器学习

立即在 Colab 上尝试

使用您的 Google 帐户,在一个免费的 GPU 启用的 Notebook 环境中开始加速您的机器学习工作流程。 在 Colab 上启动


cuML 的加速器与所有其他 RAPIDS 库都能顺畅协作。访问 RAPIDS 快速入门,在您喜欢的平台上开始使用任何 RAPIDS 库。

了解更多

cuML 加速的 scikit-learn 处于开放测试阶段并正在积极开发中。它已可广泛使用,但某些估算器存在已知问题和限制。通过文档了解更多信息发布博客


想贡献或分享反馈,请通过 GitHub 联系我们