生态系统

一个由硬件、
软件和开发者组成的生态系统

硬件

RAPIDS 运行在由 CUDA 驱动的硬件上,CUDA 是 NVIDIA 构建的 GPU 计算基础工具集。RAPIDS 适用于 PC、工作站、数据中心和云端。如需了解更多关于不同类型硬件的信息并找到最适合您使用案例的硬件,请访问 NVIDIA 的 数据科学硬件 产品页面

软件

RAPIDS 生态系统建立在强大的硬件基础之上,并通过 CUDA 进行并行化,它包括核心项目、扩展其功能的项目以及构建在 RAPIDS 之上的项目。

跳转到章节

开发者

我们希望您考虑将 RAPIDS 集成到您的解决方案或工作流程中。RAPIDS 专为 Python 和 C++ 开发者构建。使用 RAPIDS 构建伟大的事物。

跳转到章节

精选 RAPIDS 库

RAPIDS 生态系统的精选组件。

cuDF

PANDAS DATAFRAME PYTHON / C++

cuDF 是一个专为熟悉 pandas API 的用户设计的数据科学和工程库。在新的 pandas 加速器模式中使用 cuDF,无需更改代码即可加速 pandas 工作流程;或使用经典的纯 GPU 模式,以获得数据框上的最高性能。

GitHub
文档
路线图

libcudf

libcudf 提供了驱动 cuDF 的 CUDA C++ 构建模块。

GitHub
文档

cuML

SCIKIT-LEARN 机器学习 PYTHON / C++

cuML 是一个用于在 GPU 上执行机器学习算法的库,其 API 紧密遵循 scikit-learn API。将您的模型拟合时间从数小时或数分钟缩短到数秒。

GitHub
文档

libcuml

libcuml 提供了驱动 cuML 的 CUDA C++ 构建模块。

GitHub
文档

cuGraph

NETWORKX PYTHON / C++

cuGraph 是一个让图分析变得易于所有人的库。凭借遵循 NetworkX 的 Python API,您可以比以往更快地分析数百万节点的网络,而无需专门软件。

GitHub
文档

libcugraph

libcugraph 提供了驱动 cuGraph 的 CUDA C++ 构建模块。

GitHub
文档

cuSpatial

GEOPANDAS 地理空间 PYTHON / C++

cuSpatial 是一个用于闪电般快速空间分析的库。它与 GeoPandas 完全集成并快速发展,对于使用 GIS 工具的 Python 用户来说,这个工具包会感到很熟悉。

GitHub
文档
路线图

libcuspatial

libcuspatial 提供了驱动 cuSpatial 的 CUDA C++ 构建模块。

GitHub
文档

cuVS

向量搜索 PYTHON / C / C++ / RUST

cuVS 库包含用于近似最近邻和聚类的优化算法,以及许多用于加速向量搜索的其他基本工具。将 cuVS 集成到任何向量数据库或矢量化数据应用程序中,以优化信息检索的速度和效率。

GitHub
文档
cuVS 页面

RAFT

原语 算法 CUDA / PYTHON / C++

RAFT 包含 CUDA 加速的原语,用于快速组合分析,并被其他 RAPIDS 库使用。其构建模块包括密集代数、稀疏代数、空间计算、聚类、求解器和统计。

GitHub
文档

kvikIO

文件 IO GPU DIRECT STORAGE PYTHON / C++

通过强大的 cuFile 绑定,充分利用 GPU Direct Storage (GDS)。

GitHub
文档

libkvikio

libkvikio 提供了驱动 kvikIO 的 CUDA C++ 构建模块。

GitHub
文档

cuxfilter

仪表盘 可视化 PYTHON

使用一流的图表库,只需几行代码即可快速可视化和筛选大型数据集。

GitHub
文档
路线图

cuCIM

计算机视觉 图像处理 PYTHON

极大地加速您的计算机视觉和图像处理任务,尤其是生物医学成像。cuCIM 的 API 镜像了用于图像操作的 scikit-image 和用于图像加载的 OpenSlide。

GitHub
文档
路线图

更多...

请访问我们的 GitHub 组织页面 或我们的 文档 ,以获取更全面的项目列表。

RAPIDS 集成

将 RAPIDS 加速作为附加功能的项目和服务。

Spark RAPIDS

APACHE SPARK SQL

NVIDIA 将 RAPIDS 引入 Apache Spark,以加速 ETL 工作流程,无需更改代码,提高性能并降低总成本。

GitHub
文档

Dask

分布式 并行计算 PYTHON

使用 Dask 将您的工作负载扩展到多个 GPU 和多台机器。RAPIDS 还开发了 Dask-CUDA 库,用于 GPU 友好的集群部署

GitHub
文档

XGBoost

梯度提升 分类 PYTHON / C++

XGBoost 是分类和回归领域单模型性能的黄金标准。RAPIDS 从一开始就构建为可与这一卓越算法集成。

GitHub
文档

可视化

PLOTLY DASH HOLOVIZ CUXFILTER NODE RAPIDS PYTHON / JS

RAPIDS 与流行且功能强大的可视化项目集成,例如 Plotly Dash、HoloViz、Bokeh 等。

RAPIDS 可视化指南

云 / 部署

CSP HPC HPO 部署

RAPIDS 被构建为无论在哪里运行都能快速高效。了解如何在所有主要云服务提供商、使用开源超参数优化工具以及 Slurm 等高性能计算上运行 RAPIDS。

部署文档

RAPIDS 加速

使用 RAPIDS 构建的前沿软件。

Triton

推理 NVIDIA AI

Triton 推理服务器是 NVIDIA AI 平台的一部分,通过支持团队在任何基于 GPU 或 CPU 的基础设施上部署、运行和扩展来自任何框架的已训练 AI 模型,从而简化和标准化 AI 推理。

GitHub
了解更多

NeMo Curator

数据整理 PYTHON NEMO

NeMo Curator 是一个 Python 库,旨在实现可扩展和高效的数据集准备,通过使用 Dask 和 RAPIDS 进行 GPU 加速的数据整理,提高 LLM 训练精度。它提供了一个可定制和模块化的接口,简化了管道扩展,并通过准备高质量的 tokens 加速了模型收敛。

GitHub
了解更多

cuOpt

路径规划 NVIDIA AI

NVIDIA cuOpt 是一个运用 AI 帮助开发者创建复杂实时车队路径规划的运筹学优化 API。这些 API 可用于解决具有多重约束的复杂路径规划问题,并在亚秒级求解器响应时间内提供动态重新规划、作业调度和机器人模拟等新功能。

了解更多

Morpheus

网络安全 NVIDIA AI

NVIDIA Morpheus 是一个开放应用框架,使网络安全开发者能够创建优化的 AI 管道,用于过滤、处理和分类大量实时数据。

GitHub
文档

Clara

医疗 NVIDIA AI

NVIDIA Clara 是一个为医疗保健开发者、研究人员和医疗设备制造商创建 AI 解决方案以改善医疗服务和加速药物发现而提供的 AI 应用和加速框架平台。

了解更多
文档

MONAI

医学影像 CUCIM

RAPIDS cuCIM 已集成到 MONAI Transforms 组件中,以加速 GPU 上的数据病理训练管道。

GitHub
项目页面

Merlin

推荐系统 NVIDIA AI

NVIDIA Merlin 是一个开源库,提供端到端 GPU 加速的推荐系统。Merlin 利用 RAPIDS cuDF 和 Dask cuDF 进行 ETL 和推理期间的数据框转换,以及用于 TensorFlow、PyTorch 或 HugeCTR 中的优化数据加载器,以加速深度学习训练。

GitHub
了解更多

RAPIDS 工作流程

利用 RAPIDS 组件的复杂管道。

数据科学工作流程

集成和组合 RAPIDS 库形成强大的工作流程,优化数据科学管道。在我们的使用案例章节 中了解更多实际工作流程和精选成功案例

MLOps 指南

通过我们的云机器学习示例仓库部署页面 上的这些机器学习操作、超参数优化和集成指南,在生产环境中部署和维护 RAPIDS

开发者

RAPIDS 开发者指南和资源。

维护者指南

RAPIDS 项目 Благодаря详细的维护者指南和操作流程保持内聚。在我们的维护者文档页面 上查找发布计划、获取 CI 帮助并保持最新状态

贡献指南

开源项目通过积极贡献保持健康发展。总体贡献指南可在我们的文档中找到。每个 RAPIDS 仓库还提供了有用且详细的贡献指南,例如 cuDF 的示例。请在RAPIDS 仓库 中查看每个项目的 README 和文档,了解其具体要求