安装HyperGBM

推荐使用condapip命令来安装HyperGBM(请提前准备好Python3.6以上版本的环境);如果您有Docker环境,也可以在Docker容器中安装并运行HyperGBM。

使用Conda

可以从 conda-forge 安装HyperGBM:

conda install -c conda-forge hypergbm

使用Pip

基本的,使用如下pip命令安装HyperGBM:

pip install hypergbm

可选的, 如果您希望在JupyterLab中使用HyperGBM, 可通过如下命令安装HyperGBM:

pip install hypergbm[notebook]

可选的, 如果您希望在DASK集群中运行HyperGBM, 可通过如下命令安装HyperGBM:

pip install hypergbm[dask]

可选的, 如果您希望在特征衍生时支持中文字符, 可通过如下命令安装HyperGBM:

pip install hypergbm[zhcn]

可选的, 如果您希望使用基于Web的实验可视化,可通过如下命令安装HyperGBM:

pip install hypergbm[board]

可选的, 如果您希望安装HyperGBM以及所有依赖包,则可通过如下形式安装:

pip install hypergbm[all]

使用Docker

HyperGBM支持在Docker容器中运行,您可在Dockerfile中通过 pip 安装HyperGBM,然后使用。

我们在Docker Hub中发布了一个参考镜像,可直接下载使用,该镜像中包括:

  • Python 3.8

  • HyperGBM及其依赖包

  • JupyterLab

Docker镜像tag命名规则:

  • <hypergbm_version>:Python + JupyterLab + HyperGBM + HyperGBM的notebook插件

  • <hypergbm_version>-cuda<cuda_version>-cuml<cuml_version>:上述 + CUDA toolkit + cuML

  • <hypergbm_version>-cuda<cuda_version>-cuda<cuml_version>-lgbmgpu:上述 + 支持GPU的LightGBM

下载镜像:

docker pull datacanvas/hypergbm

运行镜像:

docker run -ti -e NotebookToken="your-token" -p 8888:8888 datacanvas/hypergbm

打开浏览器,访问http://<your-ip>:8888,输入您设置的token即可开始使用。

安装 GPU 加速的依赖包

  • cuML and cuDF

HyperGBM利用NVIDIA RAPIDS中的 cuML 和 cuDF对数据处理进行加速,所以如果要利用GPU对HyperGBM进行加速的话,您需要在运行HyperGBM之前安装这两个软件。这两个软件的安装方法请参考 NVIDIA RAPIDS官网 https://rapids.ai/start.html#get-rapids .

  • 支持 GPU 的 LightGBM

通过默认方式安装的LightGBM并不能利用GPU进行训练,所以您需要自己编译和安装能够支持GPU的LightGBM。建议您在安装HyperGBM之前就安装好支持GPU的LightGMB,HyperGBM 安装程序会复用已经存在的软件包。关于如何在LightGBM中开启GPU支持的方法请参考其官网文档 LightGBM GPU Tutorial

  • 支持GPU的 XGBoost 和 CatBoost

通过默认方式安装的 XGBoost 和 CatBoost已经内置了对GPU的支持,所以您不要再做其他的动作。但是,如果您希望自己手动从源代码中编译和安装这两个软件的话,请开启他们支持GPU的选项。