Version 0.2.2

本次发布新增以下特性:

特征工程

  • 特征衍生

  • 特征降维

数据清洗

  • 特殊空值字符处理

  • 列类型校正

  • 常量列清理

  • 重复列清理

  • 删除标签列为空的样本

  • 非法值替换

  • id列清理

  • 共线性特征清理

数据集拆分

  • 对抗验证

建模算法

  • XGBoost

  • Catboost

  • LightGBM

  • HistGridientBoosting

模型训练

  • 自动任务类型推断

  • 命令行工具

评估方法

  • 交叉验证(Cross-Validation)

  • Train-Validation-Holdout验证

搜索算法

  • 蒙特卡洛树算法

  • 进化算法

  • 随机搜索算法

不平衡数据处理

  • 类平衡(Class Weight)

  • 降采样(Under -Samping)支持

    • Near miss

    • Tomeks links

    • Random

  • 过采样(Over-Samping)支持

    • SMOTE

    • ADASYN

    • Random

提前停止策略

  • n次搜索都不再提升,提前停止

  • 最大用时提前停止

  • 到达预期指标提前停止

高级特性

  • 二阶段搜索

    • 伪标签

    • 特征选择

  • 概念漂移处理

  • 模型融合