登录后查看更多精彩内容~
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
本帖最后由 15195775117 于 2022-10-6 12:26 编辑
1、估计器
传统机器学习算法已经由“机器学习库”---sklearn实现了,调用即可。
sklearn是开源访问,商用BSD许可证。
sklearn功能完善,包括了: 1、四大机器学习算法:分类、回归、降维、聚类; 2、三大模块:特征提取、数据处理、模型评估。
sklearn中实现了算法的API接口称【估计器(estimator)】,
估计器有2个重要方法: 1、fit,从训练集中学习模型参数(scipy多项式拟合函数的结果也是参数) 2、transform,用学习到的参数转换数据
估计器包括【分类器】和【回归器】 常用分类器有:SVN,KNN,贝叶斯,线性回归、逻辑回归、决策树、随机森林、XGBoost、GBDT、Boosting、神经网络
分类估计器 | sklearn.neighbors | 临近算法 | sklearn.naive_bayes | 贝叶斯 | sklearn.linear_model.LogisticRegression | 逻辑回归 | 回归估计器 | sklearn.linear_model.LinearRegression | 线性回归 | sklearn.Ridge | 岭回归 | 估计值分类 | 估计器(Estimator) | 用于分类,聚类,回归 | 转换器(Transformer) | 数据预处理和数据转换 | 流水线(Pipeline) | 组合数据挖掘流程 |
2、算法选择指导
对于不同的问题,需要选择不同的【估计器】,
3、数据库
机器学习需要数据,sklearn提供了数据库: https://scikit-learn.org/stable/modules/classes.html#module-sklearn.datasets
数据引用示例:
我们使用以上链接网页中的这个:
from sklearn import datasets X,y=datasets.make_regression(n_samples=100,n_features=1,n_targets=1,noise=1) # 其中的参数是自己设置的
4、一般使用流程
sklean一般使用流程为: 引入数据,选择算法,调参,预测,保存模型,迁移。
|