小马&博客

不爱码字的小懒马儿

机器学习与sklearn


关于

  • 个人微信公众号: Mn2+
  • 个人博客首页
  • 注:学习交流使用!
  • 本文简介:机器学习与sklearn

正文

1、sklearn提供了分类、回归、聚类和降维4个类别的经典算法
(1)如果数据量小于50,一般是无法使用sklearn的机器学习算法建模的。
(2)如果数据有类别标签,请使用分类模型。
(3)如果数据需要预测精确值,请使用回归模型。
(4)如果想查看数据分布情况,可以考虑使用降维算法。
(5)如果数据没有类别标签,可以使用聚类算法。

2、sklearn环境配置
(1)如果你使用的Python环境是Anaconda,那么默认已经安装了sklearn。
(2)安装命令:
pip install scikit-learn

3、数据集
(1)人工智能的核心在于数据支持。
(2)在机器学习任务中,数据集有三大功能:训练、验证和测试。
① 训练即拟合模型的过程,模型会通过分析数据、调节内部参数从而得到最优的模型效果。
② 验证即验证模型效果,效果可以指导我们调整模型中的超参数(在开始训练之前设置参数,而不是通过训练得到参数),通常会使用少量未参与训练的数据对模型进行验证。
③ 测试的作用是检查模型是否具有泛化能力。
(3)自带的小型数据集
① load_iris:该数据集包含了150条鸢(yuan)尾花数据。
② load_boston:是关于波士顿房屋特征与房价之间关系的数据集,包含13个房屋特征。
③ load_digits:是一个比MNIST更小的手写数字图片数据集。
(4)在线下载的数据集
Fetch系列函数用于获取较大规模的数据集,这些数据集会自动从网上下载。
(5)计算机生成的数据集
用sklearn生成的数据集可以用来测试一些基础的模型功能,比如多分类数据集、聚类数据集以及高斯分布数据集等。

4、分类
(1)
(2)

5、


关注

  • 个人微信公众号:Mn2+

  • 哔哩哔哩:不爱码字的小懒马儿

  • GitHub

-------------本文结束感谢您的阅读-------------