机器学习根底笔记, 什么是机器学习

admin认证作者

2024-12-23 11:43:263 阅读

导语：机器学习根底笔记可以分为以下几个部分：2.监督学习分类问题：猜测输出为离散值，如二分类（垃圾邮件检测）或多分类（图像辨认）。回归问题：猜测输出为接连值，如房价猜测。3.无监督学习聚类：将数据分红不同的组，每组内部相似度较高，组...

机器学习根底笔记可以分为以下几个部分：

2. 监督学习分类问题：猜测输出为离散值，如二分类（垃圾邮件检测）或多分类（图像辨认）。回归问题：猜测输出为接连值，如房价猜测。

3. 无监督学习聚类：将数据分红不同的组，每组内部相似度较高，组间相似度较低。降维：将高维数据转化为低维数据，一起保存尽可能多的信息。

4. 常用算法线性回归：用于回归问题，树立线性关系。逻辑回归：用于二分类问题，经过Sigmoid函数输出概率。决议计划树：用于分类和回归问题，经过树状结构进行决议计划。支撑向量机（SVM）：用于分类和回归问题，经过找到最大距离的超平面进行分类。随机森林：集成学习办法，结合多个决议计划树进行猜测。神经网络：模仿人脑神经元结构，用于复杂问题，如图像辨认、自然语言处理。

5. 模型评价准确率：正确猜测的份额。召回率：正确猜测正例的份额。 F1分数：准确率和召回率的谐和平均数。混杂矩阵：展现模型猜测成果的详细情况。

6. 过拟合与欠拟合过拟合：模型在练习数据上体现很好，但在新数据上体现差。欠拟合：模型在练习数据上体现差，在新数据上体现也差。正则化：经过增加赏罚项来避免过拟合。

7. 特征工程特征挑选：从原始特征中挑选最有用的特征。特征提取：从原始数据中提取新的特征。特征编码：将类别特征转化为数值特征。

8. 机器学习结构 TensorFlow：由Google开发，用于深度学习的开源结构。 PyTorch：由Facebook开发，用于深度学习的开源结构。 Scikitlearn：用于机器学习的Python库，供给各种算法和东西。

9. 实践项目数据搜集：获取用于练习和测验的数据。数据预处理：清洗、转化和归一化数据。模型练习：运用算法和练习数据练习模型。模型评价：运用测验数据评价模型功能。模型布置：将模型使用于实践场景。

10. 继续学习在线学习：模型在接收到新数据时进行更新。搬迁学习：运用一个已练习的模型来处理新问题。

这些笔记涵盖了机器学习的根底知识，为深化学习机器学习供给了结构。跟着技能的不断发展，机器学习范畴也在不断进步，新的算法和东西不断涌现。

机器学习根底笔记