机器学习中生成模型和判别模型是什么

发布时间：2021-12-08 11:57:02 作者：iii
来源：亿速云阅读：175

本篇内容介绍了“机器学习中生成模型和判别模型是什么”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！

两个模型是啥

我们从几句话进入这两个概念：
1、机器学习分为有监督的机器学习和无监督的机器学习；
2、有监督的机器学习就是已知训练集数据的类别情况来训练分类器，无监督的机器学习就是不知道训练集的类别情况来训练分类器；
3、所以说，有监督的机器学习可以抽象为一个分类 task，而无监督的基本完成的是聚类；
4、有监督的机器学习中，我们可以概述为通过很多有标记的数据，训练出一个模型，然后利用这个，对输入的X进行预测输出的Y。这个模型一般有两种：

决策函数：Y=f(X)
条件概率分布：P(Y|X)

5、根据通过学习数据来获取这两种模型的方法，我们可以分为判别方法和生成方法；

6、概念正式介绍

判别方法：由数据直接学习决策函数Y=f(X)或条件概率分布P(Y|X)作为预测模型，即判别模型。判别方法关心的是对于给定的输入X，应该预测什么样的输出Y。

数据直接学习决策函数 Y=f(X) 或条件概率分布 P(Y|X) 得到的预测模型，就是判别模型；

生成方法：由数据学习联合概率分布P(X,Y), 然后由P(Y|X)=P(X,Y)/P(X)求出概率分布P(Y|X)作为预测的模型。该方法表示了给定输入X与产生输出Y的生成关系

P(Y|X)作为的预测的模型就是生成模型；

两个模型的范例

生成模型：朴素贝叶斯(Naive Bayes)、隐马尔可夫（EM 算法）
判别模型：k近邻法、感知机、决策树、逻辑回归、线性回归、最大熵模型、支持向量机(SVM)、提升方法、条件随机场（CRF），神经网络

对比

1、生成模型可以还原出联合概率分布（还原数据本身相似度），而判别方法不能；
2、生成方法的学习收敛速度更快，当样本容量增加的时候，学到的模型可以更快的收敛于真实模型；
3、当存在隐变量时，仍可以利用生成方法学习，此时判别方法不能用；
4、判别学习不能反映训练数据本身的特性，但它寻找不同类别之间的最优分类面，反映的是异类数据之间的差异，直接面对预测，往往学习的准确率更高，由于直接学习P(Y|X)或Y=f（X），从而可以简化学习；
5、简单的说，生成模型是从大量的数据中找规律，属于统计学习；而判别模型只关心不同类型的数据的差别，利用差别来分类。

机器学习中生成模型和判别模型是什么

判别模型 是在你生父身高超过180的已知条件下，预测你身高会不会超过180。如果你生父比180高，那么你比180高的概率会增加。但是全世界人身高的概率分布暂时并没有改变。（为了科学的严谨，这里爸爸已经改成了生父而非父亲）

生成模型 则是随机赐予你一个成年后的最高身高。身高超过180的概率是多少，这个概率只能依照全世界所有成人的身高的频率分布来决定。

“机器学习中生成模型和判别模型是什么”的内容就介绍到这里了，感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站，小编将为大家输出更多高质量的实用文章！

机器学习中生成模型和判别模型是什么

两个模型是啥

两个模型的范例

对比

相关阅读