广义线性混合模型(GLMM)的效应量如何计算?
- 广义线性模型和广义线性混合模型怎么区分使用
- 广义估计方程,广义多水平模型和广义混合效应模型的区别和联系
- 广义线性模型和广义线性混合模型怎么区分使用
- 计量经济学:Yi=3+β1exp(β2X2i+ui) 1.将模型线性化 2.如果 β1*和β2*是通过线性化后所得的OLS
广义线性模型和广义线性混合模型怎么区分使用
广义线性模型(GLM)。这种模型是把自变量的线性预测函数当作因变量的估计值。在机器学习中,有很多模型都是基于广义线性模型的,比如传统的线性回归模型,最大熵
模型,Logistic回归,softmax回归。
广义线性模型GLM很简单,举个例子,药物的疗效和服用药物的剂量有关。这个相关性可能是多种多样的,可能是简单线性关系(发烧时吃一片药退烧0.1度,两片药退烧0.2度,以此类推;这种情况就是一般线性模型),也可能是比较复杂的其他关系,如指数关系(一片药退烧0.1度,两片药退烧0.4度),对数关系等等。这些复杂的关系一般都可以通过一系列数学变换变成线性关系,以此统称为广义线性模
而对于广义线性混合模型GLMM比较复杂,GLM要求观测值误差是随机的,而GLMM则要求误差值并非随机,而是呈一定分布的。举个例子,我们认为疗效可能与服药时间相关,但是这个相关并不是简简单单的疗效随着服药时间的变化而改变。更可能的是疗效的随机波动的程度与服药时间有关。比如说,在早上10:00的时候,所有人基本上都处于半饱状态,此时吃药,相同剂量药物效果都差不多。但在中午的时候,有的人还没吃饭, 有的人吃过饭了,有的人喝了酒,结果酒精和药物起了反应,有的人喝了醋,醋又和药物起了另一种反应。显然,中午吃药会导致药物疗效的随机误差非常大。这种疗效的随机误差(而非疗效本身)随着时间的变化而变化,并呈一定分布的情况,必须用广义线性混合模型了。
广义估计方程,广义多水平模型和广义混合效应模型的区别和联系
对于这两个模型,我们讨论一下线性模型(我只做过线性的。。。)
首先,混合线性模型的模型是

其中b是固定效应向量,e是随机效应向量,在公式中包括残差就有了r+1个随机效应。这里的y就是我们重复观测到的值。
1972年Nelder和Wedderburn在《Generalized Linear Models》首次提出了广义线性模型(Generalized Linear Models, GLM)。由于线性回归在引用上有两个缺陷,一是它适用于因变量y取连续值的情况,特别不适用于分类数据;二是y的期望与自变量x用线性关系

相联系,选择面太窄,不符合实际。而广义线性模型刚好解决的这两个问题。
广义线性的模型

其中,h是一个连接函数,可以是正太分布,泊松分布以及伯努利分布。是效应向量,是设计矩阵。
根据y的分布下,我们能使用不同的连接函数。
 for the normal,
 for the Poisson,
 for the Bernoulli。
从这里可以看出,线性模型就是广义线性模型的一种特殊形式。
以上。
广义线性模型和广义线性混合模型怎么区分使用
如果X3不是数值型的,那么直接使用GLM就可以了,如果是数值型的,需要用As.factor(x)来转换一下。
计量经济学:Yi=3+β1exp(β2X2i+ui) 1.将模型线性化 2.如果 β1*和β2*是通过线性化后所得的OLS
这是模型是指数型的,可以使用半对数模型。
对原模型:Yi=3+β1exp(β2X2i+ui)
将常数3移到左边:Yi-3=β1exp(β2X2i+ui)
两边取对数:ln(Yi-3)=ln(β1)+β2X2i+ui
此即线性化模型,其中,因变量是在原来的模型的因变量中减去3后取对数
则得到的模型与现线性模型y=a+bx+ui等价,这里y=ln(Yi-3) a=ln(β1) b=β2
使用OLS即可估计出a b再通过计算解出 β1 β2