尊敬的老师:
您好。现想咨询老师,关于固定效应与随机效应的选择问题。在做面板泊松模型时,xtset后添加了股票代码和年份,经过hausman检验后表明较适合固定效应,但是在固定效应回归时会丢失(drop)大量样本(70%左右),而随机效应则样本丢失较少,这种情况下该如何选择以及样本丢失(drop)的原因,期待老师您在百忙中的回复。谢谢!
在面板数据模型中,固定效应模型得到的是组内估计量,如果因变量或者自变量为不随时间变化的变量,即这些变量不存在组内的variance,这些样本将会被drop掉。随机效应模型在估计的时候既会使用组内信息,也会使用组间信息,所以不会损失变量和样本量。
在你的问题里,估计是因为在组内存在比较多的不随时间变化的变量(泊松模型里面可能组内不变的比较多,被解释变量0,1,2,3....,其中有不变的,比如去年被逮捕的次数是1次,前年也是1次....,多年都没被逮捕,逮捕次数为0,可能0值太多,没有变化),在采用固定效应模型时被自动drop掉了,导致样本损失比较大。建议你随机效应和固定效应都做,然后用hausman检验看一下结果是否有显著差异,如果没有显著差异,随机效应更好,因为它估计效率高;如果差异显著,还是用固定效应。