结合案例说说Tobit回归模型
一、tobit模型2.案例分析背景理论操作SPSSAU输出结果的文本分析分析3。在某些情况下,疑难解惑被解释为变量Y值的范围将受到限制。例如,在研究家庭医疗保险支出的影响因素时,如果家庭没有医疗支出,即所有数字为0,或者在研究家庭收入水平时,如果一些样本家庭根本没有收入,那么所有收入都是0,或者数据调查中的一个是收入超过10万,那么超过10万的具体数据是截止日期(如果没有超过10万,最多可以达到10万),例如,研究存款的影响因素,但有些样本存储为负(即负债非存储),等等,这应该是正常的正态数据,但它被解释为断层(删除),可以使用tobit研究模型(而不是常用的)ols线性回归)。
特别提示:存单样本图片
删除数据分为左删失两类leftcensor还有右删失rightcensor。上述中小于等于数字0的是左删失,10万是右删失;默认支持左删失和右删失的设置。如果不设置,完全等于普通ols线性回归。下面介绍使用情况-在线SPSS分析工具做tobit回归模型。
目前,有一项关于工资影响因素的研究被解释为变量ln工资,解释变量是年龄,是否结婚(数字1代表结婚,数字0代表未婚),子女数量,教育年限共4个。解释变量ln工资是工资对数,没有工资是数字0。显然,应该使用类似的数据ols线性回归,但考虑到数据中有很多工资为0(即没有工资),此时就可考虑使用tobit模型更合适。为了更方便地查看解释变量的数据分布,将ln工资直方图如下:存单样本图
从上图可以清楚地看出,数字被删除,也就是说,一些数据集中在数字0上。当然,在进行分析之前,可以考虑筛选数字大于0的数据ols如果筛选出线性回归(但这样做会降低样本利用率)ln工资大于0后,直方图如下:存单样本图片
很明显,筛选出来了ln工资大于0的数据明显服从正常分布和使用ols线性回归非常合适。正因为如此,tobit目的是解释删除或限制的数据。使用本案例tobit回到模型研究年龄,是否结婚,子女数量,教育年限共4项ln工资的影响。
Tobit回归模型用于解决删除/限制解释变量的问题。如果解释变量中的数据有删除/限制,此时进行ols回归不科学。删失分为左删失两种leftcensor还有右删失rightcensor如果数据异常小于或等于某个数字(左删失leftcensor),或大于或等于字的数据异常(右删失rightcensor),此时均可使用Tobit模型。
本案例操作截图如下:
在这种情况下,左删失数据,leftcensor为0,所以在‘LeftCensored’中输入数字0,本案例数据并没有右删失值,因此不设置‘RightCensored’。
共输出4种表格,即Tobit回归模型似乎比检验更好,Censor数据样本汇总,Tobit总结和回归分析结果Tobit总结回归分析结果-简化格式。说明如下:
上表格展示Tobit原则上,回归模型似乎比检验结果更有意义。Tobit模型使用极大似然法进行计算,因而可对似然比检验结果进行关注。从上表可以看出,似乎与检验相比p值为0.000<0.05,也就是说,放入四个解释变量对模型有帮助,也就是说模型构建有意义。
上表格展示删失数据的分布情况。共有2000个样本,本案例设定左删失leftcensor为数字0,上表显示左删失数据共有657个样本(即657个样本数据小于等于数字0),比例为32.85%,右删失没有设置rightcensor,没有右删数据。
上表显示tobit回归模型拟合结果。模型公式为:ln工资=-2.808 0.052*年龄 0.484*是否结婚 0.486*子女数量 0.115*教育年限McFaddenR方为0.064,也就是说,四个解释变量对工资的解释是6.4%特别提示:通常对此指标的关注度较低。
最后具体分析可知:
年龄回归系数值为0.052,并且呈现出0.01水平的显著性(z=9.078,p=0.000<0.01),这意味着年龄对工资有显著的积极影响,年龄越大,工资越高。婚姻的回归系数值是否为0.484,并且呈现出0.01水平的显著性(z=4.677,p=0.000<0.01),这意味着婚姻是否会对工资产生显著的积极影响,即已婚群体的工资明显高于未婚群体。子女数量的回归系数值为0.486,并且呈现出0.01水平的显著性(z=15.329,p=0.000<0.01),这意味着孩子的数量将对工资产生显著的积极影响,孩子的数量越多,工资收入就越高。教育年限的回归系数值为0.115,并且呈现出0.01水平的显著性(z=7.617,p=0.000<0.01),这意味着教育年限对工资有显著的积极影响,即教育年限越多,工资收入就越高。
综上所述:年龄、是否结婚、子女数量、受教育年限四项都会对工资产生显著的积极影响。
上表显示Tobit简化模型的简化结果表,列出了模型的关键信息点,可以直接使用。
提示‘没有uncensored如果设置了数据leftcensored或rightcensored之后,如果未删除的数据数量为0,则会出现此提示。
1、Tobit回归模型似乎比检验不合格,显示模型毫无意义?
Tobit回归模型用于解决有删除数据的样本,当然也可以考虑使用ols回归(此时不考虑删除数据的问题),同时也可以考虑先筛选过滤删除数据,再进行ols回归。建议可对比ols回归和tobit综合判断回归结果。
2、McFaddenR方非常低?
Tobit回归时McFaddenR方的意义相对较小,一般不需要太注意这个指标。
点击获取案例数据:
提取码:0713
数据科学分析平台-让数据分析非常简单,登录免费体验:找到77905429张原始存单样本图片设计图片,包括存单样本图片、材料、海报、证书背景、源文件PSD、PNG、JPG、AI、CDR等格式素材!
毕业证样本网创作《存单样本图(结合案例)Tobit回归模型)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/183576.html