样本容量是否越大越好?
首先,我认为你老师的说法是欠考虑的。
样本容量是否越大越好?对!为什么?大样本渐进理论(asymptotictheory)它是现代计量经济学的基石。你相信这些理论并使用它们,然后你故意拒绝大样本?这不是你自己的脸吗?
有些答案给了一些大牛的文章片段,写得很好!他们说话很圆,没有问题。他们无一例外地讲述了一个事实。在实践中,我们使用更大的样本可能会遇到一些问题和麻烦。有什么问题和麻烦?理论上,它不应该显著。更大的样本变得显著,这使得作者难以解释,但不容忽视。仅此而已。这些大牛并没有说要故意避免使用更大的样本!
作为一名计量从业者,你必须有职业道德。很难解释,但你不能忽视它。这并不意味着你必须找到一个更小的样本来实现你的目标(为了不显著而不显著吗?),你说得更好cherrypicking,说难听点叫学术不端。
然后回到这个问题,不要拉得太远。如果更大的样本变得怎么办?你觉得不应该是这样!很多人都有这样的经历,我自己也有。原则上应该使用更大的样本。
首先,你必须考虑大样本带来了什么?让我们考虑一下size样本越大(即第一类错误的概率)power也就是说,犯第二类错误的概率越小。因此,你的理论很可能是错误的,但实际上应该是显而易见的。这样的例子文献太多了。经济理论是这样的,但现实社会是这样的。计量经济学的意义在于揭示真相。
其次,你考虑过吗?correct你的size?不用说,绝大多数的回归及其test不是鲁棒。几乎肯定的是,你会先看那些默认的软件包。p值,那些是简单的tratio,渐进卡方分布。样本越大power越大是对的,但指的是修正size结论的前提。你应该纠正你test的size,因为你在小样本的时候得到的不明显,可能是冤案(其实小样本的时候应该是明显的,但是因为小样本的时候size不,所以觉得不显眼)!
也可能是因为你的模型太简单了。俗话说,所有的模型都是错误的,但有些是非常有用的。你建立的线性模型不现实,太过分naive,没有捕捉到一些重要的特征。例如,您的模型不考虑异方差,异方差会带来什么?让它不显著(或反过来)。或者简单地说,你没有考虑一些特殊的事件,比如regimeswitching或者一些特殊事件,在这种情况下,你的模型无法解释许多巨大的事件outliers,而这些outliers它会带来显著性。因此,你应该深入了解你的模型,看看你的数据,你必须探索为什么它从不显著到显著,有些outliers是否可以删除,是否应该考虑从线性模型到非线性模型,是否应该考虑异方差使您standarderror更鲁棒?等等,这就是老板们在文献中写作的麻烦。是的,样本很大,变得明显,理论上不能解释啊,你必须深入研究数据和历史,探索为什么不明显,这是非常困难的,不一定得到答案。当然,你可以选择不改变模型,继续使用简单的模型,但使用更小的样本,并提供合理的理由,例如,我们的文章写的是XXX,我们有很多数据,但我们有针对性地删除它COVID时期的数据,因为众所周知的原因,那些数据不具有参考性云云。这不算学术不端,而是非常有针对性的表现。
一些老板在文献中提出减少size,比如从5%到1%。这是一个很好的方法,很有道理,我个人同意。为什么?size作为第一类错误,5%其实是一个很大的概率,很有可能造成冤案。我指的是纠正size在前提下。显著的大样本也可能是一个冤案。为什么我们不能把它放在小样本下?size改成1%真的不合适,因为小样本下power可能有点低,低到第二类错误频繁出现,所以size不能低。但是样本足够大。一般来说,power你的样本增加了一倍,很可能是你的size降到1%power都比你的小样本5%size的power都很高。所以这是一个很好的解决方案。
综上所述,你不能因为一些不可告人的原因故意避免使用更大的样本。作为一项合格的高质量研究,你必须知道为什么你的数据不是显著的、显著的或显著的,因为理论和实践的结合?还是理论说,事实并非如此?或者,理论应该是正确的,但你所做的与理论不一致,因为其他原因,你能纠正你的模型和方法吗?修正后的结果是什么?如果不能纠正,为什么不呢?
反对某些人的关系「样本越大,估计你的参数几乎不可能不显著」你是认真的吗?做这个蒙特卡洛
y_i=c e_i
然后再抽一个和以上独立的x_i。大部分样本都没用。显著的概率越来越接近size。不要打破任何蒙特卡洛是真的,但实际数据。看看上面,你努力工作了吗?
研究人员发现了95862195张原始计量经济学样本容量设计图片,包括计量经济学样本容量图片、材料、海报、证书背景、源文件PSD、PNG、JPG、AI、CDR等格式素材!
毕业证样本网创作《测量经济学样本容量(在计量经济学中,样本容量越大越好吗?》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/180946.html