在R中,参照学生t分布,dt(),pt()和qt()有什么区别?


回答 1:

有时这很令人困惑,我决定画一些画,以更好地说明我的答案。相似的功能适用于R中实现的主要概率分布,并且所有功能都相同,具体取决于前缀:

d-密度,得出给定点的密度函数值

p-概率,得出CDF,即返回数字的概率小于此函数的自变量

q-分位数,逆CDF,即给定分位数处的值是多少。

让我更详细地解释一下。让我们考虑自由度为30的t分布,这将接近于正态分布。

qt(.95,30)将返回1.69,这是此分布的第95个百分点。这意味着,我们分布中所有数字的95%小于1.69,而只有5%更大。这是逆CDF。

同样,如果使用pt(1.69,30),您将获得接近95%的结果。此函数返回CDF,这是获得小于或等于参数的数字的可能性。由于1.69是我们的第95个百分点,因此CDF值的确是95%。

dt(x,30)将得出x中的概率密度函数值。对于1.69,它是0.096,相当低,而对于0,它是50%。

请记住,这不是获得此数字的概率,为了获得概率,您需要在一系列值上积分密度函数。这就是CDF函数之所以有用的原因,因为它可以通过计算两个值的差来获得一个介于两个数字之间的数字。


回答 2:

我假设这些是学生t分布的功能,我将在此基础上回答。

dt()返回给定自由度下t分布的概率密度。我可以自由绘制9度的t分布,并显示如下:

这给出:

pt()给出尾部概率。假设您正在进行低尾测试,并且您的测试统计量等于-2.75,自由度相同。然后,您可以计算出较低的尾部概率,如下所示:

pt(-2.75,df = 9,lower.tail = TRUE)

您的答案是:

0.0112

因此,您拒绝5%的空值,但不拒绝1%的空值,但是您很接近。

qt()是t的逆函数,您可以给出概率并获得t分布的分位数。假设您想要一个99%的置信区间。这将在两条尾巴上留下0.005(1-0,99)/ 2。由于我使用了从负无穷大到t的表,因此我将该分位数计算为:

qt(0.995,df = 9,lower.tail = TRUE)

[1] 3.249836

>