R-ben mi a különbség a dt (), pt () és qt () között a hallgató t eloszlására vonatkoztatva?


Válasz 1:

Ez néha zavaró, úgy döntöttem, hogy festenek egy kis képet, hogy jobban szemléltesse a választ. Hasonló funkciók vannak az R-ben végrehajtott nagy valószínűségű eloszlásokra, és az előtagotól függően mind azonosak:

d - sűrűség, a sűrűségfüggvény értékét adja meg egy adott pontban

p - valószínűség, CDF-et eredményez, vagyis annak valószínűségét, hogy a szám visszatérjen, mint egy argumentum ennek a függvénynek

q - kvantilis, inverz CDF, azaz milyen érték van egy adott kvantilisnél.

Hadd magyarázzam részletesebben. Tekintsük a t eloszlást 30 szabadságfokon, amely közel áll a normál eloszláshoz.

A qt (.95,30) 1,69-et ad vissza, amely e megoszlás 95. percentilisének értéke. Ez azt jelenti, hogy az eloszlásunk összes számának 95% -a kevesebb, mint 1,69, és csak 5% nagyobb. Ez fordított CDF.

Hasonlóképpen, ha pt-t (1,69,30) használ, akkor 95% -hoz közeli eredményt kap. Ez a függvény visszatér a CDF-hez, ami valószínűsíthető, ha egy szám kisebb vagy egyenlő az argumentummal. Mivel az 1,69 a 95. percentilis, a CDF-érték valóban 95%.

dt (x, 30) a valószínűségi sűrűségfüggvény értékét adja x-ban. 1,69 esetén ez 0,096, ami meglehetősen alacsony, míg 0 esetében 50%.

Ne feledje, hogy ez nem valószínű, hogy megkapja ezt a számot. A valószínűség megszerzéséhez integrálnia kell a sűrűségfüggvényt egy értéktartományba. Ezért hasznos a CDF funkció, mivel két érték különbségének kiszámításával valószínűsíthető, hogy egy számot kap, amely e két szám közé esik.


Válasz 2:

Feltételezem, hogy ezek a Student t-eloszlásának függvényei, és erre válaszolok.

dt () adja meg a t-eloszlás valószínűségi sűrűségét egy adott szabadságfokon. Meg tudom rajzolni a t-eloszlást 9 fokos szabadsággal, és az alábbiak szerint jeleníthetem meg:

Ez adja:

pt () megadja a farok valószínűségeit. Tegyük fel, hogy alsó farok tesztet végez, és a teszt statisztikája egyenlő -2,75-rel azonos szabadságfokokkal. Ezután az alsó farok valószínűségét az alábbiak szerint lehet kiszámítani:

pt (-2,75, df = 9, alsó farok = igaz)

És a válaszod:

0,0112

Tehát elutasítja a nullát 5% -on, de nem 1% -on, de közel állsz.

qt () a t fordított függvénye, megadva egy valószínűséget és visszanyerve a t-eloszlás számértékét. Tegyük fel, hogy 99% -os megbízhatósági intervallumot kívánt. Ez 0,005-et hagyna mindkét faroknál (1 - 0,99) / 2. Mivel olyan táblázatokat használtam, amelyek mínusz végtelenségtől t-ig mentek, ezt a számszerűséget a következőképpen számolom:

qt (0,995, df = 9, alsó farok = igaz)

[1] 3.249836

>