Въпреки че кривата изглежда еднаква, каква е разликата между разпределението на Коши и Гаус?


Отговор 1:

А Коши не изглежда нормално. Как точно изглежда Коши зависи от параметрите, които използвате, но не изглежда нормално.

e.g.

set.seed (1234) # Задава произволно число семе x1 <- rcauchy (1000, 0, 1) x2 <- rnorm (1000, средно (x1), sd (x1)) графика (плътност (x1)) графика (плътност (х2))

Изобщо не изглеждайте еднакво. И x1 варира от -178 до 702, докато x2 преминава от -76 до 71.


Отговор 2:

Както можете да видите, двете криви изглеждат сходно по това, че и двете имат един „подутина“ и се разстилат по-малко, колкото по-далеч ще получите. Те се различават по това, че Коши има по-тесен връх и се разпространява по-бавно - има много по-голяма вероятност за получаване на стойности далеч от пика в сравнение с нормалното разпределение. Тази разлика води до много различни последици математически - като Коши няма добре дефинирана средна стойност и има своеобразно разпределение на извадката, когато „законът на големите числа“ не се прилага.


Отговор 3:

Въпреки че кривата изглежда еднаква, каква е разликата между разпределението на Коши и Гаус?

Повърхностно изглеждат подобни. Но покажете ми графика на функцията на плътност на разпределение и ми кажете, че е Коши или Гаус, бих знаел коя (ако приемем, че наистина е една от тях). Кошицата има много по-дълги опашки.

Когато имаме семейство от разпределения с неизвестни параметри, искаме да оценим тези параметри.

  • Гауссовото разпределение има два параметъра, средното и стандартното отклонение. Бихме могли да използваме други параметри вместо медианата (която е равна на средната стойност) и полутерквартилния диапазон (което е около
  • 0.67450.6745
  • пъти от стандартното отклонение). Средната стойност на разпределението на Коши не съществува, но средната е центърът на симетрията. Стандартното отклонение също не съществува, но средната стойност на отклоненията в квадрат от средната е безкрайна.

Това е основната разлика. Можем да приемем параметрите на всяко разпределение за средния и полутерквартилния обхват, но не можем да използваме средното и стандартното отклонение за Коши, тъй като те не съществуват.

Когато вземаме извадка, за да ни помогне да оценим параметрите на разпределение, изчисляваме статистически данни като средно и стандартно отклонение на стойностите на извадката. Тази статистика има разпределения. Разпределението на статистическата извадка е известно като нейното разпределение на извадката.

  • Ако разпределението на популацията е гаусово (средното разпределение на извадката), средната проба също е гаусска и има много по-малко стандартно отклонение, така че голяма проба дава по-точни оценки, отколкото само едно наблюдение. Ако разпределението е Коши, примерната средна стойност също има разпределение на Коши, но има точно същия среден и полутерквартирен диапазон като оригиналното разпределение. Няма полза от вземането на средната стойност на пробата.

Така че това е друга разлика. Средната стойност на извадка от Гаус е полезна за оценка на средната стойност (или средната); средната стойност на пробата за Коши е безполезна за оценка на медианата. По-добре е да използвате примерната медиана, която дава по-точни оценки.

Подобни аргументи се прилагат за оценяване на спред (независимо, че го дефинирате) на всяка от разпределението. Обичайните оценки за гаусска дистрибуция не работят за разпределение на Коши.

Реалната разлика е в математическата формула за плътността. В стандартна форма Гаус има плътност

12πe12z2\frac1{\sqrt{2\pi}}e^{-\frac12z^2}

и Коши има плътност

1π(1+z2)\frac1{\pi(1+z^2)}

,

Обърнете внимание, че двете

zz

s са различни. В първия случай стандартното отклонение е

11

, във втория случай горната четирия е

11

,

Функцията на разпределение (вероятността, че

ZzZ\le z

) няма чиста затворена форма за гаусската дистрибуция, но има за Коши, така е

1πtan1(z)\frac1{\pi}\tan^{-1}(z)

,

Ако искате да нанесете графика на разпределенията на едни и същи оси, за да видите разликата, трябва да съответствате на параметрите. Така че бих стандартизирал гаусския, така че да са долните и горните четиристи

0.6745-0.6745

и

0.67450.6745

, т.е. прави стандартното отклонение равно на

1.48261.4826

и използвайте стандартната форма за Коши. Площите под графиките трябва да са равни, така че височините в центъра трябва да бъдат мащабирани подходящо (

0.2690.269

за Гаус и

0.3180.318

за Коши - Коши е по-висок в средата и по-високо в опашките).