Sådan konstateres sandsynlighedsfordelingen for din data

August 19

Sådan konstateres sandsynlighedsfordelingen for din data

Hvis du har et sæt af data for at undersøge, kan du være sikker på, at et eller to punkter i sættet vil være slyngelstater data. Identifikation outliers vil hjælpe dig med at fokusere på sandsynligheden for observationer, men du er nødt til at passe en distributionsmodel til dataene til påvisning af afvigende værdier. Selvom der er mange matematiske formler til at identificere den sandsynlighedsfordeling typen af ​​dine data, den enkleste metode er at bare plotte data på en graf og se hvilken type der passer bedst. Hver sandsynlighedsfordeling type har særlige visuelle funktioner.

Vejledning


1. Bestil dine data som koordinater. Hver observation vil have en "x" værdi og en værdi, der er en funktion af x. Det vil sige, den anden værdi er observerede adfærd, når x har en bestemt værdi. Placer x data i en kolonne, bestille det fra laveste til højeste, skrive tilsvarende vaules for f (x) i det tilstødende kolonne.

• Find de laveste og højeste værdier i f (x) kolonne. Da dataene i X kolonnen er i rækkefølge de laveste og højeste værdier for x skal være let at finde. Disse to serier giver dig vifte af dit plot.

• Plot akser grafen foranstaltning ud lige punkter langs X-aksen fra "0" til det højeste observerede værdi. Hvis den laveste værdi af dataene er negativ udvide X-aksen til venstre for Y-aksen og holde mærkning jævne mellemrum, indtil du når en afrundet værdi lavere end din laveste X observation.

• Gentag opgaven udføres for X-aksen, men denne gang anvende disse regler med Y-aksen ved hjælp af din f (x) data. Hvis den laveste værdi i intervallet er negativ, udvide Y-aksen under X-aksen og fortsætte med negative værdier der.

• Plot hvert punkt på grafen, hvor x-værdien og f (x) værdi mødes. Et mønster skulle opstå. Hvis dataene synes at stige til et højdepunkt i midten og synes at være jævnt fordelt visne side af midten, har du en gaussisk eller normal, distribution. Hvis datapunkterne oprette en enkelt kurve, har du en eksponentiel fordeling. En Rayleigh fordeling stiger pludseligt og skråninger ned i en kurve.

• Slet nogen point, der ikke passer ind i din opdaget fordeling type. Tegn en linje af "best fit" mellem de punkter, der giver en jævn kurve snarere end blot at forbinde prikkerne.