| Referate | Director web | Adauga link | Contact |



Elemente de Statistica




Statistica este disciplina care se ocupa cu culegerea,inregistrarea,gruparea,analiza si interpretarea datelor  

referitoare la un anumit fenomen precum si cu formularea unor previziuni privind comportarea viitoare a acestuia.

Activitatea  de culegere si inregistrare a datelor referitoare la un fenomen face obiectul statisticii descriptive sau statisticii formale.

Activitatea de grupare,de analiza si de interpretare a datelor precum si formularea unor previziuni priviind comportarea viitoare a unui fenomen reprezinta obiectul statisticii matematice.



Elemente de limbaj in statistica.Date Statistice



Definitii

  1. Multimea pe care se realizeaza un studiu statistic se numeste populatie statistica.
  2. Elementele componente ale unei poulatii statistice se numesc unitati statistice sau indivizi.
  3. Numarul total de unitati statistice se numeste efectivul total al populatiei statistice.
  4. O parte a populatiei statistice aleasa special pentru a fi studiata se numeste esantion.
  5. Proprietatea sau indicatorul in functie de care se cerceteaza o populatie statistica se numeste caracteristica  sau variabila statistica.

O caracteristica se numeste caracteristica calitativa daca nu poate fi masurata(valoarea ei nu se exprima numeric).

Ex: media generala,calificativul,profesia

O caracteristica cantitativa se numeste discontinua sau discreta daca nu poate lua decat valori numerice izolate.

O caracteristica cantitativa care poate lua orice valoare dintr-un interval de lungime finita sau infinita se numeste caracteristica cantitativa continua.

Intervalel in care o caracteristica ia valori se numesc grupe sau clase de valori.

Ex: a)Nota la teza.media generala sunt caracteristici cantitative discrete.

       b)Inaltimea este o caracteristica in functie de care poate fi studiat un grup.


Culegerea,Inregistararea si Clasificarea Datelor Statistice


Sa consideram studiul efectuat asupra unui grup de sportivi dupa inaltime (exprimata in centimetri).

Rezultatele masuratorii sunt inregistrate in ordinea in care a decurs masuratoare si sunt asezate in urmatorul tabel:

165

168

177

195

172

198

196

190

201

168

172

168

168

196

173

199

182

195

196

196

185

205

184

192

178

165

174

182

177

172

196

192

188

195

175

192

175

184

192

170

184

205

190

200

188

176

184

174

188

170

170

180

184

199

192

184

170

175

184

188


165

168

177

195

172

198

196

190

201

168

172

168

168

196

173

199

182

195

196

196

185

205

184

192

178

165

174

182

177

172

196

192

188

195

175

192

175

184

192

170

184

205

190

200

188

176

184

174

188

170

170

180

184

199

192

184

170

175

184

188


   Sub aceasta forma datele inregistrate sunt greu de analizat.De aceea este necesara o alta grupare sau clasificare a datelor.De exemplu,sa asezam aceaste date in ordinea crescatoare a inaltimi sportivilor consemnand cati sportivi au o anumit inaltime.Se obtine urmatorul tabel:

cm

Nr.

sportivi

cm

Nr.                                  sportivi

cm

Nr.

sportivi

cm

Nr.

sportivi

cm

Nr.

sportivi

165

2

174

1

180

1

190

2

199

2

168

4

175

3

182

2

192

5

200

1

170

4

176

1

184

7

195

3

201

1

172

3

177

2

185

1

196

5

205

2

173

1

178

2

188

4

198

1

-

-


Cu ajutorul acestei clasificari a datelor se pot obtine niste concluzii mai rapide privind particularitatile acestui grup.

Rezultatele analizei statistice pot fi obtinute uneori mai usor daca se practica o alta grupare a datelor statistice.

De exemplu se poate face o grupare a valorilor caracteristicii studiate in clase de valori:

Clase de valori

Nr.

Sportivi

[165,170)

6

[170,175)

6

[175,180)

8

[180,185)

10

[185,190)

5

[190,195)

7

[195,200)

11

[200,205)

4


Cu ajutorul acestui tabel de date se pot obtine cu usurinta diferite informatii despre grupul de studiu,ca de exemplu:

-sunt 60 de sportivi

-cei mai multi sportivi au inaltimea in clasa de valori [195,200),urmand cei cu inaltimea in clasa de valori [180,185) etc.

-9 sportivi au inaltimea in clasa de valori [170,175)si reprezinta 15% din efectivul populatiei statistice;

-exista 45 de sportivi cu inaltimea sub 95 cm etc.

Valoarea absoluta a diferentei extremitatilor unei clase de valori se numeste amplitudinea clasei.


Serii Statistice.Frecvente


  1. Multimea tututor perechilor (xi,ni),1 i p formeaza o serie statistica cu o singura variabila.
  2. Numarul ni de unitati statistice corespunzatoare valorii xi a caracteristicii sau a unei clase de valori se numeste frecventa absoluta a valorii xi,respectiv frecventa absoluta a clasei de valori considerate.

Rezulta ca 

Modul de prezentare a unei serii statistice cu o variabila statistica este sub forma unui tabel orizontal sau vertical care cuprinde valorile variabilei statistice sau clasele de valori si frecvntele absolute corespunzatoare:

Valorile caracteristice

x1 x2.....xp

Frecventa absoluta

n1  n2  ....np

Clase de valori

[x1,x2)...[xp-1,xp)

Frecventa absoluta

n1.....................np


Se spune ca aceste tabele definesc distributia sau repartitia statistica a variabilei statistice.

Frecventa absoluta cumulata crescatoare a valorii x a  variabilei statistice este suma tutuoro frecventelor absolute ale valorilor variabilei care apar pana la  xi  inclusiv.


Se noteaza




Frecventa absoluta cumulata descrescatoare a valorii xi a variabilei statisticei este suma tuturor frecventelor absolute ale valorilor variabilei care apar la xi inclusiv.


Se noteaza


Raportul dintre frecventa absoluta a unei valori xi  sau a unei clase de valori statistice si efectivul total al populatiei se numeste frecventa relativa a clasei de valori.


Se noteaza


Se numeste frecventa relativa cumulata crescatoare a valorii xi  a variabilei statistice , suma tuturor frecventelor relative a valorilor care apar pana la xi  inclusiv.

Se noteaza


Se numeste frecventa relativa cumulata descrescatoare a valorii xi  a variabilei statistice , suma tuturor frecventelor relative ale vlorilor care apar la xi  inclusiv.


Se noteaza


Analog se definesc frecventele  relative cumulate  ale claselor de valori.


Reprezentarea Grafica a Datelor Statistice


O modalitatea de realizare a analizei si interpretarii datelor statistice o constituie reprezentarea grafica a acestora ,reprezentare care permite vizualizarea datelor statistice in scopul formarii unei imagini intuitive si imediate asupra fenomenului studiat.

  1. Graficul unei serii statistice se numeste diagrama structurala.


1.Reprezentarea grafica folosind diagrama circulara

Cercul de structura sau diagrama circulara este un cerc a carui arie reprezinta efectivul total al populatiei statistice (100%).Valorile variabilei se reprezinta prin sectoare de cerc ale caror arii sunt proportionale cu frecventele relative ale valorilor variabilei.Cu ajutorul regultii de trei simpla se determina masura unghiului la centru corespunzator fiecarei frecvente.

Ex: Structura veniturilor banesti (in lei) din bugetul personal al unui student pe o luna se afla in urmatorul tabel de date:

Venituri

Bursa de studiu

Donatii

Activitati suplimentare

Vanzari de bunuri

Frecventa absoluta

2 400 000

1 200 000

2 100 000

300 000

Frecventa relativa

40%

20%

35%

6%

Cu regula de trei simpla se obtine urmatoarea corespondenta intre frecventa relativa fi si masura unghiului la centru corespunzator:

fi

40%

20%

35%

5%

n

144

72

126

18

Diagrama circulara asociata serii statistice cu variabila calitativa este redata de fi.











2.Reprezentarea grafica folosind dreptunghiul de structura


Pentru desenarea dreptunghiului de structura se considera un reper cartezian in plan.Axa verticala va fi axa frecventelor relative fi ale valorilor xi ale variabilei statistice.

Cu baza pe axa verticala se deseneaza un dreptunghi cu inaltimea de 100 de unitati.Se divizeaza dreptunghiul pe linii orizontale obtinand dreptunghiuri cu ariile proportionale cu frecventele fi.


Ex: Pentru seria statistica cu variabila calitativa din tabelul anterior se obtine dreptunghiul de structura din figura urmatoare :









.





                3.Reprezentarea grafica prin batoane




Diagrama structurala cu ajutoarul batoanelor se obtine astfel:

  1. se alege un reper cartezian in plan
  2. pe axa orizontala se reprezinta valorile xi  ale variabilei statistice
  3. pe axa verticala se reprezinta frecventele absolute ni sau frecventele relative fi  corespunzatoare valorilor  xi   1ip
  4. segmentul cu extremitatile in punctele cu coordonatele (xi,0),  (xi, ni) respectiv (xi, fi) reprezinta batonul corespunzator valorii xi.

Ex; Se considera seria statistica reprezentand distributia unui esantion de 120 de tineri in functie de numarul de carti imprumutate de la bibleoteca intr-un semestru.

Numar carti

0

1

2

3

4

5

6

7

8

Numar elevi

2

8

10

18

20

25

22

5

10










4.Reprezentarea grafica prin coloane sau benzi




Acest tip de reprezentare grafica foloseste dreptunghiuri cu latimi egale si lungimile proportionale cu frecventele absolute sau cu frecventele relative ale valorilor variabilei statisticei.

Daca dreptunghiurile sunt asezate vertical,reprezentarea grafica se numeste diagrama prin coloane, iar daca sunt asezate orizontal reprezentarea grafica se numeste diagrama prin benzi.

Ex: Repartitia numarului de ore de emisie de radio (mii ore program) in perioada 1998-2003 este:



Anii

1998

1999

2000

2001

2002

2003

Numar ore

52

58

64

60

70

75















       5.Poligonul frecventelor

O modalitate de vizualizare a datelot unei seriistatistice este poligonul frecventelor care permite reprezentarea grafica sub forma unei curbe.Fie seria statistica                                      cu telor absolute  se unesc printr-o linie poligonala de coordonate                 ,                     .Daca se unesc punctele de coordonate                                     se obtine poligonul frecventelor relative.















6.Histograma

Se considera o serie statistica cu variabila cantitativa continua si clasele de valori de amplitudini egale:distributia unui grup de tineri dupa inaltimea exprimata in centimetri:





Inaltime

Numar tineri

Frecventa absoluta cumulata crescatoare

Frecventa absoluta cumulata descrescatoare

[155, 160)

5

5

63

[160, 165)

12

17

58

[165, 170)

15

32

46

[170, 175)

20

52

31

[175, 180)

8

60

11

[180, 185)

3

63

3









Interpretarea Datelor Statistice Prin Parametri de Pozitie

       

    Analiza si interpretarea datelor statistice legate de un studiu statistic s-a realizat pana la acest moment cu ajutorul frecventelor si a graficelor statistice.

    Pentru o serie statistica este interesant de gasit acea marime care survine cel mai des , acea marime este cea mai reprezentativa pentru toata seria.

    O astefle de marime se numeste indicator sau parametru de pozitie deoarece arata pozitia elementelor principale ale seriei  in cadrul acesteia.

    Reprezentivitatea unor astfel de marimi este data  de gradul de concentrare a datelor statistice in jurul lor.


1.Valoarea medie a unei serii statistice

Fie seris statistica                                   asociata  unui studiu statistic asupra unei populatii statistixce din efectivul N, cu variabila cantitativa.

Se numeste valoare medie sau media variabilei statistice X , media aritmetica a tuturor valorilor variabilei statistice calculata pentru toate unitatile populatiei statistice.


Se noteaza



2.Mediana seriei  statistice

       ordonata 



                                   

Mediana unei serii statistice ordonate este valoarea Me  care imparte sirul ordonat al valorilor variabile in doua parti,fiecare parte continand acelasi numar de valori.

*Mediana unei serii statistice cu variabila cantitativa discreta se obtine astfel:

    -se aseaza cele N valori ale variabilei in ordine crescatoare sau descrescatoare

   -daca N este numar impar, atunci 


   -daca N este par N=2k, atunci


Clasa de valori in seria frecventelor absloute cumulate careia ii corespunde cel putin jumateate din efectivul total al populatiei  se numeste clasa mediana.

Mediana unei serii statistice cu variabila cantitativa  de tip continuu se calculaeaza cu formula



Unde: L=limita inferioara a clasei mediane

          CM=cota medianei

          Ni-1=frecventa absoluta  cumulata crescatoare pana la clasa mediana

          ni=frecventa absoluta corespunzatoare clasei mediane

          k=amplitudinea clasei mediane


3.Modulul unei serii statistice


      In multe activitati economico-sociale prezinta interes acele aspecte care survin cel mai frecvent in derularea lor.

      De exemplu compararea numarului de apeluri telefonice pe intervale mici de timp da posibilitatea determinarii perioadei din zi cand o centrala  telefonica este cel mai mult solicitata si, in conseciinta , da posibilitatea determinarii capacitatii optime a centralei.

     Astfel de probleme se rezolva folosind parametru statistic de pozitie numit modul sau dominanta.

Definitie!

Modulul sau dominanta unei serii                                     reprezinta valoarea  unei clase de valori a variabilei care corespunde celui mai mare efectiv si se noteaza Mo.


*Pentru determinarea unei valori mai exacte a modulului unei serii statistice cu date grupate in clase de valori , vom face o analiza pe o secventa a diagramei structurale a acesteia care sa contina si valorile din clasa modala [1, L).

Fie cazul seriei statistice in care clasa de valori anterioare clasei modale are frecventa mai mica decat frecventa clasei de valori care urmeaza clasei modale.














Notam: Δ1=diferenta dintre frecventa clasei modale si cea a clasei anterioare ei.

            Δ2=diferenta dintre frecventa clasei modale si cea a clasei urmatoare.

            K=amplitudinea clasei modale k=L-1

Se obtine :




4.Dispersia.Abaterea medie patratica


            Sa consideram urmatoarele seturi de date: {1,2,3,4,5} si {2,40;2,50 ;2,60 ;2,80 ;5}

            Se constata ca ambele siruri de date au valoarea medie egala cu 3 , sunt distincte , iar datele primului sir sunt raspandite in raport cu media fata de cele a setului al doilea.

            Pentru a  masura gradul de impartasire a datelor unei serii statistice fata de medie se folosesc urmatorii parametri de pozitie: dispersia si abaterea medie patratica.

Definitie!

          *Fiind data seria statistica                                              dispersia valorilor                            este media aritmetica ponderata a patratelor abatarilor de la medie ale valorilor variabilei.


Se noteaza



In cazul datelor grupate in clase de valori , se considera abaterile centrelor claselor de valori de la medie.

Definitie!

          *Fiind data seria statistica                                      se numeste abatere medie patratica a valorilor variabilei numarul           unde     este dispersia serie.


Se noteaza


             Abaterea medie patratica da posibilitatea caracterizarii dispersiei valorilor variabilei statistice.Astfel, o serie care este putin dispersata , adica prezinta valori ce sunt strans grupate in jurul valorii medii, conduce la o medie patratica mica

Definitie!

       Raportul dintre abaterea medie patratica si valoarea medie  a unei serii statistice se numeste coeficient de variatie