Byvoorbeeld, die volgende paar grafieke toon identiese inligting, maar dit lyk baie verskillend. Verduidelik hoekom.
Oefeninge – misbruik van statistiek
’n Maatskappy probeer om ‘n visuele voorstelling te gee van die toename van hul verdienste van een jaar na die ander. Oortuig die grafiek hieronder jou? Analiseer die grafiek.
Kliek hier vir die oplossing
In ‘n studie wat gedoen is op ‘n besige grootpad, het ons data versamel van bestuurders wat die snelheidsperk oortree het en ons het die kleur van hul motors ook bygevoeg. Die data is versamel oor ‘n 20 minuut periode gedurende die middag, en word vertoon op ‘n tabel hieronder.
Gevolgtrekkings, gemaak deur 'n onervare persoon en gebaseer op die data, is soos volg opgesom:
“As iemand ‘n wit motor bestuur, is dit meer waarskynlik dat hy/sy die snelheidsperk sal oortree.”
“ As iemand ‘n blou of rooi motor bestuur is dit meer waarskynlik dat hy/sy by die snelheidsperk sal hou.”
Stem jy saam met hierdie gevolgtrekkings? Verduidelik.
’n Maatskappy produseer ‘n grafiek wat hulle voordeel in verkope teenoor hul kompetisie wys. Identifiseer ten minste drie strategieë wat hulle gebruik het om die leser se persepsie te verander.
Kliek hier vir die oplossing
In ‘n poging om hul kompetisie in 'n swak lig te stel, het ‘n maatskappy die volgende grafiek getoon. Hulle beweer dat hulle kompetisie besigheid verloor. Kan jy aan ‘n beter verduideliking dink?
Kliek hier vir die oplossing
Om ‘n teorie te toets, is agt verskillende kantore gemonitor vir hulle geraasvlakke en werkers se produktiwiteit. Die grafiek hieronder toon die resultate.
Die volgende afleiding is toe gemaak:
“As ‘n kantoor baie geraas het, lei dit na swak produktiwiteit.”Verduidelik die fout in hierdie denke.
Kliek hier vir die oplossing
Opsomming
Datatipes kan verdeel word in primêre en sekondêre data. Primêre data kan verder verdeel word in kwalitatiewe en kwantitatiewe data.
Ons gebruik die volgende as maatstawe van sentrale neiging:
Die gemiddelde van 'n datastel,
, aangedui deur
, is die rekenkundige gemiddelde van al die datawaardes en word as volg bereken:
Die mediaan is die sentrale datawaarde in 'n datastel wat georden is van die laagste na die hoogste waarde.
Die modus is die datawaarde wat die meeste voorkom in die datastel.
Die volgende is maatstawe van verspreiding:
Die variasiewydte van 'n datastel is die verskil tussen die laagste en die hoogste waarde in die stel.
Kwartiele is die drie datawaardes wat 'n geordende datastel in vier groepe opdeel wat elk 'n gelyke aantal datapunte bevat. Die mediaan is die tweede kwartiel.
Persentiele is die 99 datawaardes wat die datastel in 100 gelyke groepe verdeel.
Die interkwartielvariasiewydte is 'n maatstaf wat inligting verskaf oor die verspreiding van data in 'n datastel en word bereken deur die eerste kwartiel af te trek van die derde kwartiel. Dit gee die variasiewydte van die middelste helfte van die datastel, terwyl dit die laagste en hoogste kwartiele uitsluit, nl.
. Helfte van hierdie waarde is die semi-interkwartielvariasiewydte.
Die vyfgetalopsomming is 'n manier om data op te som. 'n Houerstipping is 'n grafiese voorstelling van die vyfgetalopsomming.
Onwillekeurige foute kom voor in alle datastelle en ontstaan vanweë die skatting van datawaardes. Vals veronderstellings of sistematiese foute kom voor wanneer jy konsekwent datawaardes onder- of oorskat.
Neem altyd die data sowel as die statistieke wat die data opsom in aanmerking voor jy tot gevolgtrekkings kom.
Die hoogste 7 bome in 'n park het hoogtes (in meters) van 41, 60, 47, 42, 44, 42, and 47. Vind die mediaan van hulle hoogtes.
Kliek hier vir die oplossing
Die student in Bjorn se klas het die volgende ouderdome: 5, 9, 1, 3, 4, 6, 6, 6, 7, 3. Vind die modus van hul ouderdome.
Kliek hier vir die oplossing
'n Ingenieursfirma het twee verskillende tipes enjins vir motorfietse ontwerp. Die twee verskillende motorfietse word getoets vir die tyd wat dit hulle vat om te versnel van 0 km/h tot 60 km/h.
Toets 1
Toets 2
Toets 3
Toets 4
Toets 5
Toets 6
Toets 7
Toets 8
Toets 9
Toets 10
Gemiddelde
Bike 1
1.55
1.00
0.92
0.80
1.49
0.71
1.06
0.68
0.87
1.09
Bike 2
0.9
1.0
1.1
1.0
1.0
0.9
0.9
1.0
0.9
1.1
Watter maatstaf van sentrale neiging is die beste om te gebruik om hierdie data op te som?
Bereken die maatstaf, waarop jy besluit het in die vorige vraag, vir elke motorfiets.
Watter motorfiets sal jy kies, gebaseer op hierdie inligting? Neem kennis van die akkuraatheid van die datawaardes in elk van die datastelle.
Die hoogte (lengte) van 40 leerders is gegee hieronder.
154
140
145
159
150
132
149
150
138
152
141
132
169
173
139
161
163
156
157
171
168
166
151
152
132
142
170
162
146
152
142
150
161
138
170
131
145
146
147
160
Stel 'n frekwensietabel op vir 6 intervalle.
Bereken die benaderde gemiddelde.
Bereken die modus.
Hoeveel leerders is groter as jou benaderde gemiddelde in (b)?
In ‘n verkeersondersoek was 50 ewekansig gekose motorbestuurders gevra watter afstand hulle werk toe ry elke dag. Hierdie inligting word gewys in die tabel hieronder.
’n Maatskappy wil die opleidingsprogram in sy fabriek evalueer. Hulle het dieselfde opdrag vir beide opgeleide en onopgeleide werkers gegee en dan hulle tyd gemeet in sekondes.
Opgeleide
121
137
131
135
130
128
130
126
132
127
129
120
118
125
134
Onopgeleide
135
142
126
148
145
156
152
153
149
145
144
134
139
140
142
Vind die mediaan en kwartiele vir albei datastelsels.
Vind die interkwartielvariasiewydte vir albei datastelsels.