Bevezetés a matematikai statisztikába. A matematikai statisztika alapfogalmai A matematikai statisztikáról

Bevezetés

2. A matematikai statisztika alapfogalmai

2.1 A mintavételi módszer alapfogalmai

2.2 A mintavétel megoszlása

2.3 Empirikus eloszlásfüggvény, hisztogram

Következtetés

Bibliográfia

Bevezetés

A matematikai statisztika a statisztikai adatok rendszerezésére és tudományos és gyakorlati következtetésekre való felhasználására szolgáló matematikai módszerek tudománya. Számos szakaszában matematikai statisztika valószínűség-elméletre támaszkodik, amely lehetővé teszi a levont következtetések megbízhatóságának és pontosságának felmérését korlátozottan statisztikai anyag(pl. becsülje meg a szükséges mintanagyságot, hogy a mintavételezés során a szükséges pontosságú eredményeket kapja).

A valószínűségelmélet egy adott eloszlású valószínűségi változókat vagy olyan véletlenszerű kísérleteket vesz figyelembe, amelyek tulajdonságai teljesen ismertek. A valószínűségszámítás tárgya ezen mennyiségek (eloszlások) tulajdonságai és kapcsolatai.

De gyakran a kísérlet egy fekete doboz, amely csak bizonyos eredményeket ad, amelyekből magának a kísérletnek a tulajdonságaira kell következtetést levonni. A megfigyelő numerikus (vagy számszerűsíthető) eredményekkel rendelkezik, amelyeket ugyanazon véletlenszerű kísérlet azonos körülmények között történő megismétlésével kap.

Ebben az esetben például a következő kérdések merülnek fel: Ha megfigyelünk egy valószínűségi változót, hogyan vonhatunk le a legpontosabb következtetést az eloszlásáról több kísérletben szereplő értékkészlet alapján?

Ilyen kísérletsorozatra példa az szociológiai felmérés, gazdasági mutatók halmaza vagy végül fejek és farok sorozata, amikor egy érmét ezerszer feldobnak.

A fenti tényezők mindegyike meghatározza relevanciájátés a munka témájának jelentősége modern színpad célja a matematikai statisztika alapfogalmainak mély és átfogó tanulmányozása.

E tekintetben a munka célja a matematikai statisztika fogalmaival kapcsolatos ismeretek rendszerezése, felhalmozása és megszilárdítása.

1. A matematikai statisztika tárgya és módszerei

A matematikai statisztika a tömeges megfigyelések (mérés, kísérlet) során nyert adatok elemzésére szolgáló matematikai módszerek tudománya. A konkrét megfigyelési eredmények matematikai jellegétől függően a matematikai statisztikát számstatisztikákra, többváltozós statisztikai elemzésekre, függvények (folyamatok) és idősorok elemzésére, valamint nem numerikus jellegű objektumok statisztikáira osztják. A matematikai statisztikák jelentős része valószínűségi modelleken alapul. Kiemel általános feladatok adatok leírása, hipotézisek értékelése és tesztelése. Konkrétabb feladatokat is fontolóra vesznek a mintafelvételek lebonyolításával, a függőségek helyreállításával, az osztályozások (tipológiák) felépítésével, használatával stb.

Az adatok leírására táblázatokat, diagramokat és egyéb vizuális reprezentációkat, például korrelációs mezőket készítenek. Valószínűségi modelleket általában nem használnak. Egyes adatleírási módszerek a fejlett elméletre és a modern számítógépek képességeire támaszkodnak. Ide tartozik különösen a klaszteranalízis, amelynek célja az egymáshoz hasonló objektumcsoportok azonosítása, valamint a többdimenziós méretezés, amely lehetővé teszi az objektumok vizuális ábrázolását egy síkon, a köztük lévő távolságokat a legkisebb mértékben torzítva.

A hipotézisek értékelésének és tesztelésének módszerei az adatgenerálás valószínűségi modelljein alapulnak. Ezeket a modelleket paraméteres és nem paraméteres modellekre osztják. A parametrikus modellekben feltételezzük, hogy a vizsgált objektumokat eloszlásfüggvények írják le kisszámú (1-4) numerikus paramétertől függően. A nem paraméteres modellekben az eloszlásfüggvényeket tetszőleges folytonosnak tekintjük. A matematikai statisztikában az eloszlás paraméterei és jellemzői (matematikai elvárás, medián, variancia, kvantilisek stb.), sűrűség- és eloszlásfüggvények, változók közötti függőségek (lineáris és nem paraméteres korrelációs együtthatók, valamint a kifejező függvények parametrikus vagy nem paraméteres becslései alapján) függőségek) kiértékelődnek stb. Pontot és intervallumot használnak (határokat adva a valódi értékeket) becslések.

A matematikai statisztikában van általános elmélet hipotézisvizsgálat és nagy szám konkrét hipotézisek tesztelésére szolgáló módszerek. Hipotéziseket fontolgatnak a paraméterek és jellemzők értékeiről, a homogenitás vizsgálatáról (vagyis a jellemzők vagy eloszlásfüggvények egybeeséséről két mintában), az empirikus eloszlásfüggvény egyezéséről adott funkciót eloszlás vagy ilyen függvények parametrikus családjával, az eloszlás szimmetriájáról stb.

Kiemelkedő jelentőséggel bír a mintavételes felmérésekhez kapcsolódó matematikai statisztika rész, amely a különböző mintavételi sémák tulajdonságait és a hipotézisek értékelésére és tesztelésére alkalmas módszerek kidolgozását tartalmazza.

A függőségi helyreállítási problémákat több mint 200 éve vizsgálják aktívan, amióta K. Gauss 1794-ben kidolgozta a legkisebb négyzetek módszerét. Jelenleg a legrelevánsabb módszerek a változók informatív részhalmazának és a nem paraméteres módszerek keresésére.

Az adatok közelítésére és a leírás dimenziójának csökkentésére szolgáló módszerek fejlesztése több mint 100 évvel ezelőtt kezdődött, amikor K. Pearson megalkotta a főkomponens módszert. Később faktoranalízist és számos nemlineáris általánosítást fejlesztettek ki.

Az osztályozások (tipológiák) felépítésének (klaszteranalízis), elemzésének és használatának (diszkriminanciaanalízis) különféle módszereit mintafelismerési (tanárral és tanár nélkül), automatikus osztályozási stb. módszernek is nevezik.

A statisztikában a matematikai módszerek vagy összegek (a valószínűségszámítás központi határtétele alapján), vagy különbségi indexek (távolságok, metrikák) használatán alapulnak, mint a nem numerikus objektumok statisztikájában. Általában csak az aszimptotikus eredményeket igazolják szigorúan. Napjainkban a számítógépek nagy szerepet játszanak a matematikai statisztikákban. Számításokra és szimulációkra egyaránt használják (különösen a mintaszorzási módszerekben és az aszimptotikus eredmények alkalmasságának vizsgálatára).

A matematikai statisztika alapfogalmai

2.1 A mintavételi módszer alapfogalmai

Legyen egy véletlenszerű kísérletben megfigyelt valószínűségi változó. Feltételezzük, hogy a valószínűségi tér adott (és nem fog minket érdekelni).

Feltételezzük, hogy miután elvégeztük ezt a kísérletet azonos körülmények között, megkaptuk ennek a valószínűségi változónak a , , , - értékeit az első, a második stb. kísérletek. Egy valószínűségi változó eloszlása ​​részben vagy teljesen ismeretlen számunkra.

Nézzük meg közelebbről a mintának nevezett halmazt.

A már elvégzett kísérletek sorozatában a minta számok halmaza. De ha ezt a kísérletsorozatot újra megismételjük, akkor e halmaz helyett egy új számkészletet kapunk. A szám helyett egy másik szám jelenik meg - a valószínűségi változó egyik értéke. Vagyis (és, és stb.) egy olyan változó érték, amely ugyanazokat az értékeket veheti fel, mint egy valószínűségi változó, és ugyanolyan gyakran (ugyanolyan valószínűségekkel). Ezért a kísérlet előtt - egy valószínűségi változó, amely azonos eloszlású -val, és a kísérlet után - az a szám, amelyet ebben az első kísérletben megfigyelünk, pl. egy valószínűségi változó egyik lehetséges értéke.

A mintanagyság független és azonos eloszlású valószínűségi változók ("másolat") halmaza, amelyeknek - hasonlóan - eloszlásuk van.

Mit jelent „mintából következtetéseket levonni az eloszlásra”? Az eloszlást egy eloszlásfüggvény, sűrűség vagy táblázat, halmaz jellemez numerikus jellemzők- , stb. Egy minta felhasználásával képesnek kell lennie arra, hogy közelítéseket készítsen mindezen jellemzőkre.

.2 Mintavétel elosztása

Tekintsük a mintavétel végrehajtását egy elemi eredményre - egy számkészletre , , . Egy alkalmas valószínűségi téren bevezetünk egy valószínűségi változót, amely értékeket vesz fel, , valószínűségi értékekkel (ha valamelyik érték egybeesik, akkor a valószínűségeket a megfelelő számú alkalommal adjuk össze). A valószínűségi eloszlási táblázat és a valószínűségi változó eloszlásfüggvénye így néz ki:

Egy mennyiség eloszlását empirikus vagy mintavételi eloszlásnak nevezzük. Számítsuk ki a mennyiség matematikai elvárását és szórását, és vezessük be ezekre a mennyiségekre a jelölést:

Ugyanígy számítsuk ki a sorrend pillanatát

BAN BEN általános eset mennyiséggel jelöljük

Ha az általunk bevezetett összes jellemző konstruálásakor a , , mintát a valószínűségi változók halmazának tekintjük, akkor ezek a jellemzők maguk - , , , , - valószínűségi változókká válnak. A mintavételi eloszlás ezen jellemzőit a valódi eloszlás megfelelő ismeretlen jellemzőinek becslésére (közelítő) használjuk.

Az eloszlási jellemzők használatának oka a valódi eloszlás (vagy ) jellemzőinek becslésére az ezeknek az eloszlásoknak a közelsége.

Gondoljunk például egy szokásos kocka feldobására. Hadd - a dobás során leesett pontok száma, . Tegyük fel, hogy egy egyszer szerepel a mintában, kettő - egyszer stb. Ekkor a valószínűségi változó felveszi az értékeket 1 , , 6 valószínűséggel , , ill. De ezek az arányok növekedéssel a törvény szerint közelítenek nagy számok. Azaz az érték eloszlása ​​bizonyos értelemben megközelíti a helyes kocka feldobásakor megjelenő pontok számának valós eloszlását.

Nem fogjuk tisztázni, hogy mit értünk a minta közelsége és a valódi eloszlások alatt. A következő bekezdésekben közelebbről megvizsgáljuk a fent bemutatott jellemzőket, és megvizsgáljuk azok tulajdonságait, beleértve a minta méretének növekedésével kapcsolatos viselkedését is.

.3 Empirikus eloszlásfüggvény, hisztogram

Mivel egy ismeretlen eloszlás leírható például az eloszlásfüggvényével, ezért a minta alapján készítünk egy „becslést” erre a függvényre.

1. definíció.

Egy térfogatmintából összeállított empirikus eloszlásfüggvényt véletlenszerű függvénynek nevezzük, minden esetben egyenlő

Emlékeztető: Véletlenszerű funkció

eseményjelzőnek nevezzük. Mindegyik esetében ez egy valószínűségi változó, amelynek Bernoulli-eloszlása ​​paraméterrel. Miért?

Más szavakkal, bármely olyan érték esetén, amely egyenlő annak valós valószínűségével, hogy a valószínűségi változó kisebb, mint , a mintaelemek aránya kisebb, mint .

Ha a mintaelemek , , növekvő sorrendben vannak (minden elemi eredménynél), akkor egy új valószínűségi változó-készletet kapunk, amelyet variációs sorozatnak nevezünk:

A , elemet th tagnak nevezzük variációs sorozat vagy a th ordinális statisztika.

1. példa

Minta:

Variációs sorozat:

Rizs. 1. 1. példa

Az empirikus eloszlásfüggvénynek vannak ugrásai a mintapontokban, az ugrás nagysága egy pontban egyenlő -vel, ahol a -vel egybeeső mintaelemek száma.

Építhető empirikus függvény eloszlás a variációs sorozaton belül:

Egy másik eloszlási jellemző a táblázat (diszkrét eloszlások esetén) vagy a sűrűség (abszolút folytonos eloszlások esetén). Egy táblázat vagy sűrűség empirikus vagy szelektív analógja az úgynevezett hisztogram.

A hisztogram csoportosított adatok felhasználásával készül. Egy valószínűségi változó (vagy a mintaadatok tartománya) becsült értéktartománya a mintától függetlenül meghatározott számú (nem feltétlenül azonos) intervallumra van felosztva. Legyen , , az egyenes intervallumai, amelyeket csoportosító intervallumoknak nevezünk. Jelöljük az intervallumba eső mintaelemek számával:

(1)

Minden intervallumban egy téglalap készül, amelynek területe arányos -val. Az összes téglalap összterületének egyenlőnek kell lennie eggyel. Legyen az intervallum hossza. A fenti téglalap magassága a

Az így kapott ábrát hisztogramnak nevezzük.

2. példa

Van egy variációs sorozat (lásd az 1. példát):

Itt - decimális logaritmus, ezért i.e. ha a mintát megduplázzuk, a csoportosítási intervallumok száma 1-gyel nő. Vegye figyelembe, hogy minél több csoportosítási intervallum, annál jobb. De ha vesszük az intervallumok számát, mondjuk a nagyságrendűnek, akkor növekedéssel a hisztogram nem fogja megközelíteni a sűrűséget.

A következő állítás igaz:

Ha a mintaelemek eloszlássűrűsége folytonos függvény, akkor olyan, hogy , pontonkénti konvergenciája van a hisztogram és a sűrűség valószínűségében.

A logaritmus választása tehát ésszerű, de nem az egyetlen lehetséges.

Következtetés

A matematikai (vagy elméleti) statisztika a valószínűségszámítás módszerein és koncepcióin alapul, de bizonyos értelemben inverz problémákat old meg.

Ha egyidejűleg két (vagy több) jel megnyilvánulását figyeljük meg, pl. több valószínűségi változóból álló értékkészletünk van - mit mondhatunk a függőségükről? Ott van vagy nincs? És ha van, akkor mi ez a függőség?

A fekete dobozban elrejtett eloszlással vagy annak tulajdonságaival kapcsolatban gyakran lehet bizonyos feltételezéseket tenni. Ebben az esetben a kísérleti adatok alapján meg kell erősíteni vagy cáfolni ezeket a feltételezéseket („hipotéziseket”). Nem szabad megfeledkezni arról, hogy az „igen” vagy „nem” válasz csak bizonyos fokú bizonyossággal adható meg, és minél tovább folytathatjuk a kísérletet, annál pontosabb következtetéseket vonhatunk le. A kutatás szempontjából a legkedvezőbb az a helyzet, amikor magabiztosan állíthatjuk a megfigyelt kísérlet bizonyos tulajdonságait - például a megfigyelt mennyiségek közötti funkcionális kapcsolat meglétét, az eloszlás normalitását, szimmetriáját, a sűrűség jelenlétét az eloszlásban, ill. diszkrét természet stb.

Tehát érdemes emlékezni a (matematikai) statisztikákra, ha

· van egy véletlenszerű kísérlet, amelynek tulajdonságai részben vagy teljesen ismeretlenek,

· ezt a kísérletet ugyanilyen körülmények között képesek vagyunk többször (vagy még jobb esetben tetszőleges) reprodukálni.

Bibliográfia

1. Baumol U. Közgazdasági elméletés műveleti kutatás. – M.; Tudomány, 1999.

2. Bolsev L.N., Szmirnov N.V. Matematikai statisztikai táblázatok. M.: Nauka, 1995.

3. Borovkov A.A. Matematikai statisztika. M.: Nauka, 1994.

4. Korn G., Korn T. Matematika kézikönyve tudósok és mérnökök számára. - Szentpétervár: Lan Kiadó, 2003.

5. Korshunov D.A., Chernova N.I. Matematikai statisztikákkal kapcsolatos feladatok és gyakorlatok gyűjteménye. Novoszibirszk: a Matematikai Intézet kiadója. S. L. Sobolev SB RAS, 2001.

6. Peheletsky I.D. Matematika: tankönyv diákoknak. - M.: Akadémia, 2003.

7. Szuhodolszkij V.G. Előadások a felsőbb matematikáról humanistáknak. - St. Petersburg Kiadó St. Petersburg állami Egyetem. 2003

8. Feller V. Bevezetés a valószínűségelméletbe és alkalmazásaiba. - M.: Mir, T.2, 1984.

9. Harman G., Modern faktoranalízis. - M.: Statisztika, 1972.


Harman G., Modern faktoranalízis. - M.: Statisztika, 1972.

A véletlenszerű jelenségek területén végzett minden tanulmány gyökerei mindig a kísérletben, a kísérleti adatokban gyökereznek. Az objektum bármely attribútumának tanulmányozása során összegyűjtött numerikus adatokat hívják statisztikai. A tanulmány kiinduló anyaga a statisztikai adatok. Ahhoz, hogy tudományos vagy gyakorlati értékűek legyenek, a matematikai statisztika módszereivel kell feldolgozni őket.

Matematikai statisztika- Ezt tudományos diszciplína, melynek vizsgálati tárgya tömeges véletlenszerű jelenségek megfigyelései eredményeként nyert statisztikai kísérleti adatok rögzítésére, leírására és elemzésére szolgáló módszerek kidolgozása.

A matematikai statisztika fő feladatai:

    valószínűségi változó vagy valószínűségi változók rendszerének eloszlási törvényének meghatározása;

    hipotézisek hitelességének tesztelése;

    ismeretlen eloszlási paraméterek meghatározása.

A matematikai statisztika minden módszere a valószínűségszámításon alapul. A megoldandó problémák sajátosságai miatt azonban a matematikai statisztika a valószínűségszámítástól független területté válik. Ha a valószínűségszámításban adottnak tekintjük egy jelenség modelljét, és kiszámítjuk ennek a jelenségnek a lehetséges valós lefolyását (1. ábra), akkor a matematikai statisztikában statisztikai adatok alapján választunk ki egy megfelelő elméleti valószínűségi modellt (2. ábra).

1. ábra. A valószínűségszámítás általános problémája

2. ábra. A matematikai statisztika általános problémája

Tudományos tudományágként a matematikai statisztika a valószínűségszámítással együtt fejlődött. Ennek a tudománynak a matematikai apparátusa a 19. század második felében épült fel.

2. Általános sokaság és minta.

A statisztikai módszerek tanulmányozásához bemutatjuk az általános és a minta sokaság fogalmát. Általában alatt Általános népesség eloszlásfüggvénnyel rendelkező X valószínűségi változóként értendő
. Egy adott X valószínűségi változóhoz tartozó mintapopuláció vagy n mintanagyság egy halmaz
ennek a mennyiségnek a független megfigyelései, ahol mintaértéknek vagy egy X valószínűségi változó realizálásának nevezzük. És így, számoknak (a kísérlet elvégzése és a mintavétel esetén) és valószínűségi változóknak (a kísérlet végrehajtása előtt) tekinthetők, mivel ezek mintáról mintára változnak.

1. példa. A fatörzs vastagsága és magassága közötti összefüggés meghatározásához 200 fát választottunk ki. Ebben az esetben a minta mérete n=200.

2. példa A forgácslapok körfűrészen történő fűrészelésével a fajlagos vágási munka 15 értéket kaptunk. Ebben az esetben n=15.

D
Ahhoz, hogy a mintaadatokból magabiztosan megítélhessük az általános sokaság minket érdeklő jellemzőjét, a mintaobjektumoknak azt helyesen kell reprezentálniuk, vagyis a mintának reprezentatív(reprezentatív). A minta reprezentativitását általában az objektumok véletlenszerű kiválasztásával érik el: az általános sokaság minden objektumának ugyanolyan valószínűsége van, hogy bekerül a mintába, mint az összes többi objektumot.

3. ábra. A minta reprezentativitásának bemutatása

Matematikai statisztika

Tárgy és módszerek

A matematikai statisztika a matematikának egy olyan ága, amely megfigyelési és kísérleti adatok rögzítésére, leírására és elemzésére szolgáló módszereket fejleszt azzal a céllal, hogy tömeges véletlenszerű jelenségek valószínűségi modelljeit konstruálja meg. A konkrét megfigyelési eredmények matematikai jellegétől függően a matematikai statisztikát számstatisztikákra, többváltozós statisztikai elemzésekre, függvények (folyamatok) és idősorok elemzésére, valamint nem numerikus jellegű objektumok statisztikáira osztják.

Napjainkban a számítógépek nagy szerepet játszanak a matematikai statisztikákban. Számításokra és szimulációkra egyaránt használják (különösen a mintaszorzási módszerekben és az aszimptotikus eredmények alkalmasságának vizsgálatára).

Megjegyzések

Irodalom

  • Valószínűségszámítás és matematikai statisztika. Enciklopédia / Ch. szerk. Yu. V. Prokhorov. - M.: "Big Russian Encyclopedia" kiadó, 1999.
  • Wald A. Szekvenciális elemzés, ford. angolból - M.: Fizmatgiz, 1960.
  • Shiryaev A. N. Statisztikai szekvenciális elemzés. Optimális megállási szabályok - M.: Nauka, 1976

Lásd még

Linkek


Wikimédia Alapítvány. 2010.

  • Lineáris algebra
  • Matematikai fizika

Nézze meg, mi a „matematikai statisztika” más szótárakban:

    MATEMATIKAI STATISZTIKA Modern enciklopédia

    MATEMATIKAI STATISZTIKA- a matematikai módszerek tudománya a statisztikai adatok rendszerezésére és felhasználására tudományos és gyakorlati következtetések levonására. A matematikai statisztika számos részében a valószínűségszámításon alapul, amely lehetővé teszi a megbízhatóság és a pontosság értékelését... Nagy enciklopédikus szótár

    Matematikai statisztika- MATEMATIKAI STATISZTIKA, a statisztikai adatok rendszerezésének és felhasználásának matematikai módszereinek tudománya tudományos és gyakorlati következtetésekhez. A matematikai statisztika eredete a 17. század végi és a 19. század eleji tudósok írásaiban keresendő. Sokban… … Illusztrált enciklopédikus szótár

    MATEMATIKAI STATISZTIKA- tömegjelenség-megfigyelések eredményeinek valószínűségszámítási módszerekkel történő leírásával és elemzésével foglalkozó tudomány. Tipikus feladatok Kisasszony. valószínűségi változó eloszlásának típusainak meghatározása, statisztikai hipotézisek tesztelése, paraméterek becslése stb... Földtani enciklopédia

    MATEMATIKAI STATISZTIKA- (a latin status - állam szóból). A nyelvoktatási módszerekhez kapcsolódik a statisztikai adatok rendszerezésének és tudományos és gyakorlati következtetések levonására történő felhasználásának matematikai módszereinek tudománya. M. s. törvényei. szervezetekben széles körben alkalmazzák...... Új szótár módszertani kifejezések és fogalmak (a nyelvtanítás elmélete és gyakorlata)

    Matematikai statisztika- a matematikának egy olyan ága, amely a statisztikai adatok feldolgozásának és elemzésének módszereivel és szabályaival foglalkozik (azaz információ azon objektumok számáról, amelyek bizonyos jellemzőkkel rendelkeznek bármely többé-kevésbé kiterjedt populációban). Sami...... Gazdasági-matematikai szótár

    matematikai statisztika- A matematikának egy olyan ága, amely a statisztikai adatok feldolgozásának és elemzésének módszereivel és szabályaival foglalkozik (azaz információ azon objektumok számáról, amelyek bizonyos jellemzőkkel rendelkeznek bármely többé-kevésbé kiterjedt populációban). Maguk a módszerek és szabályok épülnek...... Műszaki fordítói útmutató

    Matematikai statisztika- a matematika ága, amely a statisztikai adatok rendszerezésének, feldolgozásának és tudományos és gyakorlati következtetésekhez való felhasználásának matematikai módszereivel foglalkozik. Ebben az esetben a statisztikai adatok a bármely... ... Nagy szovjet enciklopédia

    matematikai statisztika- a matematikai módszerek tudománya a statisztikai adatok rendszerezésére és felhasználására tudományos és gyakorlati következtetések levonására. A matematikai statisztika számos részében a valószínűségszámításon alapul, amely lehetővé teszi a... enciklopédikus szótár

„Vannak, akik azt hiszik, hogy mindig igazuk van. Az ilyen emberek nem lehetnek jó tudósok, és nem is érdeklődhetnek a statisztika iránt... Az esetet a földre hozták, ahol a tudomány világának részévé vált.” (Diamand S.)

„A véletlen csak tudatlanságunk mértéke. A véletlenszerű jelenségek, ha meghatározzuk őket, azok lesznek, amelyek törvényeit nem ismerjük.” (A. Poincaré „Tudomány és hipotézis”)

"Köszönöm istenem. Nem így van
Mindig egyenrangú a megváltoztathatatlannal...
Gyakran a véletlen uralja az eseményt,
Örömet és fájdalmat egyaránt generál.
És az élet feladatot állít elénk:
Hogyan lehet megérteni a véletlen szerepét?
(B. A. Kordemsky „Matematika tanulmányozza a véletlenszerűséget” című könyvéből)

A világ maga természetes - gyakran így vesszük és tanulmányozzuk a fizika, kémia stb. törvényeit, de semmi sem történik a véletlen beavatkozása nélkül, amely instabil, járulékos ok-okozati összefüggések hatására jön létre, amelyek megváltoztatják a fizika, a kémia stb. jelenség vagy élmény, amikor megismétlődik. Egy „véletlenszerű hatás” jön létre a „rejtett előre meghatározottság” eredendő szabályosságával, azaz. a véletlennek természetes kimenetelre van szüksége.

A matematikusok csak a „legyen vagy nem lenni” dilemmában veszik figyelembe a véletlenszerű eseményeket – hogy megtörténik-e vagy sem.

Meghatározás. Az alkalmazott matematikának a tömeg mennyiségi jellemzőit vizsgáló ága véletlenszerű események vagy jelenségeket nevezik matematikai statisztika.

Meghatározás. A valószínűségszámítás és a matematikai statisztika elemeinek kombinációját ún sztochasztika.

Meghatározás. Sztochasztika- ez a matematikának az az ága, amely az ember gyakorlati tevékenységével szoros összefüggésben keletkezett és fejlődik. Napjainkban a sztochasztika elemei mindenki számára bekerülnek a matematikába, és a matematikai és általános műveltség új, fontos aspektusává válnak.

Meghatározás. Matematikai statisztika– a statisztikai adatok rendszerezésének, feldolgozásának és tudományos és gyakorlati következtetésekhez való felhasználásának matematikai módszereinek tudománya.

Beszéljünk erről részletesebben.

Az általánosan elfogadott álláspont ma az, hogy a matematikai statisztika a tudomány általános módokon a kísérleti eredmények feldolgozását. E problémák megoldásában minek kell lennie egy kísérletnek ahhoz, hogy az alapján hozott ítéletek helyesek legyenek? A matematikai statisztika részben a kísérleti tervezés tudományává válik.

A „statisztika” szó jelentése jelentős változásokon ment keresztül az elmúlt két évszázad során, írják a híres modern tudósok, Hodges és Lehman, „a „statisztika” szónak ugyanaz a gyökere, mint az „állam” (állam) szónak, és eredetileg a művészetet jelentette. és a menedzsment tudománya: az első statisztika tanárokat az egyetemeken A 18. századi Németországban ma társadalomtudósoknak hívnák. Mert a kormányzati döntések bizonyos mértékig népességre, iparra stb. vonatkozó adatokon alapulnak. A statisztikusok természetesen elkezdtek érdeklődni az ilyen adatok iránt, és fokozatosan a „statisztika” szó a népességről, az államról szóló adatgyűjtést, majd általában az adatok gyűjtését és feldolgozását jelenteni kezdte. Nincs értelme az adatokat kinyerni, hacsak nem származik belőle valami hasznos, és a statisztikusok természetesen részt vesznek az adatok értelmezésében.

A modern statisztikusok olyan módszereket tanulmányoznak, amelyek segítségével a populációra jellemzően a „populáció” mintájából nyert adatokból lehet következtetéseket levonni.

Meghatározás. Statisztikus– az a személy, aki a statisztikai adatok rendszerezésének, feldolgozásának és tudományos és gyakorlati következtetések levonása céljából történő felhasználásának matematikai módszereinek tudományával foglalkozik.

A matematikai statisztika a 17. században keletkezett, és a valószínűségszámítással párhuzamosan fejlődött. A matematikai statisztika továbbfejlődése (a 19. század második fele és a 20. század eleje) elsősorban P.L. Csebisev, A.A. Markov, A.M. Lyapunov, K. Gauss, A. Quetelet, F. Galton, K. Pearson és mások A 20. században a matematikai statisztikákhoz a legjelentősebb hozzájárulást A.N. Kolmogorov, V.I. Romanovsky, E.E. Slutsky, N.V. Smirnov, B.V. Gnedenko, valamint az angol Student, R. Fisher, E. Purson és amerikai tudósok (Y. Neumann, A. Wald).

A matematikai statisztika problémái és a hiba jelentése a tudomány világában

A tömeges véletlenszerű jelenségekre vonatkozó mintázatok megállapítása a megfigyelési eredményekből származó statisztikai adatok valószínűségszámítási módszerekkel történő tanulmányozásán alapul.

A matematikai statisztika első feladata, hogy megjelölje a megfigyelések eredményeként vagy speciálisan tervezett kísérletek eredményeként nyert statisztikai információk összegyűjtésének és csoportosításának módjait.

A matematikai statisztika második feladata a statisztikai adatok elemzésére szolgáló módszerek kidolgozása a vizsgálat céljaitól függően.

A modern matematikai statisztika módszereket fejleszt a szükséges vizsgálatok számának meghatározására a vizsgálat megkezdése előtt (kísérlettervezés) és a vizsgálat során (szekvenciális elemzés). Úgy definiálható, mint a bizonytalanság melletti döntéshozatal tudománya.

Röviden azt mondhatjuk, hogy a matematikai statisztika feladata a statisztikai adatok gyűjtésére és feldolgozására szolgáló módszerek megalkotása.

Egy tömeges véletlenszerű jelenség vizsgálatakor feltételezzük, hogy minden tesztet azonos körülmények között hajtanak végre, pl. a figyelembe vehető (mérhető) és a vizsgálati eredményre jelentős hatást gyakorló fő tényezők csoportja a lehető legtöbb értéket megtartja.

A véletlenszerű tényezők torzítják azt az eredményt, amelyet akkor kaptunk volna, ha csak a fő tényezők jelen vannak, így véletlenszerűvé válik. Az egyes tesztek eredményének az igazitól való eltérését megfigyelési hibának nevezzük, amely egy valószínűségi változó. Különbséget kell tenni a szisztematikus és a véletlenszerű hibák között.

Egy tudományos kísérlet ugyanolyan elképzelhetetlen hiba nélkül, mint egy óceán só nélkül. Bármilyen tényfolyam, amely gyarapítja tudásunkat, valamilyen hibát hoz. Egy jól ismert mondás szerint a legtöbb ember az életben semmiben sem lehet biztos, csak a halálban és az adókban, és a tudós hozzáteszi: „És a tapasztalati tévedésekben”.

A statisztikus egy „vérkutya”, aki hibára vadászik. Statisztikai eszköz a hibafelismeréshez.

A „hiba” szó nem egyszerű „téves számítást” jelent. A téves számítások következményei a kísérleti hiba kicsi és viszonylag érdektelen forrása.

Valóban, a mi hangszereink tönkremennek; szemünk és fülünk megtéveszthet bennünket; a méréseink soha nem teljesen pontosak, néha még a számtani számításaink is hibásak. A kísérleti hiba jelentősebb, mint egy pontatlan mérőszalag vagy egy optikai csalódás. És mivel a statisztika legfontosabb feladata, hogy segítse a tudósokat egy kísérlet hibájának elemzésében, meg kell próbálnunk megérteni, mi is a hiba valójában.

Bármilyen problémával is foglalkozik egy tudós, az minden bizonnyal összetettebb lesz, mint szeretné. Tegyük fel, hogy méri a radioaktív csapadékot különböző szélességi fokok. Az eredmények a mintagyűjtési hely magasságától, a helyi csapadék mennyiségétől és a ciklonok magasságától függenek egy szélesebb területen.

A kísérleti hiba minden valóban tudományos kísérlet szerves része.

Ugyanaz az eredmény lehet hiba és információ a problémától és nézőponttól függően. Ha egy biológus azt szeretné megvizsgálni, hogy a táplálkozás változásai hogyan befolyásolják a növekedést, akkor a kapcsolódó alkat jelenléte hibaforrás; ha az öröklődés és a növekedés kapcsolatát vizsgálja, a hibaforrás a táplálkozásbeli különbségek lesznek. Ha egy fizikus az elektromos vezetőképesség és a hőmérséklet összefüggését akarja tanulmányozni, a vezető anyag sűrűségében mutatkozó különbségek hibaforrást jelentenek; ha ennek a sűrűségnek és az elektromos vezetőképességnek a kapcsolatát vizsgálja, a hőmérsékletváltozások hibaforrást jelentenek.

A hiba szó használata kétesnek tűnhet, és előnyösebb lehet azt mondani, hogy a kapott hatásokat „nem szándékos” vagy „nem kívánatos” hatások zavarják. Kísérletet tervezünk az ismert hatások tanulmányozására, de a véletlenszerű tényezők, amelyeket nem tudunk előre jelezni vagy elemezni, saját hatásuk hozzáadásával torzítják az eredményeket.

A tervezett hatások és a véletlen okokból eredő hatások közötti különbség olyan, mint a tengeren, egy bizonyos pályán vitorlázó hajó és a változó szelek és áramlatok akarata alatt céltalanul sodródó hajó mozgásának különbsége. A második ér mozgását véletlenszerű mozgásnak nevezhetjük. Lehetséges, hogy ez a hajó megérkezik valamelyik kikötőbe, de valószínűbb, hogy nem érkezik meg semmilyen konkrét helyre.

A statisztikusok a „véletlenszerű” szót olyan jelenség megjelölésére használják, amelynek kimenetele a következő pillanatban teljesen lehetetlen megjósolni.

A kísérletben előre látható hatások által okozott hiba néha inkább szisztematikus, mint véletlenszerű.

A szisztematikus hiba félrevezetőbb, mint a véletlenszerű hiba. Egy másik rádióállomásról érkező interferencia szisztematikus zenei kíséretet hozhat létre, amelyet néha megjósolhat, ha ismeri a dallamot. De ez a „kíséret” lehet az oka annak, hogy helytelenül ítélkezünk a hallani próbált műsor szavairól vagy zenéjéről.

Azonban egy szisztematikus hiba felfedezése gyakran egy új felfedezés nyomába vezet bennünket. A véletlenszerű hibák előfordulásának ismerete segít felismerni a szisztematikus hibákat, és így kiküszöbölni azokat.

Ugyanez az érvelés természete mindennapi ügyeinkben is. Milyen gyakran vesszük észre: „Ez nem véletlen!” Amikor ezt elmondhatjuk, a felfedezés útján járunk.

Például A.L. Chizhevsky, történelmi folyamatokat elemez: megnövekedett halálozás, járványok, háborúk kitörése, nagy népmozgások, hirtelen változások klíma stb. felfedezte az összefüggést ezek között a független folyamatok és a naptevékenység periódusai között, amelyek ciklusai: 11 év, 33 év.

Meghatározás. Szisztematikus hiba alatt olyan hibaként értendő, amely ismétlődik, és minden tesztnél ugyanaz. Általában a kísérlet helytelen lefolytatásához kapcsolódik.

Meghatározás. Véletlen hibák alatt olyan hibákra utal, amelyek véletlenszerű tényezők hatására keletkeznek, és kísérletenként véletlenszerűen változnak.

Jellemzően a véletlenszerű hibák eloszlása ​​nulla körüli szimmetrikus, amiből egy fontos következtetés következik: szisztematikus hibák hiányában a valódi teszteredmény egy valószínűségi változó matematikai elvárása, amelynek fajlagos értéke minden tesztben rögzített.

A matematikai statisztika vizsgálati tárgyai lehetnek a vizsgált jelenség vagy folyamat minőségi vagy mennyiségi jellemzői.

Kvalitatív jellemző esetén megszámoljuk, hogy a vizsgált kísérletsorozatban hányszor fordul elő ez a tulajdonság; ez a szám a vizsgált (diszkrét) valószínűségi változót jelenti. A minőségi jellemzők közé tartoznak például a kész alkatrész hibái, demográfiai adatok stb. Ha a jellemző mennyiségi, akkor a kísérlet direkt ill közvetett mérésekösszehasonlítva valamilyen szabvánnyal - mértékegységgel - különféle mérőeszközök segítségével. Például, ha van egy köteg alkatrész, akkor minőségi jel Mennyiségi mutatóként szolgálhat az alkatrész szabványosítása, mennyiségi mutatóként az alkatrész ellenőrzött mérete.

Alapvető definíciók

A matematikai statisztikák jelentős része az objektumok nagy gyűjteményének leírásának szükségességéhez kapcsolódik.

Meghatározás. A vizsgálandó objektumok teljes halmazát ún az általános lakosság.

Az általános populáció lehet az ország teljes lakossága, egy növény havi termelése, adott tározóban élő halállomány stb.

De a lakosság nem csak egy halmaz. Ha a minket érdeklő objektumok halmaza túl sok, vagy az objektumok nehezen hozzáférhetők, vagy egyéb okok miatt nem tudjuk az összes objektumot tanulmányozni, akkor az objektumok egy részének vizsgálatához folyamodunk.

Meghatározás. Az objektumoknak azt a részét, amely ellenőrzésnek, kutatásnak stb mintapopuláció vagy egyszerűen mintavétel.

Meghatározás. A sokaság és a minta elemeinek számát nevezzük kötetek.

Hogyan biztosítható, hogy a minta a legjobban reprezentálja az egészet, pl. reprezentatív lenne?

Ha az egész, i.e. ha a populáció keveset vagy teljesen ismeretlen számunkra, nem tudunk jobbat kínálni, mint egy tisztán véletlenszerű kiválasztást. A nagyobb tudatosság lehetővé teszi, hogy jobban cselekedj, de egy bizonyos szakaszban mégis betör a tudatlanság, és ennek eredményeként a véletlenszerű választás.

De hogyan hozzunk egy tisztán véletlenszerű választást? A szelekció általában könnyen megfigyelhető jellemzők szerint történik, amelyek érdekében kutatást végeznek.

A véletlenszerű kiválasztás elveinek megsértése súlyos hibákhoz vezetett. Az amerikai Literary Review magazin által az 1936-os elnökválasztás eredményéről készített közvélemény-kutatás kudarcáról vált híressé. Ezen a választáson a jelöltek F.D. Roosevelt és A.M. Landon.

Ki nyert?

Általános lakosságként a szerkesztők használták telefonkönyvek. Miután véletlenszerűen kiválasztott 4 millió címet, képeslapokat küldött az elnökjelöltekhez való hozzáállásáról országszerte. Miután jelentős összeget költött postára és képeslap-feldolgozásra, a magazin bejelentette, hogy Landon döntetlenül nyeri meg a közelgő elnökválasztást. A választási eredmény ennek az előrejelzésnek az ellenkezője volt.

Itt egyszerre két hiba történt. Először is, a telefonkönyvek nem adnak reprezentatív mintát az Egyesült Államok lakosságából – többnyire gazdag háztartásfőkből. Másodszor, nem minden ember küldött választ, hanem nagyrészt az üzleti világ képviselőitől, akik támogatták Landont.

Ugyanakkor J. Gallan és E. Warner szociológusok helyesen jósolták meg F.D. Roosevelt, mindössze négyezer kérdőív alapján. Ennek a sikernek nem csak a helyes mintavétel volt az oka. Figyelembe vették, hogy a társadalom az elnökjelöltekhez képest homogénebb társadalmi csoportokra oszlik. Ezért a rétegből származó minta viszonylag kicsi is lehet, ugyanolyan pontossággal. Végül Roosevelt győzött, aki a lakosság kevésbé gazdag rétegei reformjainak támogatója volt.

A rétegenkénti felmérés eredményei alapján a társadalom egésze jellemezhető.

Mik azok a minták?

Ezek számsorok.

Foglalkozzunk részletesebben a mintasorozatra jellemző alapfogalmakkal.

Egy n méretű mintát vettünk ki az általános sokaságból > n 1, ahol n 1 az x 1, n 2 - x 2 stb. megjelenésének a száma.

Az x i megfigyelt értékeit változatoknak, a növekvő sorrendben felírt változatok sorozatát pedig variációs sorozatnak nevezzük. Az n i megfigyelések számát frekvenciáknak, n i /n - relatív gyakoriságoknak (vagy frekvenciáknak) nevezzük.

Meghatározás. Különféle jelentések valószínűségi változót nevezzük lehetőségek.

Meghatározás. Variációs sorozat az opciók növekvő (vagy csökkenő) sorrendbe rendezett sorozata a hozzájuk tartozó frekvenciákkal (frekvenciákkal).

A variációs sorozatok tanulmányozásakor a frekvencia fogalmai mellett a halmozott frekvencia fogalmát is használjuk. Az egyes intervallumokhoz tartozó felhalmozott frekvenciákat (frekvenciákat) az összes előző intervallum frekvenciáinak szekvenciális összegzésével találjuk meg.

Meghatározás. A frekvenciák vagy frekvenciák halmozódását ún kumuláció. Gyűjtheti a frekvenciákat és az intervallumokat.

Egy sorozat jellemzői lehetnek mennyiségi és minőségi.

Mennyiségi (variációs) jellemzők- Ezek számokkal kifejezhető jellemzők. Ezek diszkrétre és folyamatosra vannak osztva.

Minőségi (attribútum) jellemzők– ezek nem számokban kifejezett jellemzők.

Folyamatos változók olyan változók, amelyek valós számokkal vannak kifejezve.

Diszkrét változók olyan változók, amelyek csak egész számokkal fejezhetők ki.

A mintákat jellemzik központi tendenciák: átlag, módus és medián. Egy minta átlagértéke az összes érték számtani átlaga. A mintavételi mód a leggyakrabban előforduló értékek. A minta mediánja az a szám, amely a mintában szereplő összes érték rendezett sokaságának felére „felosztja”.

A variációs sorozat lehet diszkrét vagy folyamatos.

Feladat

Adott minta: 1,3; 1,8; 1,2; 3,0; 2,1; 5; 2,4; 1,2; 3,2;1,2; 4; 2.4.

Ez egy sor lehetőség. Ezeket a lehetőségeket növekvő sorrendbe rendezve egy variációs sorozatot kapunk: 1.2; 1,2; 1,2; 1,3; 1,8; 2,1; 2,4; 2,4; 3,0; 3,2; 4; 5.

Ennek a sorozatnak az átlagos értéke 2,4.

A sorozat mediánja 2,25.

A sorozat üzemmódja –1,2.

Határozzuk meg ezeket a fogalmakat.

Meghatározás. A variációs sorozat mediánja A variációs sorozat (Me) közepére eső valószínűségi változó értékét ún.

A páratlan tagszámú rendezett számsor mediánja a közepére írt szám, a páros tagú rendezett számsor mediánja pedig a középre írt két szám számtani átlaga. Egy tetszőleges számsor mediánja a megfelelő rendezett sorozat mediánja.

Meghatározás. Variációs sorozat divat Meghívják azt az opciót (a valószínűségi változó értékét), amelynek a legmagasabb gyakorisága (Mo) felel meg, azaz. amely gyakrabban fordul elő, mint mások.

Meghatározás. A variációs sorozat számtani középértéke egy statisztikai változó értékeinek összegét elosztjuk ezen értékek számával, azaz a tagok számával.

A minta számtani középértékének megtalálásának szabálya:

  1. szorozzuk meg az egyes opciókat annak gyakoriságával (multiplicitással);
  2. összeadja az összes kapott terméket;
  3. ossza el a talált összeget az összes frekvencia összegével.

Meghatározás. Sor tartomány R=x max -x min különbségének nevezzük, azaz. legnagyobb és legalacsonyabb értékek ezeket a lehetőségeket.

Vizsgáljuk meg, hogy a definíciók alapján helyesen találtuk-e ennek a sorozatnak a középértékét, a mediánt és a módust.

Megszámoltuk a tagok számát, 12 van belőlük - páros számú tag, ami azt jelenti, hogy meg kell találnunk a középre írt két szám számtani átlagát, vagyis a 6. és 7. opciót. (2,1+2,4)\2=2,25 – medián.

Divat. A divat az 1.2, mert csak ez a szám 3-szor fordul elő, a többi pedig kevesebb, mint 3-szor.

A számtani átlagot így találjuk meg:

(1,2*3+1,3+1,8+2,1+2,4*2+3,0+3,2 +4+5)\12=2,4

Csináljunk egy asztalt

Az ilyen táblázatokat gyakorisági táblázatoknak nevezzük. Náluk a második sorban lévő számok gyakoriságok; megmutatják, hogy bizonyos értékek milyen gyakran fordulnak elő a mintában.

Meghatározás. Relatív gyakoriság a mintaértékek gyakoriságának és az összes mintaérték számának aránya.

A relatív frekvenciákat egyébként frekvenciáknak nevezzük. A frekvenciákat és a frekvenciákat skáláknak nevezzük. Keressük meg a sorozat tartományát: R=5-1,2=3,8; A sorozat hatótávolsága 3,8.

Szellemi táplálék

A számtani átlag egyezményes érték. A valóságban nem létezik. A valóságban van egy teljes összeg. Ezért a számtani átlag nem egy megfigyelés jellemzője; a sorozat egészét jellemzi.

Átlagos érték a megfigyelt jellemző értékeinek diszperziós központjaként értelmezhető, pl. érték, amely körül az összes megfigyelt érték ingadozik, és algebrai összeg az átlagtól való eltérés mindig nulla, azaz. az átlagtól való eltérések összege felfelé vagy lefelé egyenlő.

Átlagos absztrakt (általánosító) mennyiség. Még akkor is, ha sorozatot ad meg csak innen természetes számok, az átlagérték törtként is kifejezhető. Példa: GPA próba munka 3,81.

Átlagos érték nemcsak homogén mennyiségeknél található meg. Átlagos gabonatermés az egész országban (kukorica - 50-60 centner hektáronként és hajdina - 5-6 centner hektáronként, rozs, búza stb.), átlagos élelmiszer-fogyasztás, egy főre jutó átlagos nemzeti jövedelem, átlagos lakáskínálat, súlyozott átlagos lakáskínálat költség, az épületek építésének átlagos munkaintenzitása stb. - ezek az állam, mint egységes nemzetgazdasági rendszer jellemzői, ezek az úgynevezett rendszerátlagok.

A statisztikákban olyan jellemzők, mint pl mód és medián. Strukturális átlagoknak nevezzük őket, mert ezen jellemzők értékeit az adatsorok általános szerkezete határozza meg.

Néha egy sorozatnak két módja van, néha egy sorozatnak nincs mód.

Divat a legelfogadhatóbb mutató egy bizonyos termék csomagolásának azonosításakor, amelyet a vásárlók preferálnak; adott típusú, a piacon elterjedt áruk árai; mint a cipők, ruhák mérete, amire a legnagyobb a kereslet; olyan sportág, amellyel egy ország, város, falu, iskola stb. lakosságának többsége szívesen foglalkozik.

Az építőiparban 8 lehetőség van a szélességben, és 3 típust használnak gyakrabban: 1 m, 1,2 m és 1,5 m. Hosszban 33 lehetőség van a födémekre, de leggyakrabban a 4,8 m hosszúságúak használt; 5,7 m és 6,0 m, a födém divat leggyakrabban e 3 méret között található. Ugyanez mondható el az ablakmárkákról is.

Egy adatsor módusát akkor találjuk meg, ha valamilyen tipikus mutatót akarunk azonosítani.

Egy módus számokkal és szavakkal is kifejezhető, statisztikai szempontból a módus a gyakoriság szélsősége.

Középső lehetővé teszi egy olyan adatsor információjának figyelembevételét, amelyet a számtani átlag ad meg, és fordítva.

A matematikai statisztika a matematikának egy olyan ága, amely a statisztikai adatok rendszerezésének, feldolgozásának és tudományos és gyakorlati célú felhasználásának matematikai módszereinek szentelt..

A statisztikai adatok a többé-kevésbé kiterjedt, bizonyos tulajdonságokkal rendelkező objektumok számáról és természetéről szóló információk.

Statisztikának nevezzük azt a kutatási módszert, amely bizonyos objektumkészletekből származó statisztikai adatok figyelembevételén alapul.

A statisztikai kutatási módszerek formális matematikai oldala közömbös a vizsgált objektumok természetétől, és a matematikai statisztika tárgyát képezi.

A matematikai statisztika fő feladata, hogy a megfigyelések vagy kísérletek alapján következtetéseket vonjon le a tömegjelenségekről, folyamatokról.

A statisztika olyan tudomány, amely lehetővé teszi számunkra, hogy a véletlenszerű adatok káoszában mintákat lássunk, kiemeljük bennük a kialakult összefüggéseket, és meghatározzuk cselekvéseinket a helyesen meghozott döntések arányának növelése érdekében.

A körülöttünk lévő világ különböző aspektusai közötti sok ma ismert kapcsolat az emberiség által felhalmozott adatok elemzésével jött létre. A függőségek statisztikai kimutatása után az ember már talál ilyen vagy olyan racionális magyarázatot a felfedezett mintázatokra.

A statisztika kezdeti definícióinak felvázolásához nézzünk egy példát.

Példa. Tegyük fel, hogy meg kell becsülni 100 diák IQ-jának változását 3 év alatt. Indikátorként vegyük figyelembe az aktuális együttható és a korábban mért együttható (három évvel ezelőtt) arányát 100%-kal megszorozva.

Vegyünk egy 100 valószínűségi változóból álló sorozatot: 97,8; 97,0; 101,7; 132,5; 142; ...; 122. Jelöljük azzal x.

1. definíció. A vizsgálat eredményeként megfigyelt X valószínűségi változók sorozatát előjelnek nevezzük a statisztikában.

2. definíció.Egy jellemző különböző értékeit változatoknak nevezzük.

A megadott értékekből nehéz némi információt szerezni az IQ tanulási folyamat során bekövetkező változásainak dinamikájáról. Rendezzük ezt a sorozatot növekvő sorrendbe: 94; 97,0; 97,8; …142. A kapott szekvenciából már ki lehet vonni néhányat hasznos információ– például könnyen meghatározható egy jellemző minimális és maximális értéke. De nem világos, hogy a jellemző hogyan oszlik meg a vizsgált hallgatók teljes populációjában. Osszuk fel a lehetőségeket intervallumokra. A Sturges-képlet szerint az intervallumok ajánlott száma

m= 1+3,32l g(n)≈ 7,6, és az intervallum értéke .

A kapott intervallumok tartományait a táblázat 1. oszlopa tartalmazza.


Számoljuk meg, hány jellemző érték esik az egyes intervallumokba, és írjuk be a 3. oszlopba.

3. definíció.Egy szám, amely megmutatja, hogy egy adott hány opciót tartalmaz i-edik intervallum, frekvenciának nevezzük, és n i-vel jelöljük.

4. definíció.Frekvencia a teljes szám A megfigyeléseket relatív gyakoriságnak (w i) vagy súlynak nevezzük.

5. definíció.A variációs sorozat olyan opciók sorozata, amelyek növekvő vagy csökkenő sorrendben vannak elrendezve a megfelelő súlyokkal.

Ebben a példában az opciók az intervallumok közepét jelentik.

6. definíció.Kumulatív gyakoriság( )x-nél (хОR) kisebb karakterisztikus értékű számváltozatot hívunk.



Olvassa el még: