Einführung in die mathematische Statistik. Grundbegriffe der mathematischen Statistik Zur mathematischen Statistik

Einführung

2. Grundkonzepte der mathematischen Statistik

2.1 Grundkonzepte der Probenahmemethode

2.2 Stichprobenverteilung

2.3 Empirische Verteilungsfunktion, Histogramm

Abschluss

Referenzliste

Einführung

Mathematische Statistik ist die Wissenschaft mathematischer Methoden zur Systematisierung und Nutzung statistischer Daten für wissenschaftliche und praktische Schlussfolgerungen. In vielen seiner Abschnitte Mathe-Statistik stützt sich auf die Wahrscheinlichkeitstheorie, die es ermöglicht, die Zuverlässigkeit und Genauigkeit der auf der Grundlage begrenzter Zahlen gezogenen Schlussfolgerungen zu beurteilen statistisches Material(Schätzen Sie beispielsweise die erforderliche Stichprobengröße, um in einer Stichprobenerhebung Ergebnisse mit der erforderlichen Genauigkeit zu erhalten.)

Die Wahrscheinlichkeitstheorie berücksichtigt Zufallsvariablen mit einer gegebenen Verteilung oder Zufallsexperimente, deren Eigenschaften vollständig bekannt sind. Gegenstand der Wahrscheinlichkeitstheorie sind die Eigenschaften und Beziehungen dieser Größen (Verteilungen).

Aber oft ist ein Experiment eine Blackbox, die nur bestimmte Ergebnisse liefert, aus denen Rückschlüsse auf die Eigenschaften des Experiments selbst gezogen werden müssen. Der Beobachter verfügt über eine Reihe numerischer Ergebnisse (oder sie können numerisch gemacht werden), die er durch die Wiederholung desselben Zufallsexperiments unter denselben Bedingungen erhält.

In diesem Fall stellen sich beispielsweise folgende Fragen: Wenn wir eine Zufallsvariable beobachten, wie können wir anhand einer Menge ihrer Werte in mehreren Experimenten den genauesten Rückschluss auf ihre Verteilung ziehen?

Ein Beispiel für eine solche Versuchsreihe ist Soziologische Umfrage, eine Reihe von Wirtschaftsindikatoren oder schließlich eine Folge von Kopf und Zahl, wenn eine Münze tausendmal geworfen wird.

Alle oben genannten Faktoren bestimmen Relevanz und die Bedeutung des zu bearbeitenden Themas moderne Bühne zielt auf ein tiefes und umfassendes Studium der Grundkonzepte der mathematischen Statistik ab.

In diesem Zusammenhang besteht der Zweck dieser Arbeit darin, Wissen über die Konzepte der mathematischen Statistik zu systematisieren, zu sammeln und zu festigen.

1. Gegenstand und Methoden der mathematischen Statistik

Mathematische Statistik ist die Wissenschaft von mathematischen Methoden zur Analyse von Daten, die bei Massenbeobachtungen (Messungen, Experimenten) gewonnen werden. Abhängig von der mathematischen Natur spezifischer Beobachtungsergebnisse wird die mathematische Statistik in Zahlenstatistik, multivariate statistische Analyse, Analyse von Funktionen (Prozessen) und Zeitreihen sowie Statistik von Objekten nichtnumerischer Natur unterteilt. Ein wesentlicher Teil der mathematischen Statistik basiert auf probabilistischen Modellen. Markieren allgemeine Aufgaben Daten beschreiben, Hypothesen bewerten und testen. Sie berücksichtigen auch spezifischere Aufgaben im Zusammenhang mit der Durchführung von Stichprobenerhebungen, der Wiederherstellung von Abhängigkeiten, der Erstellung und Verwendung von Klassifikationen (Typologien) usw.

Zur Beschreibung von Daten werden Tabellen, Diagramme und andere visuelle Darstellungen, beispielsweise Korrelationsfelder, erstellt. Wahrscheinlichkeitsmodelle werden normalerweise nicht verwendet. Einige Datenbeschreibungsmethoden basieren auf fortgeschrittener Theorie und den Fähigkeiten moderner Computer. Dazu gehören insbesondere die Clusteranalyse, die darauf abzielt, Gruppen von einander ähnlichen Objekten zu identifizieren, und die mehrdimensionale Skalierung, die es ermöglicht, Objekte auf einer Ebene visuell darzustellen und dabei die Abstände zwischen ihnen am wenigsten zu verzerren.

Methoden zur Bewertung und Prüfung von Hypothesen basieren auf probabilistischen Modellen der Datengenerierung. Diese Modelle werden in parametrische und nichtparametrische Modelle unterteilt. Bei parametrischen Modellen wird davon ausgegangen, dass die untersuchten Objekte durch Verteilungsfunktionen beschrieben werden, die von einer kleinen Anzahl (1-4) numerischer Parameter abhängen. In nichtparametrischen Modellen wird davon ausgegangen, dass Verteilungsfunktionen beliebig stetig sind. In der mathematischen Statistik werden Parameter und Merkmale der Verteilung (mathematischer Erwartungswert, Median, Varianz, Quantile usw.), Dichte- und Verteilungsfunktionen, Abhängigkeiten zwischen Variablen (basierend auf linearen und nichtparametrischen Korrelationskoeffizienten) sowie parametrische oder nichtparametrische Schätzungen von Ausdrucksfunktionen berücksichtigt Abhängigkeiten) werden ausgewertet usw. Sie verwenden Punkt und Intervall (wodurch Grenzen angegeben werden). wahre Werte) Schätzungen.

In der mathematischen Statistik gibt es allgemeine Theorie Hypothesentests und große Nummer Methoden zur Prüfung spezifischer Hypothesen. Sie betrachten Hypothesen über die Werte von Parametern und Merkmalen, über die Prüfung der Homogenität (also über die Übereinstimmung von Merkmalen oder Verteilungsfunktionen in zwei Stichproben), über die Übereinstimmung der empirischen Verteilungsfunktion mit gegebene Funktion Verteilung oder mit einer parametrischen Familie solcher Funktionen, über die Symmetrie der Verteilung usw.

Von großer Bedeutung ist der Abschnitt der mathematischen Statistik im Zusammenhang mit der Durchführung von Stichprobenerhebungen, mit den Eigenschaften verschiedener Stichprobenverfahren und der Entwicklung geeigneter Methoden zur Bewertung und Prüfung von Hypothesen.

Probleme der Abhängigkeitswiederherstellung werden seit mehr als 200 Jahren, seit der Entwicklung der Methode der kleinsten Quadrate durch K. Gauss im Jahr 1794, aktiv untersucht. Derzeit sind die relevantesten Methoden zur Suche nach einer aussagekräftigen Teilmenge von Variablen und nichtparametrische Methoden.

Die Entwicklung von Methoden zur Approximation von Daten und zur Reduzierung der Beschreibungsdimension begann vor mehr als 100 Jahren, als K. Pearson die Hauptkomponentenmethode entwickelte. Später wurden Faktorenanalysen und zahlreiche nichtlineare Verallgemeinerungen entwickelt.

Verschiedene Methoden zur Konstruktion (Clusteranalyse), Analyse und Verwendung (Diskriminanzanalyse) von Klassifikationen (Typologien) werden auch Methoden der Mustererkennung (mit und ohne Lehrer), automatische Klassifikation usw. genannt.

Mathematische Methoden in der Statistik basieren entweder auf der Verwendung von Summen (basierend auf dem Zentralen Grenzwertsatz der Wahrscheinlichkeitstheorie) oder auf Differenzindizes (Abstände, Metriken), wie in der Statistik von Objekten nichtnumerischer Natur. Normalerweise werden nur asymptotische Ergebnisse streng begründet. Heutzutage spielen Computer in der mathematischen Statistik eine große Rolle. Sie werden sowohl für Berechnungen als auch für Simulationen verwendet (insbesondere bei Stund bei der Untersuchung der Eignung asymptotischer Ergebnisse).

Grundbegriffe der mathematischen Statistik

2.1 Grundkonzepte der Stichprobenmethode

Sei eine Zufallsvariable, die in einem Zufallsexperiment beobachtet wird. Es wird davon ausgegangen, dass der Wahrscheinlichkeitsraum gegeben ist (und uns nicht interessiert).

Wir gehen davon aus, dass wir, nachdem wir dieses Experiment einmal unter den gleichen Bedingungen durchgeführt haben, die Zahlen , , , - die Werte dieser Zufallsvariablen im ersten, zweiten usw. erhalten haben. Experimente. Eine Zufallsvariable hat eine Verteilung, die uns teilweise oder vollständig unbekannt ist.

Schauen wir uns einen Satz namens Sample genauer an.

In einer Reihe bereits durchgeführter Experimente ist eine Stichprobe eine Menge von Zahlen. Wenn diese Versuchsreihe jedoch noch einmal wiederholt wird, erhalten wir anstelle dieser Menge eine neue Reihe von Zahlen. Anstelle der Zahl erscheint eine andere Zahl – einer der Werte der Zufallsvariablen. Das heißt, (und, und usw.) ist ein Variablenwert, der die gleichen Werte wie eine Zufallsvariable annehmen kann, und zwar genauso oft (mit den gleichen Wahrscheinlichkeiten). Daher vor dem Experiment – ​​eine Zufallsvariable, identisch verteilt mit , und nach dem Experiment – ​​die Zahl, die wir in diesem ersten Experiment beobachten, d.h. einer der möglichen Werte einer Zufallsvariablen.

Eine Stichprobengröße ist eine Menge unabhängiger und identisch verteilter Zufallsvariablen („Kopien“), die wie eine Verteilung aufweisen.

Was bedeutet es, „aus einer Stichprobe Rückschlüsse auf die Verteilung zu ziehen“? Eine Verteilung wird durch eine Verteilungsfunktion, Dichte oder Tabelle, Menge charakterisiert numerische Merkmale- , , usw. Anhand einer Stichprobe müssen Sie in der Lage sein, Näherungen für alle diese Merkmale zu erstellen.

.2 Stichprobenverteilung

Betrachten wir die Implementierung der Stichprobenziehung für ein elementares Ergebnis – eine Reihe von Zahlen , , . Auf einem geeigneten Wahrscheinlichkeitsraum führen wir eine Zufallsvariable ein, die Werte annimmt, mit Wahrscheinlichkeiten von (wenn einer der Werte übereinstimmt, addieren wir die Wahrscheinlichkeiten entsprechend oft). Die Wahrsund die Verteilungsfunktion der Zufallsvariablen sehen folgendermaßen aus:

Die Verteilung einer Größe wird als empirische oder Stichprobenverteilung bezeichnet. Berechnen wir den mathematischen Erwartungswert und die Varianz der Größe und führen die Notation für diese Größen ein:

Berechnen wir auf die gleiche Weise den Moment der Ordnung

IN Allgemeiner Fall durch die Menge bezeichnen

Wenn wir bei der Konstruktion aller von uns eingeführten Merkmale die Stichprobe als eine Menge von Zufallsvariablen betrachten, werden diese Merkmale selbst – , , , , – zu Zufallsvariablen. Diese Merkmale der Stichprobenverteilung werden verwendet, um die entsprechenden unbekannten Merkmale der wahren Verteilung abzuschätzen (zu approximieren).

Der Grund für die Verwendung von Verteilungsmerkmalen zur Schätzung der Merkmale der wahren Verteilung (oder ) ist die Nähe dieser Verteilungen insgesamt.

Denken Sie zum Beispiel daran, einen normalen Würfel zu werfen. Lassen - die Anzahl der während des Wurfs verlorenen Punkte, . Nehmen wir an, dass einer in der Stichprobe einmal vorkommt, zwei - einmal usw. Dann nimmt die Zufallsvariable die Werte an 1 , , 6 mit Wahrscheinlichkeiten bzw. Aber diese Proportionen mit Wachstum nähern sich dem Gesetz große Zahlen. Das heißt, die Verteilung des Wertes nähert sich in gewisser Weise der wahren Verteilung der Anzahl der Punkte an, die beim Werfen des richtigen Würfels erscheinen.

Wir werden nicht klären, was mit der Nähe der Stichprobe und den wahren Verteilungen gemeint ist. In den folgenden Abschnitten werden wir uns jedes der oben vorgestellten Merkmale genauer ansehen und seine Eigenschaften untersuchen, einschließlich seines Verhaltens bei zunehmender Stichprobengröße.

.3 Empirische Verteilungsfunktion, Histogramm

Da eine unbekannte Verteilung beispielsweise durch ihre Verteilungsfunktion beschrieben werden kann, werden wir anhand der Stichprobe eine „Schätzung“ für diese Funktion erstellen.

Definition 1.

Eine empirische Verteilungsfunktion, die aus einer Volumenstichprobe erstellt wird, wird als Zufallsfunktion bezeichnet, für die jeweils gleich ist

Erinnerung: Zufallsfunktion

wird als Ereignisindikator bezeichnet. Bei jedem handelt es sich um eine Zufallsvariable mit einer Bernoulli-Verteilung mit dem Parameter . Warum?

Mit anderen Worten, für jeden Wert, der der wahren Wahrscheinlichkeit entspricht, dass die Zufallsvariable kleiner als ist, wird er durch den Anteil der Stichprobenelemente geschätzt, die kleiner als sind.

Wenn die Stichprobenelemente (bei jedem Elementarergebnis) in aufsteigender Reihenfolge angeordnet werden, wird ein neuer Satz von Zufallsvariablen erhalten, der als Variationsreihe bezeichnet wird:

Das Element , wird als tes Element bezeichnet Variationsreihe oder die te Ordinalstatistik.

Beispiel 1.

Probe:

Variationsreihe:

Reis. 1. Beispiel 1

Die empirische Verteilungsfunktion hat Sprünge an Stichprobenpunkten. Die Größe des Sprungs an einem Punkt ist gleich, wobei die Anzahl der Stichprobenelemente ist, die mit übereinstimmen.

Kann gebaut werden empirische Funktion Verteilungen über die Variationsreihe:

Ein weiteres Verteilungsmerkmal ist die Tabelle (für diskrete Verteilungen) oder die Dichte (für absolut kontinuierliche Verteilungen). Ein empirisches oder selektives Analogon einer Tabelle oder Dichte ist das sogenannte Histogramm.

Ein Histogramm wird anhand gruppierter Daten erstellt. Der geschätzte Wertebereich einer Zufallsvariablen (oder Bereich von Stichprobendaten) wird unabhängig von der Stichprobe in eine bestimmte Anzahl von Intervallen (nicht unbedingt identisch) unterteilt. Seien , , Intervalle auf der Linie, die als Gruppierungsintervalle bezeichnet werden. Bezeichnen wir for durch die Anzahl der Stichprobenelemente, die in das Intervall fallen:

(1)

In jedem Intervall wird ein Rechteck konstruiert, dessen Fläche proportional zu ist. Die Gesamtfläche aller Rechtecke muss gleich eins sein. Sei die Länge des Intervalls. Die Höhe des Rechtecks ​​oben beträgt

Die resultierende Zahl wird als Histogramm bezeichnet.

Beispiel 2.

Es gibt eine Variationsreihe (siehe Beispiel 1):

Hier - dezimaler Logarithmus, also, d.h. Wenn die Stichprobe verdoppelt wird, erhöht sich die Anzahl der Gruppierungsintervalle um 1. Beachten Sie, dass es umso besser ist, je mehr Gruppierungsintervalle vorhanden sind. Wenn wir jedoch die Anzahl der Intervalle beispielsweise in der Größenordnung von annehmen, nähert sich das Histogramm mit zunehmendem Wachstum nicht der Dichte an.

Die folgende Aussage ist wahr:

Wenn die Verteilungsdichte von Stichprobenelementen eine stetige Funktion ist, dann gibt es für eine punktweise Konvergenz der Wahrscheinlichkeit des Histogramms mit der Dichte.

Die Wahl des Logarithmus ist also sinnvoll, aber nicht die einzig mögliche.

Abschluss

Die mathematische (oder theoretische) Statistik basiert auf den Methoden und Konzepten der Wahrscheinlichkeitstheorie, löst aber gewissermaßen inverse Probleme.

Wenn wir die Manifestation von zwei (oder mehr) Zeichen gleichzeitig beobachten, d.h. wir haben eine Menge von Werten mehrerer Zufallsvariablen – was können wir über deren Abhängigkeit sagen? Ist sie da oder nicht? Und wenn ja, was ist dann diese Abhängigkeit?

Oft ist es möglich, Annahmen über die in der Black Box verborgene Verteilung oder über ihre Eigenschaften zu treffen. In diesem Fall ist es notwendig, diese Annahmen („Hypothesen“) anhand experimenteller Daten zu bestätigen oder zu widerlegen. Es muss beachtet werden, dass die Antwort „Ja“ oder „Nein“ nur mit einem gewissen Grad an Sicherheit gegeben werden kann und je länger wir das Experiment fortsetzen können, desto genauer können die Schlussfolgerungen sein. Die günstigste Situation für die Forschung ist, wenn man bestimmte Eigenschaften des beobachteten Experiments sicher behaupten kann – zum Beispiel das Vorhandensein eines funktionalen Zusammenhangs zwischen beobachteten Größen, die Normalität der Verteilung, ihre Symmetrie, das Vorhandensein einer Dichte in der Verteilung oder ihrer diskrete Natur usw. .

Daher ist es sinnvoll, sich an (mathematische) Statistiken zu erinnern, wenn

· es sich um ein Zufallsexperiment handelt, dessen Eigenschaften teilweise oder völlig unbekannt sind,

· Wir sind in der Lage, dieses Experiment unter den gleichen Bedingungen einige Male (oder besser noch: beliebig oft) zu reproduzieren.

Referenzliste

1. Baumol U. Wirtschaftstheorie und Operations Research. - M.; Wissenschaft, 1999.

2. Bolshev L.N., Smirnov N.V. Tabellen der mathematischen Statistik. M.: Nauka, 1995.

3. Borovkov A.A. Mathe-Statistik. M.: Nauka, 1994.

4. Korn G., Korn T. Handbuch der Mathematik für Wissenschaftler und Ingenieure. - St. Petersburg: Lan Publishing House, 2003.

5. Korshunov D.A., Chernova N.I. Sammlung von Problemen und Übungen zur mathematischen Statistik. Nowosibirsk: Verlag des nach ihm benannten Instituts für Mathematik. S. L. Sobolev SB RAS, 2001.

6. Peheletsky I.D. Mathematik: ein Lehrbuch für Studenten. - M.: Akademie, 2003.

7. Sukhodolsky V.G. Vorlesungen über höhere Mathematik für Humanisten. - St. Petersburger Verlag von St. Petersburg staatliche Universität. 2003

8. Feller V. Einführung in die Wahrscheinlichkeitstheorie und ihre Anwendungen. - M.: Mir, T.2, 1984.

9. Harman G., Moderne Faktorenanalyse. - M.: Statistik, 1972.


Harman G., Moderne Faktorenanalyse. - M.: Statistik, 1972.

Jede Studie auf dem Gebiet der Zufallsphänomene hat immer ihre Wurzeln im Experiment, in experimentellen Daten. Numerische Daten, die bei der Untersuchung eines Attributs eines Objekts gesammelt werden, werden aufgerufen statistisch. Statistische Daten sind das Ausgangsmaterial der Studie. Damit sie einen wissenschaftlichen oder praktischen Wert haben, müssen sie mit den Methoden der mathematischen Statistik verarbeitet werden.

Mathe-Statistik- Das wissenschaftliche Disziplin, dessen Untersuchungsgegenstand die Entwicklung von Methoden zur Aufzeichnung, Beschreibung und Analyse statistischer experimenteller Daten ist, die als Ergebnis von Beobachtungen von Massenzufallsphänomenen gewonnen werden.

Die Hauptaufgaben der mathematischen Statistik sind:

    Bestimmung des Verteilungsgesetzes einer Zufallsvariablen oder eines Zufallsvariablensystems;

    Prüfung der Plausibilität von Hypothesen;

    Bestimmung unbekannter Verteilungsparameter.

Alle Methoden der mathematischen Statistik basieren auf der Wahrscheinlichkeitstheorie. Aufgrund der Spezifität der zu lösenden Probleme wird die mathematische Statistik jedoch von der Wahrscheinlichkeitstheorie in ein eigenständiges Fachgebiet abgegrenzt. Wird in der Wahrscheinlichkeitstheorie ein Modell eines Phänomens als gegeben betrachtet und der mögliche reale Verlauf dieses Phänomens berechnet (Abb. 1), so wird in der mathematischen Statistik anhand statistischer Daten ein geeignetes theoretisches Wahrscheinlichkeitsmodell ausgewählt (Abb. 2).

Abb.1. Allgemeines Problem der Wahrscheinlichkeitstheorie

Abb.2. Allgemeines Problem der mathematischen Statistik

Als wissenschaftliche Disziplin entwickelte sich die mathematische Statistik zusammen mit der Wahrscheinlichkeitstheorie. Der mathematische Apparat dieser Wissenschaft wurde in der zweiten Hälfte des 19. Jahrhunderts aufgebaut.

2. Gesamtbevölkerung und Stichprobe.

Zur Untersuchung statistischer Methoden werden die Konzepte der Gesamt- und Stichprobenpopulationen eingeführt. Im Allgemeinen unter Durchschnittsbevölkerung wird als Zufallsvariable X mit einer Verteilungsfunktion verstanden
. Eine Stichprobenpopulation oder Stichprobengröße n für eine gegebene Zufallsvariable X ist eine Menge
unabhängige Beobachtungen dieser Größe, wo wird als Stichprobenwert oder Realisierung einer Zufallsvariablen X bezeichnet. Auf diese Weise, können als Zahlen (wenn das Experiment durchgeführt und die Probe entnommen wird) und als Zufallsvariablen (vor der Durchführung des Experiments) betrachtet werden, da sie sich von Probe zu Probe ändern.

Beispiel 1. Um den Zusammenhang zwischen der Dicke eines Baumstammes und seiner Höhe zu bestimmen, wurden 200 Bäume ausgewählt. In diesem Fall beträgt die Stichprobengröße n=200.

Beispiel 2. Als Ergebnis des Sägens von Spanplatten auf einer Kreissäge wurden 15 Werte der spezifischen Schnittarbeit ermittelt. In diesem Fall ist n=15.

D
Um anhand der Stichprobendaten sicher beurteilen zu können, welches Merkmal der Allgemeinbevölkerung uns interessiert, müssen die Stichprobenobjekte diese korrekt darstellen, d. h. die Stichprobe muss vorhanden sein Vertreter(Vertreter). Die Repräsentativität einer Stichprobe wird in der Regel durch eine zufällige Auswahl von Objekten erreicht: Jedes Objekt in der Grundgesamtheit hat die gleiche Wahrscheinlichkeit, in die Stichprobe aufgenommen zu werden wie alle anderen.

Abb. 3. Demonstration der Repräsentativität der Stichprobe

Mathe-Statistik

Thema und Methoden

Mathematische Statistik ist ein Teilgebiet der Mathematik, das Methoden zur Aufzeichnung, Beschreibung und Analyse von Beobachtungs- und experimentellen Daten mit dem Ziel entwickelt, probabilistische Modelle für Massenzufallsphänomene zu erstellen. Abhängig von der mathematischen Natur spezifischer Beobachtungsergebnisse wird die mathematische Statistik in Zahlenstatistik, multivariate statistische Analyse, Analyse von Funktionen (Prozessen) und Zeitreihen sowie Statistik von Objekten nichtnumerischer Natur unterteilt.

Heutzutage spielen Computer in der mathematischen Statistik eine große Rolle. Sie werden sowohl für Berechnungen als auch für Simulationen verwendet (insbesondere bei Stund bei der Untersuchung der Eignung asymptotischer Ergebnisse).

Anmerkungen

Literatur

  • Wahrscheinlichkeit und mathematische Statistik. Enzyklopädie / Kap. Hrsg. Yu. V. Prochorow. - M.: Verlag „Große russische Enzyklopädie“, 1999.
  • Wald A. Sequenzielle Analyse, trans. aus dem Englischen - M.: Fizmatgiz, 1960.
  • Shiryaev A. N. Statistische sequentielle Analyse. Optimale Stoppregeln – M.: Nauka, 1976

siehe auch

Links


Wikimedia-Stiftung. 2010.

  • Lineare Algebra
  • Mathematische Physik

Sehen Sie in anderen Wörterbüchern, was „mathematische Statistik“ ist:

    MATHEMATISCHE STATISTIK Moderne Enzyklopädie

    MATHEMATISCHE STATISTIK- die Wissenschaft mathematischer Methoden zur Systematisierung und Nutzung statistischer Daten für wissenschaftliche und praktische Schlussfolgerungen. In vielen ihrer Abschnitte basiert die mathematische Statistik auf der Wahrscheinlichkeitstheorie, die es ermöglicht, die Zuverlässigkeit und Genauigkeit zu bewerten ... Großes enzyklopädisches Wörterbuch

    Mathe-Statistik- MATHEMATISCHE STATISTIK, die Wissenschaft der mathematischen Methoden zur Systematisierung und Nutzung statistischer Daten für wissenschaftliche und praktische Schlussfolgerungen. Die Ursprünge der mathematischen Statistik liegen in den Schriften von Wissenschaftlern des späten 17. und frühen 19. Jahrhunderts. In vielen… … Illustriertes enzyklopädisches Wörterbuch

    MATHEMATISCHE STATISTIK- eine Wissenschaft, die sich mit der Beschreibung und Analyse der Ergebnisse von Beobachtungen von Massenphänomenen mit den Methoden der Wahrscheinlichkeitstheorie beschäftigt. Typische Aufgaben MS. Bestimmen der Verteilungstypen einer Zufallsvariablen, Testen statistischer Hypothesen, Schätzen von Parametern usw. Geologische Enzyklopädie

    MATHEMATISCHE STATISTIK- (vom lateinischen Status - Staat). Mit den Methoden des Sprachunterrichts verbunden ist die Wissenschaft der mathematischen Methoden zur Systematisierung und Nutzung statistischer Daten für wissenschaftliche und praktische Schlussfolgerungen. Gesetze von M. s. weit verbreitet in Organisationen... ... Neues Wörterbuch methodische Begriffe und Konzepte (Theorie und Praxis des Sprachunterrichts)

    Mathe-Statistik- ein Zweig der Mathematik, der sich mit Methoden und Regeln zur Verarbeitung und Analyse statistischer Daten befasst (d. h. Informationen über die Anzahl von Objekten, die bestimmte Merkmale in einer mehr oder weniger umfangreichen Population aufweisen). Sami... ... Wirtschaftsmathematisches Wörterbuch

    Mathe-Statistik- Ein Zweig der Mathematik, der sich mit Methoden und Regeln zur Verarbeitung und Analyse statistischer Daten befasst (d. h. Informationen über die Anzahl von Objekten, die bestimmte Merkmale in einer mehr oder weniger umfangreichen Population aufweisen). Die Methoden und Regeln selbst werden erstellt... ... Leitfaden für technische Übersetzer

    Mathe-Statistik- ein Zweig der Mathematik, der sich mathematischen Methoden zur Systematisierung, Verarbeitung und Nutzung statistischer Daten für wissenschaftliche und praktische Schlussfolgerungen widmet. Unter statistischen Daten versteht man in diesem Fall Informationen über die Anzahl der Objekte in einem... ... Große sowjetische Enzyklopädie

    Mathe-Statistik- die Wissenschaft mathematischer Methoden zur Systematisierung und Nutzung statistischer Daten für wissenschaftliche und praktische Schlussfolgerungen. In vielen ihrer Abschnitte basiert die mathematische Statistik auf der Wahrscheinlichkeitstheorie, die es ermöglicht, die Zuverlässigkeit und Genauigkeit von ... zu bewerten. Enzyklopädisches Wörterbuch

„Manche Leute denken, sie hätten immer Recht. Solche Leute könnten weder gute Wissenschaftler sein noch Interesse an Statistik haben ... Der Fall wurde auf die Erde gebracht, wo er Teil der Welt der Wissenschaft wurde.“ (Diamand S.)

„Der Zufall ist nur der Maßstab unserer Unwissenheit. Zufällige Phänomene, wenn wir sie definieren, werden solche sein, deren Gesetze wir nicht kennen.“ (A. Poincaré „Wissenschaft und Hypothese“)

"Gott sei Dank. Ist das nicht der Fall?
Immer auf Augenhöhe mit dem Unveränderlichen...
Der Zufall bestimmt oft das Geschehen,
Erzeugt sowohl Freude als auch Schmerz.
Und das Leben stellt uns vor eine Aufgabe:
Wie man die Rolle des Zufalls versteht“
(aus dem Buch „Mathematics Studies Randomness“ von B.A. Kordemsky)

Die Welt selbst ist natürlich – so betrachten und studieren wir oft die Gesetze der Physik, Chemie usw., und doch geschieht nichts ohne das Eingreifen des Zufalls, der unter dem Einfluss instabiler, kollateraler Kausalzusammenhänge entsteht, die den Verlauf verändern ein Phänomen oder eine Erfahrung, wenn es wiederholt wird. Es entsteht ein „zufälliger Effekt“ mit der inhärenten Regelmäßigkeit der „verborgenen Vorherbestimmung“, d. h. Der Zufall braucht ein natürliches Ergebnis.

Mathematiker betrachten zufällige Ereignisse nur im Dilemma „sein oder nicht sein“ – ob es passieren wird oder nicht.

Definition. Ein Zweig der angewandten Mathematik, der die quantitativen Eigenschaften der Masse untersucht Zufällige Ereignisse oder Phänomene genannt wird mathematische Statistik.

Definition. Man nennt die Kombination von Elementen der Wahrscheinlichkeitstheorie und der mathematischen Statistik Stochastik.

Definition. Stochastik- Dies ist der Zweig der Mathematik, der in engem Zusammenhang mit der praktischen Tätigkeit des Menschen entstanden ist und sich entwickelt. Heutzutage sind Elemente der Stochastik Teil der Mathematik für jedermann und ein neuer, wichtiger Aspekt der Mathematik- und Allgemeinbildung.

Definition. Mathe-Statistik– die Wissenschaft der mathematischen Methoden der Systematisierung, Verarbeitung und Nutzung statistischer Daten für wissenschaftliche und praktische Schlussfolgerungen.

Lassen Sie uns ausführlicher darüber sprechen.

Der allgemein akzeptierte Standpunkt ist heute, dass die mathematische Statistik die Wissenschaft von ist allgemeine Wege Verarbeitung der Versuchsergebnisse. Was muss ein Experiment bei der Lösung dieser Probleme haben, damit die auf seiner Grundlage gefällten Urteile korrekt sind? Mathematische Statistik wird teilweise zur Wissenschaft des experimentellen Designs.

Die Bedeutung des Wortes „Statistik“ hat sich in den letzten zwei Jahrhunderten erheblich verändert, schreiben die berühmten modernen Wissenschaftler Hodges und Lehman: „Das Wort „Statistik“ hat dieselbe Wurzel wie das Wort „Staat“ (Staat) und bedeutete ursprünglich die Kunst und Managementwissenschaften: Die ersten Statistiklehrer an Universitäten im 18. Jahrhundert in Deutschland würden heute Sozialwissenschaftler genannt. Denn Regierungsentscheidungen basieren zum Teil auf Daten über Bevölkerung, Industrie usw. Statistiker begannen sich natürlich für solche Daten zu interessieren, und nach und nach bedeutete das Wort „Statistik“ die Sammlung von Daten über die Bevölkerung, über den Staat und dann die Sammlung und Verarbeitung von Daten im Allgemeinen. Es macht keinen Sinn, Daten zu extrahieren, wenn daraus nicht etwas Nützliches entsteht, und Statistiker werden natürlich in die Interpretation der Daten einbezogen.

Der moderne Statistiker untersucht Methoden, mit denen aus Daten, die typischerweise aus einer Stichprobe der „Bevölkerung“ stammen, Rückschlüsse auf eine Bevölkerung gezogen werden können.

Definition. Statistiker– eine Person, die sich mit der Wissenschaft mathematischer Methoden zur Systematisierung, Verarbeitung und Nutzung statistischer Daten für wissenschaftliche und praktische Schlussfolgerungen beschäftigt.

Die mathematische Statistik entstand im 17. Jahrhundert und entwickelte sich parallel zur Wahrscheinlichkeitstheorie. Die Weiterentwicklung der mathematischen Statistik (zweite Hälfte des 19. und Anfang des 20. Jahrhunderts) ist vor allem P.L. zu verdanken. Tschebyschew, A.A. Markov, A.M. Lyapunov, K. Gauss, A. Quetelet, F. Galton, K. Pearson und andere. Im 20. Jahrhundert leistete A.N. den bedeutendsten Beitrag zur mathematischen Statistik. Kolmogorov, V.I. Romanovsky, E.E. Slutsky, N.V. Smirnov, B.V. Gnedenko sowie der englische Student R. Fisher, E. Purson und amerikanische Wissenschaftler (Y. Neumann, A. Wald).

Probleme der mathematischen Statistik und die Bedeutung von Fehlern in der Welt der Wissenschaft

Die Ermittlung von Mustern, denen Massenzufallsphänomene unterliegen, basiert auf der Untersuchung statistischer Daten aus Beobachtungsergebnissen mit Methoden der Wahrscheinlichkeitstheorie.

Die erste Aufgabe der mathematischen Statistik besteht darin, Möglichkeiten zur Sammlung und Gruppierung statistischer Informationen aufzuzeigen, die als Ergebnis von Beobachtungen oder als Ergebnis speziell konzipierter Experimente gewonnen werden.

Die zweite Aufgabe der mathematischen Statistik besteht darin, Methoden zur Analyse statistischer Daten in Abhängigkeit von den Zielen der Studie zu entwickeln.

Die moderne mathematische Statistik entwickelt Methoden zur Bestimmung der Anzahl notwendiger Tests vor Beginn einer Studie (Versuchsplanung) und während der Studie (Sequenzanalyse). Es kann als die Wissenschaft der Entscheidungsfindung unter Unsicherheit definiert werden.

Kurz gesagt kann man sagen, dass die Aufgabe der mathematischen Statistik darin besteht, Methoden zur Erhebung und Verarbeitung statistischer Daten zu schaffen.

Bei der Untersuchung eines Massenzufallsphänomens wird davon ausgegangen, dass alle Tests unter den gleichen Bedingungen durchgeführt werden, d.h. Eine Gruppe von Hauptfaktoren, die berücksichtigt (messbar) werden können und einen wesentlichen Einfluss auf das Testergebnis haben, behält möglichst gleiche Werte bei.

Zufällige Faktoren verzerren das Ergebnis, das man erhalten hätte, wenn nur die Hauptfaktoren vorhanden wären, und machen es zufällig. Die Abweichung des Ergebnisses jedes Tests vom wahren Ergebnis wird als Beobachtungsfehler bezeichnet und ist eine Zufallsvariable. Es ist zwischen systematischen und zufälligen Fehlern zu unterscheiden.

Ein wissenschaftliches Experiment ist ohne Fehler ebenso undenkbar wie ein Ozean ohne Salz. Jeder Informationsfluss, der unser Wissen erweitert, bringt irgendeine Art von Fehler mit sich. Einem bekannten Sprichwort zufolge können sich die meisten Menschen im Leben nur über den Tod und die Steuern sicher sein, und der Wissenschaftler fügt hinzu: „Und die Irrtümer der Erfahrung.“

Ein Statistiker ist ein „Bluthund“, der nach Fehlern sucht. Statistiktool zur Fehlererkennung.

Das Wort „Fehler“ bedeutet nicht einfach eine „Fehlkalkulation“. Die Folgen einer Fehleinschätzung stellen eine kleine und relativ uninteressante Quelle experimenteller Fehler dar.

Tatsächlich gehen unsere Instrumente kaputt; unsere Augen und Ohren können uns täuschen; Unsere Messungen sind nie ganz genau, manchmal sind sogar unsere arithmetischen Berechnungen fehlerhaft. Ein experimenteller Fehler ist etwas Bedeutenderes als ein ungenaues Maßband oder eine optische Täuschung. Und da die wichtigste Aufgabe der Statistik darin besteht, Wissenschaftlern dabei zu helfen, den Fehler eines Experiments zu analysieren, müssen wir versuchen zu verstehen, was ein Fehler wirklich ist.

Welches Problem auch immer ein Wissenschaftler bearbeitet, es wird sich sicherlich als komplexer erweisen, als ihm lieb ist. Nehmen wir an, er misst den radioaktiven Niederschlag in verschiedene Breitengrade. Die Ergebnisse hängen von der Höhe des Ortes ab, an dem die Proben entnommen werden, von der lokalen Niederschlagsmenge und der Höhe von Wirbelstürmen über ein größeres Gebiet.

Experimentelle Fehler sind ein wesentlicher Bestandteil jedes wirklich wissenschaftlichen Experiments.

Das gleiche Ergebnis können je nach Problem und Sichtweise Fehler und Informationen sein. Wenn ein Biologe untersuchen möchte, wie sich Veränderungen in der Ernährung auf das Wachstum auswirken, ist das Vorhandensein einer entsprechenden Konstitution eine Fehlerquelle; Wenn er den Zusammenhang zwischen Vererbung und Wachstum untersucht, werden Unterschiede in der Ernährung die Fehlerquelle sein. Wenn ein Physiker den Zusammenhang zwischen elektrischer Leitfähigkeit und Temperatur untersuchen möchte, sind Unterschiede in der Dichte des leitenden Materials eine Fehlerquelle; Wenn er den Zusammenhang zwischen dieser Dichte und der elektrischen Leitfähigkeit untersucht, werden Temperaturänderungen eine Fehlerquelle sein.

Diese Verwendung des Wortes „Fehler“ mag zweifelhaft erscheinen, und es wäre vielleicht besser zu sagen, dass die erzielten Wirkungen durch „unbeabsichtigte“ oder „unerwünschte“ Einflüsse verfälscht werden. Wir entwerfen ein Experiment, um bekannte Einflüsse zu untersuchen, aber zufällige Faktoren, die wir nicht vorhersagen oder analysieren können, verzerren die Ergebnisse, indem sie ihre eigenen Effekte hinzufügen.

Der Unterschied zwischen geplanten Wirkungen und Wirkungen aufgrund zufälliger Ursachen ist wie der Unterschied zwischen den Bewegungen eines Schiffes auf See, das einen bestimmten Kurs einschlägt, und der eines Schiffes, das ziellos unter dem Willen wechselnder Winde und Strömungen treibt. Die Bewegung des zweiten Gefäßes kann als Zufallsbewegung bezeichnet werden. Es ist möglich, dass dieses Schiff in einem Hafen ankommt, wahrscheinlicher ist jedoch, dass es an keinem bestimmten Ort ankommt.

Statistiker verwenden das Wort „zufällig“, um ein Phänomen zu bezeichnen, dessen Ausgang zum nächsten Zeitpunkt völlig unmöglich vorherzusagen ist.

Der durch die im Experiment vorhergesehenen Effekte verursachte Fehler ist manchmal eher systematischer als zufälliger Natur.

Systematische Fehler sind irreführender als zufällige Fehler. Störungen durch einen anderen Radiosender können zu einer systematischen musikalischen Begleitung führen, die Sie manchmal vorhersagen können, wenn Sie die Melodie kennen. Aber diese „Begleitung“ kann der Grund dafür sein, dass wir möglicherweise ein falsches Urteil über den Text oder die Musik des Programms fällen, das wir hören möchten.

Die Entdeckung eines systematischen Fehlers führt uns jedoch oft auf die Spur einer neuen Entdeckung. Zu wissen, wie zufällige Fehler entstehen, hilft uns, systematische Fehler zu erkennen und somit zu beseitigen.

Die gleiche Art des Denkens ist in unseren alltäglichen Angelegenheiten üblich. Wie oft merken wir: „Das ist kein Unfall!“ Wann immer wir das sagen können, sind wir auf dem Weg der Entdeckung.

Zum Beispiel A.L. Chizhevsky analysiert historische Prozesse: erhöhte Sterblichkeit, Epidemien, Kriegsausbrüche, große Völkerbewegungen, plötzliche Veränderungen Klima usw. entdeckte den Zusammenhang zwischen diesen unabhängigen Prozessen und Perioden der Sonnenaktivität, die Zyklen haben: 11 Jahre, 33 Jahre.

Definition. Unter systematischem Fehler Unter Fehler versteht man einen Fehler, der sich wiederholt und bei allen Tests gleich ist. Dies ist in der Regel mit einer unsachgemäßen Durchführung des Experiments verbunden.

Definition. Unter zufälligen Fehlern bezieht sich auf Fehler, die unter dem Einfluss zufälliger Faktoren entstehen und von Experiment zu Experiment zufällig variieren.

Typischerweise ist die Verteilung zufälliger Fehler symmetrisch um Null, woraus eine wichtige Schlussfolgerung folgt: Ohne systematische Fehler ist das wahre Testergebnis die mathematische Erwartung einer Zufallsvariablen, deren spezifischer Wert in jedem Test festgelegt wird.

Die Untersuchungsgegenstände in der mathematischen Statistik können qualitative oder quantitative Merkmale des untersuchten Phänomens oder Prozesses sein.

Im Falle eines qualitativen Merkmals wird die Anzahl des Vorkommens dieses Merkmals in der betrachteten Versuchsreihe gezählt; Diese Zahl stellt die untersuchte (diskrete) Zufallsvariable dar. Beispiele für Qualitätsmerkmale sind Mängel an einem fertigen Teil, demografische Daten usw. Wenn das Merkmal quantitativ ist, dann ergibt das Experiment direkte oder indirekte Messungen durch Vergleich mit einem Standard – einer Maßeinheit – unter Verwendung verschiedener Messgeräte. Wenn es sich beispielsweise um eine Charge von Teilen handelt, dann qualitatives Zeichen Die Standardisierung des Teils kann als quantitativer Indikator dienen, und die kontrollierte Größe des Teils kann als quantitativer Indikator dienen.

Grundlegende Definitionen

Ein wesentlicher Teil der mathematischen Statistik ist mit der Notwendigkeit verbunden, eine große Sammlung von Objekten zu beschreiben.

Definition. Die gesamte Menge der zu untersuchenden Objekte wird aufgerufen die allgemeine Bevölkerung.

Die Gesamtbevölkerung kann die gesamte Bevölkerung des Landes, die monatliche Produktion einer Pflanze, die in einem bestimmten Reservoir lebende Fischpopulation usw. sein.

Aber die Bevölkerung ist nicht nur eine Menge. Wenn die Menge der Objekte, an denen wir interessiert sind, zu zahlreich ist, die Objekte schwer zugänglich sind oder es andere Gründe gibt, die es uns nicht erlauben, alle Objekte zu untersuchen, greifen wir auf die Untersuchung eines Teils der Objekte zurück.

Definition. Der Teil der Objekte, der einer Inspektion, Forschung usw. unterzogen wurde, wird als bezeichnet Stichprobenpopulation oder einfach Probenahme.

Definition. Die Anzahl der Elemente in der Grundgesamtheit und Stichprobe wird als „ihr“ bezeichnet Bände.

So stellen Sie sicher, dass die Stichprobe das Ganze am besten repräsentiert, d. h. Wäre es repräsentativ?

Wenn das Ganze, d.h. Wenn die Population klein oder uns völlig unbekannt ist, können wir nichts Besseres als eine rein zufällige Auswahl anbieten. Ein größeres Bewusstsein ermöglicht es Ihnen, besser zu handeln, aber dennoch kommt es irgendwann zu Unwissenheit und in der Folge zu zufälligen Entscheidungen.

Aber wie trifft man eine rein zufällige Wahl? In der Regel erfolgt die Auswahl nach leicht beobachtbaren Merkmalen, zu deren Zweck die Forschung betrieben wird.

Verstöße gegen die Grundsätze der Zufallsauswahl führten zu schwerwiegenden Fehlern. Berühmt wurde eine Umfrage der amerikanischen Zeitschrift Literary Review zum Ausgang der Präsidentschaftswahl 1936 durch ihr Scheitern. Die Kandidaten bei dieser Wahl waren F.D. Roosevelt und A.M. Landon.

Wer hat gewonnen?

Als Gesamtbevölkerung dienten die Redakteure Telefonbücher. Nachdem sie vier Millionen Adressen zufällig ausgewählt hatte, verschickte sie Postkarten mit der Frage nach der Einstellung gegenüber Präsidentschaftskandidaten im ganzen Land. Nachdem das Magazin eine große Summe für Mailings und die Bearbeitung von Postkarten ausgegeben hatte, verkündete es, dass Landon die bevorstehenden Präsidentschaftswahlen mit einem Erdrutschsieg gewinnen würde. Das Wahlergebnis war das Gegenteil dieser Prognose.

Hier wurden gleich zwei Fehler gemacht. Erstens bieten Telefonbücher keine repräsentative Stichprobe der US-Bevölkerung – meist wohlhabende Haushaltsvorstände. Zweitens schickten nicht alle Menschen Antworten, sondern größtenteils von Vertretern der Geschäftswelt, die Landon unterstützten.

Gleichzeitig haben die Soziologen J. Gallan und E. Warner den Sieg von F.D. richtig vorhergesagt. Roosevelt, basierend nur auf viertausend Fragebögen. Der Grund für diesen Erfolg war nicht nur die richtige Bemusterung. Sie berücksichtigten, dass die Gesellschaft in soziale Gruppen gespalten ist, die im Verhältnis zu Präsidentschaftskandidaten homogener sind. Daher kann die Probe aus der Schicht bei gleicher Genauigkeit relativ klein sein. Am Ende gewann Roosevelt, der Reformen für die weniger wohlhabenden Bevölkerungsschichten befürwortete.

Anhand der Ergebnisse der Befragung nach Schichten ist es möglich, die Gesellschaft als Ganzes zu charakterisieren.

Was sind Proben?

Das sind Zahlenreihen.

Lassen Sie uns näher auf die Grundkonzepte eingehen, die die Beispielserie charakterisieren.

Aus der Allgemeinbevölkerung wurde eine Stichprobe der Größe n entnommen > n 1, wobei n 1 die Häufigkeit ist, mit der das Auftreten von x 1, n 2 - x 2 usw. beobachtet wurde.

Die beobachteten Werte von x i werden als Varianten bezeichnet, und die in aufsteigender Reihenfolge geschriebene Folge von Varianten wird als Variationsreihe bezeichnet. Die Beobachtungszahlen n i werden als Häufigkeiten bezeichnet und n i /n als relative Häufigkeiten (oder Häufigkeiten).

Definition. Verschiedene Bedeutungen Zufallsvariable heißt Optionen.

Definition. Variationsreihe ist eine in aufsteigender (oder absteigender) Reihenfolge angeordnete Reihe von Optionen mit ihren entsprechenden Häufigkeiten (Frequenzen).

Bei der Untersuchung von Variationsreihen wird neben den Konzepten der Häufigkeit auch das Konzept der akkumulierten Häufigkeit verwendet. Die akkumulierten Häufigkeiten (Frequenzen) für jedes Intervall werden durch sequentielles Summieren der Häufigkeiten aller vorherigen Intervalle ermittelt.

Definition. Die Anhäufung von Frequenzen bzw. Frequenzen nennt man Kumulierung. Sie können Häufigkeiten und Intervalle kumulieren.

Die Merkmale einer Reihe können quantitativ und qualitativ sein.

Quantitative (Variations-)Merkmale- Dies sind Merkmale, die in Zahlen ausgedrückt werden können. Sie sind in diskrete und kontinuierliche unterteilt.

Qualitative (attributive) Merkmale– das sind Merkmale, die sich nicht in Zahlen ausdrücken lassen.

Kontinuierliche Variablen sind Variablen, die als reelle Zahlen ausgedrückt werden.

Diskrete Variablen sind Variablen, die nur als ganze Zahlen ausgedrückt werden können.

Die Proben werden charakterisiert zentrale Tendenzen: Mittelwert, Modus und Median. Der Durchschnittswert einer Stichprobe ist das arithmetische Mittel aller ihrer Werte. Der Abtastmodus sind die Werte, die am häufigsten vorkommen. Der Stichprobenmedian ist die Zahl, die die geordnete Grundgesamtheit aller Werte in der Stichprobe in die Hälfte „teilt“.

Die Variationsreihe kann diskret oder kontinuierlich sein.

Aufgabe

Gegebene Probe: 1,3; 1,8; 1,2; 3,0; 2.1; 5; 2,4; 1,2; 3,2;1,2; 4; 2.4.

Dies ist eine Reihe von Optionen. Wenn wir diese Optionen in aufsteigender Reihenfolge anordnen, erhalten wir eine Variationsreihe: 1.2; 1,2; 1,2; 1,3; 1,8; 2.1; 2,4; 2,4; 3,0; 3,2; 4; 5.

Der Durchschnittswert dieser Reihe beträgt 2,4.

Der Median der Reihe liegt bei 2,25.

Der Modus der Reihe ist –1,2.

Lassen Sie uns diese Konzepte definieren.

Definition. Median der Variationsreihe Der Wert der Zufallsvariablen, der in der Mitte der Variationsreihe (Me) liegt, wird aufgerufen.

Der Median einer geordneten Zahlenreihe mit einer ungeraden Anzahl von Termen ist die in der Mitte geschriebene Zahl, und der Median einer geordneten Zahlenreihe mit einer geraden Anzahl von Termen ist das arithmetische Mittel der beiden in der Mitte geschriebenen Zahlen. Der Median einer beliebigen Zahlenreihe ist der Median der entsprechenden geordneten Reihe.

Definition. Variationsserie Mode Sie nennen die Option (den Wert der Zufallsvariablen), der die höchste Häufigkeit (Mo) entspricht, d.h. was häufiger vorkommt als andere.

Definition. Der arithmetische Mittelwert der Variationsreihe ist das Ergebnis der Division der Summe der Werte einer statistischen Variablen durch die Anzahl dieser Werte, also durch die Anzahl der Terme.

Die Regel zum Ermitteln des arithmetischen Mittels einer Stichprobe:

  1. multiplizieren Sie jede Option mit ihrer Häufigkeit (Multiplizität);
  2. addieren Sie alle resultierenden Produkte;
  3. Teilen Sie die gefundene Summe durch die Summe aller Häufigkeiten.

Definition. Zeilenbereich heißt die Differenz zwischen R=x max -x min, d.h. größte und niedrigsten Werte diese Optionen.

Überprüfen wir, ob wir anhand der Definitionen den Mittelwert dieser Reihe, des Medians und des Modus richtig ermittelt haben.

Wir haben die Anzahl der Terme gezählt, es sind 12 – eine gerade Anzahl von Termen, was bedeutet, dass wir das arithmetische Mittel der beiden in der Mitte geschriebenen Zahlen ermitteln müssen, also die 6. und 7. Option. (2,1+2,4)\2=2,25 – Median.

Mode. Die Mode ist 1,2, weil nur diese Zahl kommt dreimal vor, der Rest kommt weniger als dreimal vor.

Das arithmetische Mittel ermitteln wir so:

(1,2*3+1,3+1,8+2,1+2,4*2+3,0+3,2 +4+5)\12=2,4

Machen wir einen Tisch

Solche Tabellen werden Häufigkeitstabellen genannt. In ihnen sind die Zahlen in der zweiten Zeile Häufigkeiten; Sie zeigen an, wie oft bestimmte Werte in der Stichprobe vorkommen.

Definition. Relative Frequenz Beispielwerte ist das Verhältnis seiner Häufigkeit zur Anzahl aller Beispielwerte.

Relative Frequenzen werden auch Frequenzen genannt. Frequenzen und Frequenzen werden Skalen genannt. Lassen Sie uns den Bereich der Reihe ermitteln: R=5-1,2=3,8; Der Bereich der Serie beträgt 3,8.

Denkanstöße

Das arithmetische Mittel ist ein konventioneller Wert. In Wirklichkeit existiert es nicht. In Wirklichkeit handelt es sich um einen Gesamtbetrag. Daher ist das arithmetische Mittel kein Merkmal einer einzelnen Beobachtung; es charakterisiert die Serie als Ganzes.

Mittlere Bedeutung kann als Streuungszentrum der Werte des beobachteten Merkmals interpretiert werden, d.h. Wert, um den alle beobachteten Werte schwanken, und algebraische Summe Abweichungen vom Durchschnitt sind immer Null, d.h. die Summe der Abweichungen vom Durchschnitt nach oben oder unten ist gleich.

Arithmetische Mittel ist eine abstrakte (verallgemeinernde) Größe. Auch bei Angabe einer Serie nur ab natürliche Zahlen, der Durchschnittswert kann als Bruch ausgedrückt werden. Beispiel: Durchschnittsnote Testarbeit 3,81.

Mittlere Bedeutung findet sich nicht nur für homogene Größen. Durchschnittlicher Getreideertrag im ganzen Land (Mais – 50–60 Zentner pro Hektar und Buchweizen – 5–6 Zentner pro Hektar, Roggen, Weizen usw.), durchschnittlicher Nahrungsmittelverbrauch, durchschnittliches Nationaleinkommen pro Kopf, durchschnittliches Wohnungsangebot, gewichteter durchschnittlicher Wohnraum Kosten, durchschnittliche Arbeitsintensität des Hochbaus usw. - Dies sind die Merkmale des Staates als einheitliches nationales Wirtschaftssystem, dies sind die sogenannten Systemdurchschnitte.

In der Statistik werden solche Merkmale wie Modus und Median. Sie werden strukturelle Durchschnittswerte genannt, weil Die Werte dieser Merkmale werden durch die allgemeine Struktur der Datenreihe bestimmt.

Manchmal kann eine Serie zwei Modi haben, manchmal hat eine Serie keinen Modus.

Mode ist der akzeptabelste Indikator zur Identifizierung der Verpackung eines bestimmten Produkts, das von Käufern bevorzugt wird; Preise für Waren einer bestimmten Art, die auf dem Markt üblich sind; B. die Größe von Schuhen und Kleidung, die am meisten nachgefragt wird; eine Sportart, die die Mehrheit der Bevölkerung eines Landes, einer Stadt, eines Dorfes, einer Schule usw. bevorzugt betreibt.

Im Bauwesen gibt es 8 Optionen für Platten in der Breite, und 3 Typen werden häufiger verwendet: 1 m, 1,2 m und 1,5 m. In der Länge gibt es 33 Optionen für Platten, am häufigsten sind jedoch Platten mit einer Länge von 4,8 m gebraucht; 5,7 m und 6,0 ​​m, unter diesen 3 Größen ist die Plattenform am häufigsten anzutreffen. Das Gleiche gilt für Fenstermarken.

Der Modus einer Datenreihe wird gefunden, wenn man einen typischen Indikator identifizieren möchte.

Ein Modus kann in Zahlen und Worten ausgedrückt werden; aus statistischer Sicht ist ein Modus ein Extremum der Häufigkeit.

Median ermöglicht es Ihnen, Informationen über eine Reihe von Daten zu berücksichtigen, die durch das arithmetische Mittel gegeben sind, und umgekehrt.

Mathematische Statistik ist ein Teilgebiet der Mathematik, das sich mit mathematischen Methoden zur Systematisierung, Verarbeitung und Nutzung statistischer Daten für wissenschaftliche und praktische Zwecke befasst.

Statistische Daten sind Informationen über die Anzahl und Art von Objekten in einer mehr oder weniger umfangreichen Sammlung, die bestimmte Eigenschaften aufweisen.

Eine Forschungsmethode, die auf der Berücksichtigung statistischer Daten aus bestimmten Objektmengen basiert, wird als statistisch bezeichnet.

Die formale mathematische Seite statistischer Forschungsmethoden ist unabhängig von der Art der untersuchten Objekte und bildet den Gegenstand der mathematischen Statistik.

Die Hauptaufgabe der mathematischen Statistik besteht darin, aus Beobachtungen oder Experimenten Rückschlüsse auf Massenphänomene und -prozesse zu ziehen.

Statistik ist eine Wissenschaft, die es uns ermöglicht, Muster im Chaos zufälliger Daten zu erkennen, etablierte Zusammenhänge darin hervorzuheben und unser Handeln zu bestimmen, um den Anteil richtig getroffener Entscheidungen zu erhöhen.

Viele heute bekannte Beziehungen zwischen verschiedenen Aspekten der uns umgebenden Welt wurden durch die Analyse der von der Menschheit gesammelten Daten ermittelt. Nach der statistischen Erkennung von Abhängigkeiten findet man bereits die eine oder andere rationale Erklärung für die entdeckten Muster.

Schauen wir uns ein Beispiel an, um die ersten Definitionen von Statistiken zu skizzieren.

Beispiel. Angenommen, es ist notwendig, den Grad der Veränderung des IQ von 100 Studierenden über einen Zeitraum von drei Studienjahren abzuschätzen. Betrachten Sie als Indikator das Verhältnis des aktuellen Koeffizienten zum zuvor gemessenen Koeffizienten (vor drei Jahren), multipliziert mit 100 %.

Lassen Sie uns eine Folge von 100 Zufallsvariablen erhalten: 97,8; 97,0; 101,7; 132,5; 142; ...; 122. Bezeichnen wir es mit X.

Definition 1. Die als Ergebnis einer Studie beobachtete Folge von Zufallsvariablen X wird in der Statistik als Vorzeichen bezeichnet.

Definition 2.Verschiedene Werte eines Merkmals werden als Varianten bezeichnet.

Aus den angegebenen Werten ist es schwierig, Aussagen über die Dynamik der Veränderungen des IQ während des Lernprozesses zu treffen. Ordnen wir diese Reihenfolge in aufsteigender Reihenfolge an: 94; 97,0; 97,8; …142. Aus der resultierenden Sequenz ist es bereits möglich, einige zu extrahieren nützliche Informationen– Es ist beispielsweise einfach, die minimalen und maximalen Werte eines Merkmals zu ermitteln. Es ist jedoch nicht klar, wie sich das Merkmal auf die gesamte befragte Studierendenpopulation verteilt. Teilen wir die Optionen in Intervalle ein. Nach der Sturges-Formel die empfohlene Anzahl an Intervallen

M= 1+3,32l g(n)≈ 7,6 und der Wert des Intervalls ist .

Die Bereiche der erhaltenen Intervalle sind in Spalte 1 der Tabelle angegeben.


Zählen wir, wie viele Merkmalswerte in jedes Intervall fallen und schreiben sie in Spalte 3.

Definition 3.Eine Zahl, die angibt, wie viele Optionen in einer bestimmten Option enthalten sind i-tes Intervall, heißt Frequenz und wird mit n i bezeichnet.

Definition 4.Häufigkeit zu Gesamtzahl Beobachtungen wird relative Häufigkeit (w i) oder Gewicht genannt.

Definition 5.Eine Variationsreihe ist eine Reihe von Optionen, die in aufsteigender oder absteigender Reihenfolge mit ihren entsprechenden Gewichtungen angeordnet sind.

In diesem Beispiel sind die Optionen die Mitten der Intervalle.

Definition 6.Kumulierte Häufigkeit( )eine Zahlenvariante mit einem charakteristischen Wert kleiner als x (хОR) wird aufgerufen.



Lesen Sie auch: