So ermitteln Sie den arithmetischen Durchschnitt in Excel. Bestimmung des Mittelwerts, der Varianz und der Form der Verteilung. Beschreibende Statistik So ermitteln Sie das arithmetische Mittel zweier Zahlen

Um den Durchschnittswert in Excel zu ermitteln (egal ob es sich um einen Zahlen-, Text-, Prozent- oder anderen Wert handelt), gibt es viele Funktionen. Und jeder von ihnen hat seine eigenen Eigenschaften und Vorteile. Tatsächlich können bei dieser Aufgabe bestimmte Bedingungen festgelegt werden.

Beispielsweise werden die Durchschnittswerte einer Zahlenreihe in Excel mithilfe statistischer Funktionen berechnet. Sie können Ihre eigene Formel auch manuell eingeben. Betrachten wir verschiedene Optionen.

Wie finde ich das arithmetische Mittel von Zahlen?

Um das arithmetische Mittel zu ermitteln, müssen Sie alle Zahlen in der Menge addieren und die Summe durch die Menge dividieren. Zum Beispiel die Noten eines Studenten in Informatik: 3, 4, 3, 5, 5. Was im Quartal enthalten ist: 4. Das arithmetische Mittel haben wir mit der Formel ermittelt: =(3+4+3+5+5) /5.

So geht das schnell mit Excel-Funktionen? Nehmen wir zum Beispiel eine Reihe von Zufallszahlen in einer Zeichenfolge:

Oder: Machen Sie die aktive Zelle und geben Sie die Formel einfach manuell ein: =AVERAGE(A1:A8).

Sehen wir uns nun an, was die AVERAGE-Funktion sonst noch tun kann.


Lassen Sie uns das arithmetische Mittel der ersten zwei und drei ermitteln letzte Zahlen. Formel: =DURCHSCHNITT(A1:B1,F1:H1). Ergebnis:



Zustand durchschnittlich

Die Bedingung für die Bildung des arithmetischen Mittels kann ein numerisches Kriterium oder ein Textkriterium sein. Wir werden die Funktion verwenden: =AVERAGEIF().

Ermitteln Sie das arithmetische Mittel von Zahlen, die größer oder gleich 10 sind.

Funktion: =AVERAGEIF(A1:A8,">=10")


Das Ergebnis der Verwendung der AVERAGEIF-Funktion unter der Bedingung „>=10“:

Das dritte Argument – ​​„Durchschnittsbereich“ – wird weggelassen. Erstens ist es nicht erforderlich. Zweitens enthält der vom Programm analysierte Bereich NUR numerische Werte. Die im ersten Argument angegebenen Zellen werden gemäß der im zweiten Argument angegebenen Bedingung durchsucht.

Aufmerksamkeit! Das Suchkriterium kann in der Zelle angegeben werden. Und verknüpfen Sie es in der Formel.

Lassen Sie uns den Durchschnittswert der Zahlen mithilfe des Textkriteriums ermitteln. Zum Beispiel der durchschnittliche Umsatz des Produkts „Tische“.

Die Funktion sieht folgendermaßen aus: =AVERAGEIF($A$2:$A$12,A7,$B$2:$B$12). Bereich – eine Spalte mit Produktnamen. Das Suchkriterium ist ein Link zu einer Zelle mit dem Wort „Tabellen“ (anstelle des Links A7 können Sie auch das Wort „Tabellen“ einfügen). Mittelungsbereich – die Zellen, aus denen Daten zur Berechnung des Durchschnittswerts entnommen werden.

Als Ergebnis der Berechnung der Funktion erhalten wir folgenden Wert:

Aufmerksamkeit! Für ein Textkriterium (Bedingung) muss der Mittelungsbereich angegeben werden.

Wie berechnet man den gewichteten Durchschnittspreis in Excel?

Wie haben wir den gewichteten Durchschnittspreis ermittelt?

Formel: =SUMPRODUCT(C2:C12,B2:B12)/SUM(C2:C12).


Mit der SUMMENPRODUKT-Formel ermitteln wir den Gesamtumsatz nach dem Verkauf der gesamten Warenmenge. Und die SUMME-Funktion summiert die Warenmenge. Indem wir den Gesamtumsatz aus dem Verkauf von Waren durch die Gesamtzahl der Wareneinheiten dividierten, ermittelten wir den gewichteten Durchschnittspreis. Dieser Indikator berücksichtigt das „Gewicht“ jedes Preises. Sein Anteil an der Gesamtmasse der Werte.

Standardabweichung: Formel in Excel

Es gibt Standardabweichungen für die Gesamtbevölkerung und für die Stichprobe. Im ersten Fall ist dies die Wurzel der allgemeinen Varianz. Im zweiten - von Stichprobenvarianz.

Zur Berechnung dieses statistischen Indikators wird eine Streuungsformel erstellt. Daraus wird die Wurzel gewonnen. Aber in Excel gibt es eine vorgefertigte Funktion zum Ermitteln der Standardabweichung.


Die Standardabweichung ist an den Maßstab der Quelldaten gebunden. Für figurative Darstellung Dies reicht nicht für die Variation des analysierten Bereichs aus. Um den relativen Grad der Datenstreuung zu erhalten, wird der Variationskoeffizient berechnet:

Standardabweichung / arithmetisches Mittel

Die Formel in Excel sieht so aus:

STDEV (Wertebereich) / AVERAGE (Wertebereich).

Der Variationskoeffizient wird in Prozent berechnet. Daher legen wir das Prozentformat in der Zelle fest.

Durchschnittsgehalt... Durchschnittliche Lebenserwartung... Fast jeden Tag hören wir diese Ausdrücke, mit denen wir viele beschreiben Singular. Aber seltsamerweise ist der „Durchschnittswert“ ein ziemlich heimtückisches Konzept, das gewöhnliche und unerfahrene Menschen oft in die Irre führt mathematische Statistik, Person.

Was ist das Problem?

Mit dem Durchschnittswert ist meist das arithmetische Mittel gemeint, das unter dem Einfluss einzelner Fakten oder Ereignisse stark schwankt. Und Sie werden kein wirkliches Gefühl dafür bekommen, wie genau die Werte verteilt sind, die Sie untersuchen.

Schauen wir uns das klassische Beispiel des Durchschnittsgehalts an.

Ein abstraktes Unternehmen hat zehn Mitarbeiter. Neun von ihnen erhalten ein Gehalt von etwa 50.000 Rubel, und einer erhält ein Gehalt von 1.500.000 Rubel (durch einen seltsamen Zufall ist er auch Generaldirektor dieser Firma).

Der Durchschnittswert beträgt in diesem Fall 195.150 Rubel, was, wie Sie mir zustimmen werden, falsch ist.

Welche Methoden zur Durchschnittsberechnung gibt es?

Der erste Weg besteht darin, das bereits erwähnte zu berechnen arithmetisches Mittel, also die Summe aller Werte dividiert durch ihre Anzahl.

  • x – arithmetisches Mittel;
  • x n – spezifische Bedeutung;
  • n – Anzahl der Werte.
  • Funktioniert gut mit der Normalverteilung der Werte in der Stichprobe;
  • Einfach zu berechnen;
  • Intuitiv klar.
  • Gibt keine wirkliche Vorstellung von der Werteverteilung;
  • Eine instabile Größe, die leicht Ausreißern unterliegt (wie im Fall des CEO).

Der zweite Weg ist die Berechnung Mode, also der am häufigsten vorkommende Wert.

  • M 0 – Modus;
  • x 0 – untere Grenze des Intervalls, das den Modus enthält;
  • n – Intervallwert;
  • f m – Häufigkeit (wie oft ein bestimmter Wert in einer Reihe vorkommt);
  • f m-1 – Häufigkeit des Intervalls vor dem modalen Intervall;
  • f m+1 – Häufigkeit des Intervalls, das dem modalen Intervall folgt.
  • Ideal, um einen Eindruck von der öffentlichen Meinung zu bekommen.
  • Gut für nicht numerische Daten (Saisonfarben, Bestseller, Bewertungen);
  • Einfach zu verstehen.
  • Mode existiert möglicherweise einfach nicht (keine Wiederholungen);
  • Es kann mehrere Modi geben (multimodale Verteilung).

Der dritte Weg ist die Berechnung Mediane, also der Wert, der die geordnete Stichprobe in zwei Hälften teilt und zwischen ihnen liegt. Und wenn es keinen solchen Wert gibt, wird das arithmetische Mittel zwischen den Grenzen der Stichprobenhälften als Median genommen.

  • M e – Median;
  • x 0 – die untere Grenze des Intervalls, das den Median enthält;
  • h – Intervallwert;
  • f i – Häufigkeit (wie oft ein bestimmter Wert in einer Reihe vorkommt);
  • S m-1 – Summe der Häufigkeiten der Intervalle vor dem Median;
  • f m – Anzahl der Werte im Medianintervall (seine Häufigkeit).
  • Bietet die realistischste und repräsentativste Schätzung;
  • Beständig gegen Emissionen.
  • Schwieriger zu berechnen, da die Probe vor der Berechnung bestellt werden muss.

Wir haben uns die wichtigsten Methoden zur Ermittlung des Durchschnittswerts angesehen, genannt Maße der zentralen Tendenz(Eigentlich gibt es noch mehr, aber diese sind die beliebtesten).

Gehen wir nun zurück zu unserem Beispiel und berechnen mit speziellen Excel-Funktionen alle drei Möglichkeiten für den Durchschnitt:

  • DURCHSCHNITT(Zahl1;[Zahl2];…) – Funktion zur Bestimmung des arithmetischen Mittels;
  • MODE.ONE(Nummer1;[Nummer2];...) – Modusfunktion (in älteren Versionen von Excel wurde MODE(Nummer1;[Nummer2];...) verwendet);
  • MEDIAN(Nummer1;[Nummer2];...) – Funktion zum Finden des Medians.

Und hier sind die Werte, die wir erhalten haben:

In diesem Fall charakterisieren Modus und Median viel besser Durchschnittsgehalt in Gesellschaft.

Was aber tun, wenn die Stichprobe nicht wie im Beispiel 10 Werte, sondern Millionen enthält? In Excel lässt sich das nicht berechnen, aber in der Datenbank, in der Ihre Daten gespeichert sind, kein Problem.

Berechnung des arithmetischen Mittels in SQL

Hier ist alles ganz einfach, da SQL eine spezielle Aggregatfunktion AVG bereitstellt.

Und um es zu verwenden, schreiben Sie einfach die folgende Abfrage:

Mode in SQL berechnen

In SQL gibt es keine separate Funktion zum Finden eines Modus, aber Sie können schnell und einfach selbst eine schreiben. Dazu müssen wir herausfinden, welches Gehalt am häufigsten wiederholt wird, und das beliebteste auswählen.

Schreiben wir eine Anfrage:

/* WITH TIES muss zu TOP() hinzugefügt werden, wenn die Menge multimodal ist, d. ) BESCHREIBUNG

Berechnen des Medians in SQL

Wie bei mode verfügt SQL nicht über eine integrierte Funktion zum Berechnen des Medians, aber über eine generische Funktion zum Berechnen von Perzentilen, PERCENTILE_CONT .

Es sieht alles so aus:

/* In diesem Fall beträgt das Perzentil 0,5 und ist der Median. */ SELECT TOP(1) PERCENTILE_CONT(0.5) WITHIN GROUP (ORDER NACH Gehalt) OVER() AS „Median-Gehalt“ von Mitarbeitern

Es ist besser, mehr über die Funktionsweise der Funktion PERCENTILE_CONT in der Microsoft- und Google BigQuery-Hilfe zu lesen.

Welche Methode soll ich verwenden?

Daraus folgt, dass der Median Der beste Weg um den Durchschnitt zu berechnen.

Aber das ist nicht immer der Fall. Wenn Sie mit einem Durchschnitt arbeiten, achten Sie auf eine multimodale Verteilung:

Die Grafik zeigt eine bimodale Verteilung mit zwei Peaks. Diese Situation kann beispielsweise bei der Teilnahme an Wahlen auftreten.

In diesem Fall sind das arithmetische Mittel und der Median Werte, die irgendwo in der Mitte liegen und nichts darüber aussagen, was tatsächlich passiert. Es ist besser, sofort zu erkennen, dass es sich um eine bimodale Verteilung handelt, indem man zwei Modi angibt.

Besser noch: Teilen Sie die Stichprobe in zwei Gruppen auf und sammeln Sie für jede statistische Daten.

Abschluss:

Bei der Auswahl einer Methode zur Ermittlung des Durchschnitts müssen Sie das Vorhandensein von Ausreißern sowie die Normalität der Werteverteilung in der Stichprobe berücksichtigen.

Die endgültige Wahl des Maßes der zentralen Tendenz liegt immer beim Analytiker.

Erinnern!

Zu Finden Sie das arithmetische Mittel, müssen Sie alle Zahlen addieren und ihre Summe durch ihre Zahl dividieren.


Ermitteln Sie das arithmetische Mittel von 2, 3 und 4.

Bezeichnen wir das arithmetische Mittel mit dem Buchstaben „m“. Nach obiger Definition ermitteln wir die Summe aller Zahlen.


Teilen Sie den resultierenden Betrag durch die Anzahl der ermittelten Zahlen. Konventionell haben wir drei Zahlen.

Als Ergebnis erhalten wir Arithmetische Mittelformel:


Wozu dient das arithmetische Mittel?

Abgesehen davon, dass es im Unterricht immer wieder vorgeschlagen wird, das arithmetische Mittel zu finden, ist es im Leben sehr nützlich.

Angenommen, Sie möchten Fußbälle verkaufen. Da Sie aber neu in diesem Geschäft sind, ist völlig unklar, zu welchem ​​Preis Sie die Bälle verkaufen sollen.

Dann entscheiden Sie sich herauszufinden, zu welchem ​​Preis Wettbewerber in Ihrer Nähe bereits Fußbälle verkaufen. Lassen Sie uns die Preise in den Geschäften herausfinden und eine Tabelle erstellen.

Die Preise für Bälle in den Geschäften fielen völlig unterschiedlich aus. Welchen Preis sollten wir wählen, um einen Fußball zu verkaufen?

Wenn wir den niedrigsten Preis (290 Rubel) wählen, verkaufen wir die Ware mit Verlust. Wenn Sie den höchsten Wert (360 Rubel) wählen, werden Käufer bei uns keine Fußbälle kaufen.

Wir brauchen einen Durchschnittspreis. Hier kommt es zur Rettung arithmetische Mittel.

Berechnen wir den arithmetischen Durchschnitt der Preise für Fußbälle:

Durchschnittspreis =

290 + 360 + 310
3
=
960
3
= 320 reiben.

Somit haben wir einen Durchschnittspreis (320 Rubel) erhalten, zu dem wir einen Fußball nicht zu billig und nicht zu teuer verkaufen können.

Durchschnittliche Fahrgeschwindigkeit

Eng verwandt mit dem arithmetischen Mittel ist das Konzept Durchschnittsgeschwindigkeit.

Wenn Sie den Verkehr in der Stadt beobachten, können Sie feststellen, dass Autos entweder beschleunigen und mit hoher Geschwindigkeit fahren oder langsamer werden und mit niedriger Geschwindigkeit fahren.

Entlang der Fahrzeugroute gibt es viele solcher Abschnitte. Zur Vereinfachung der Berechnungen wird daher das Konzept der Durchschnittsgeschwindigkeit verwendet.

Erinnern!

Die durchschnittliche Bewegungsgeschwindigkeit ist die gesamte zurückgelegte Strecke geteilt durch die gesamte Bewegungszeit.

Betrachten wir ein Problem bei mittlerer Geschwindigkeit.

Aufgabe Nr. 1503 aus dem Lehrbuch „Vilenkin 5. Klasse“

Das Auto bewegte sich 3,2 Stunden auf einer Autobahn mit einer Geschwindigkeit von 90 km/h, dann 1,5 Stunden auf einer unbefestigten Straße mit einer Geschwindigkeit von 45 km/h und schließlich 0,3 Stunden auf einer Landstraße mit einer Geschwindigkeit von 30 km/h . Ermitteln Sie die Durchschnittsgeschwindigkeit des Autos auf der gesamten Strecke.

Um die Durchschnittsgeschwindigkeit zu berechnen, müssen Sie die gesamte vom Auto zurückgelegte Strecke und die gesamte Fahrtzeit kennen.

S 1 = V 1 t 1

S 1 = 90 3,2 = 288 (km)

- Autobahn.

S 2 = V 2 t 2

S 2 = 45 · 1,5 = 67,5 (km) - unbefestigte Straße.

S 3 = V 3 t 3

S 3 = 30 · 0,3 = 9 (km) - Landstraße.

S = S 1 + S 2 + S 3

S = 288 + 67,5 + 9 = 364,5 (km) – die gesamte vom Auto zurückgelegte Strecke.

T = t 1 + t 2 + t 3

T = 3,2 + 1,5 + 0,3 = 5 (h) – die ganze Zeit.

V av = S: t

V av = 364,5: 5 = 72,9 (km/h) — Durchschnittsgeschwindigkeit Autobewegung.

Antwort: V av = 72,9 (km/h) – die Durchschnittsgeschwindigkeit des Autos.

In den meisten Fällen konzentrieren sich die Daten um einen zentralen Punkt. Um einen beliebigen Datensatz zu beschreiben, reicht es daher aus, den Durchschnittswert anzugeben. Betrachten wir nacheinander drei numerische Merkmale, die zur Schätzung des Durchschnittswerts der Verteilung verwendet werden: arithmetisches Mittel, Median und Modus.

Arithmetische Mittel

Das arithmetische Mittel (oft einfach als Mittelwert bezeichnet) ist die gebräuchlichste Schätzung des Mittelwerts einer Verteilung. Es ist das Ergebnis der Division der Summe aller beobachteten Zahlenwerte durch deren Anzahl. Für eine Stichprobe bestehend aus Zahlen X 1, X 2, …, XN, Stichprobenmittelwert (bezeichnet mit ) gleich = (X 1 + X 2 + … + XN) / N, oder

Wo ist der Stichprobenmittelwert, N- Stichprobengröße, Xichi-tes Element Proben.

Laden Sie die Notiz im oder Format herunter, Beispiele im Format

Erwägen Sie die Berechnung des arithmetischen Durchschnitts der fünfjährigen durchschnittlichen Jahresrenditen von 15 Investmentfonds mit sehr hohes Level Risiko (Abb. 1).

Reis. 1. Durchschnittliche jährliche Rendite von 15 Investmentfonds mit sehr hohem Risiko

Der Stichprobenmittelwert wird wie folgt berechnet:

Dies ist eine gute Rendite, insbesondere im Vergleich zu der Rendite von 3–4 %, die Einleger von Banken oder Kreditgenossenschaften im gleichen Zeitraum erhielten. Wenn wir die Renditen sortieren, ist es leicht zu erkennen, dass acht Fonds überdurchschnittliche Renditen und sieben unterdurchschnittliche Renditen aufweisen. Als Gleichgewichtspunkt fungiert das arithmetische Mittel, sodass Fonds mit geringer Rendite die Fonds mit hoher Rendite ausgleichen. Bei der Berechnung des Durchschnitts sind alle Elemente der Stichprobe beteiligt. Keine der anderen Schätzungen des Mittelwerts einer Verteilung weist diese Eigenschaft auf.

Wann sollte man das arithmetische Mittel berechnen? Da das arithmetische Mittel von allen Elementen in der Stichprobe abhängt, beeinflusst das Vorhandensein von Extremwerten das Ergebnis erheblich. In solchen Situationen kann das arithmetische Mittel die Bedeutung numerischer Daten verfälschen. Daher ist bei der Beschreibung eines Datensatzes, der Extremwerte enthält, die Angabe des Medians bzw. des arithmetischen Mittels und des Medians erforderlich. Wenn wir beispielsweise die Renditen des RS Emerging Growth-Fonds aus der Stichprobe entfernen, sinkt der Stichprobendurchschnitt der Renditen der 14 Fonds um fast 1 % auf 5,19 %.

Median

Der Median stellt den Mittelwert einer geordneten Zahlenreihe dar. Wenn das Array keine sich wiederholenden Zahlen enthält, ist die Hälfte seiner Elemente kleiner und die andere Hälfte größer als der Median. Wenn die Stichprobe Extremwerte enthält, ist es besser, den Median statt des arithmetischen Mittels zur Schätzung des Mittelwerts zu verwenden. Um den Median einer Stichprobe zu berechnen, muss diese zunächst geordnet werden.

Diese Formel ist mehrdeutig. Das Ergebnis hängt davon ab, ob die Zahl gerade oder ungerade ist N:

  • Wenn die Stichprobe eine ungerade Anzahl von Elementen enthält, beträgt der Median (n+1)/2-tes Element.
  • Enthält die Stichprobe eine gerade Anzahl von Elementen, liegt der Median zwischen den beiden mittleren Elementen der Stichprobe und ist gleich dem über diese beiden Elemente berechneten arithmetischen Mittel.

Um den Median einer Stichprobe zu berechnen, die die Renditen von 15 Investmentfonds mit sehr hohem Risiko enthält, müssen Sie zunächst die Rohdaten sortieren (Abbildung 2). Dann ist der Median das Gegenteil der Zahl des mittleren Elements der Stichprobe; in unserem Beispiel Nr. 8. Excel verfügt über eine spezielle Funktion =MEDIAN(), die auch mit ungeordneten Arrays funktioniert.

Reis. 2. Median 15 Fonds

Der Median liegt somit bei 6,5. Dies bedeutet, dass die Rendite der einen Hälfte der Fonds mit sehr hohem Risiko 6,5 nicht übersteigt und die Rendite der anderen Hälfte darüber liegt. Beachten Sie, dass der Median von 6,5 nicht viel größer ist als der Mittelwert von 6,08.

Wenn wir die Rendite des RS Emerging Growth-Fonds aus der Stichprobe entfernen, sinkt der Median der verbleibenden 14 Fonds auf 6,2 %, also nicht so stark wie das arithmetische Mittel (Abbildung 3).

Reis. 3. Median 14 Fonds

Mode

Der Begriff wurde erstmals 1894 von Pearson geprägt. Mode ist die Zahl, die in einer Stichprobe am häufigsten vorkommt (die modischste). Mode beschreibt zum Beispiel gut: typische Reaktion Autofahrer an einer Ampel, um den Verkehr anzuhalten. Ein klassisches Beispiel für den Einsatz von Mode ist die Wahl der Schuhgröße oder Tapetenfarbe. Wenn eine Verteilung mehrere Modi aufweist, wird sie als multimodal oder multimodal bezeichnet (hat zwei oder mehr „Spitzen“). Die Multimodalität der Verteilung liefert wichtige Informationen über die Art der untersuchten Variablen. Zum Beispiel in Meinungsumfragen Wenn eine Variable eine Präferenz oder Einstellung zu etwas darstellt, kann Multimodalität bedeuten, dass es mehrere deutlich unterschiedliche Meinungen gibt. Multimodalität dient auch als Indikator dafür, dass die Stichprobe nicht homogen ist und die Beobachtungen möglicherweise durch zwei oder mehr „überlappende“ Verteilungen generiert werden. Im Gegensatz zum arithmetischen Mittel haben Ausreißer keinen Einfluss auf den Modus. Für kontinuierlich verteilte Zufallsvariablen, wie zum Beispiel die durchschnittliche jährliche Rendite von Investmentfonds, existiert der Modus manchmal nicht (oder macht überhaupt keinen Sinn). Da diese Indikatoren sehr unterschiedliche Werte annehmen können, sind sich wiederholende Werte äußerst selten.

Quartile

Quartile sind die Metriken, die am häufigsten zur Bewertung der Datenverteilung bei der Beschreibung der Eigenschaften großer numerischer Stichproben verwendet werden. Während der Median das geordnete Array in zwei Hälften teilt (50 % der Elemente des Arrays sind kleiner als der Median und 50 % größer), teilen Quartile den geordneten Datensatz in vier Teile. Die Werte von Q 1 , Median und Q 3 sind das 25., 50. bzw. 75. Perzentil. Das erste Quartil Q 1 ist eine Zahl, die die Stichprobe in zwei Teile teilt: 25 % der Elemente sind kleiner und 75 % größer als das erste Quartil.

Das dritte Quartil Q 3 ist eine Zahl, die die Stichprobe ebenfalls in zwei Teile teilt: 75 % der Elemente sind kleiner und 25 % größer als das dritte Quartil.

Um Quartile in Excel-Versionen vor 2007 zu berechnen, verwenden Sie die Funktion =QUARTILE(array,part). Ab Excel 2010 kommen zwei Funktionen zum Einsatz:

  • =QUARTILE.ON(array,part)
  • =QUARTILE.EXC(array,part)

Diese beiden Funktionen geben wenig unterschiedliche Bedeutungen(Abb. 4). Wenn Sie beispielsweise die Quartile einer Stichprobe berechnen, die die durchschnittlichen Jahresrenditen von 15 Investmentfonds mit sehr hohem Risiko enthält, ist Q 1 = 1,8 bzw. –0,7 für QUARTILE.IN bzw. QUARTILE.EX. Die bisher verwendete Funktion QUARTILE entspricht übrigens der modernen Funktion QUARTILE.ON. Um Quartile in Excel mit den oben genannten Formeln zu berechnen, muss das Datenarray nicht geordnet werden.

Reis. 4. Quartile in Excel berechnen

Lassen Sie uns noch einmal betonen. Excel kann Quartile für eine Univariate berechnen diskrete Reihe, enthält die Werte einer Zufallsvariablen. Die Berechnung der Quartile für eine häufigkeitsbasierte Verteilung ist weiter unten im Abschnitt angegeben.

Geometrisches Mittel

Im Gegensatz zum arithmetischen Mittel können Sie mit dem geometrischen Mittel den Grad der Änderung einer Variablen im Zeitverlauf abschätzen. Das geometrische Mittel ist die Wurzel N Abschluss aus der Arbeit N Mengen (in Excel wird die Funktion =SRGEOM verwendet):

G= (X 1 * X 2 * … * X n) 1/n

Ein ähnlicher Parameter ist der Durchschnitt geometrische Bedeutung Die Rendite wird durch die Formel bestimmt:

G = [(1 + R 1) * (1 + R 2) * … * (1 + R n)] 1/n – 1,

Wo R i– Profitrate für ich Zeitraum.

Angenommen, die Anfangsinvestition beträgt 100.000 US-Dollar. Bis zum Ende des ersten Jahres sinkt sie auf 50.000 US-Dollar und am Ende des zweiten Jahres erholt sie sich wieder auf das ursprüngliche Niveau von 100.000 US-Dollar. Die Rendite dieser Investition liegt bei über zwei -Jahreszeitraum gleich 0, da der Anfangs- und der Endbetrag der Mittel einander gleich sind. Das arithmetische Mittel der jährlichen Renditen beträgt jedoch = (–0,5 + 1) / 2 = 0,25 bzw. 25 %, da die Rendite im ersten Jahr R 1 = (50.000 – 100.000) / 100.000 = –0,5 ist. und im zweiten R 2 = (100.000 – 50.000) / 50.000 = 1. Gleichzeitig ist der geometrische Mittelwert der Profitrate für zwei Jahre gleich: G = [(1–0,5) * (1+ 1 )] 1/2 – 1 = ½ – 1 = 1 – 1 = 0. Somit spiegelt das geometrische Mittel die Änderung (genauer gesagt das Fehlen von Änderungen) des Investitionsvolumens über einen Zeitraum von zwei Jahren genauer wider als das arithmetische Mittel.

Interessante Fakten. Erstens wird das geometrische Mittel immer kleiner sein als das arithmetische Mittel derselben Zahlen. Außer in dem Fall, dass alle genommenen Zahlen einander gleich sind. Zweitens, nachdem wir die Eigenschaften berücksichtigt haben rechtwinkliges Dreieck, kann man verstehen, warum der Mittelwert geometrisch genannt wird. Die Höhe eines rechtwinkligen Dreiecks, abgesenkt zur Hypotenuse, ist das durchschnittliche Verhältnis zwischen den Projektionen der Schenkel auf die Hypotenuse, und jedes Bein ist das durchschnittliche Verhältnis zwischen der Hypotenuse und ihrer Projektion auf die Hypotenuse (Abb. 5). Dies bietet eine geometrische Möglichkeit, das geometrische Mittel zweier (Längen-)Segmente zu konstruieren: Sie müssen einen Kreis aus der Summe dieser beiden Segmente als Durchmesser konstruieren und dann die Höhe vom Verbindungspunkt bis zum Schnittpunkt mit dem Kreis wiederherstellen ergibt den gewünschten Wert:

Reis. 5. Geometrische Natur des geometrischen Mittels (Abbildung aus Wikipedia)

Zweite wichtige Eigenschaft numerische Daten - ihre Variation, charakterisiert den Grad der Datenstreuung. Zwei verschiedene Stichproben können sich sowohl in den Mittelwerten als auch in den Varianzen unterscheiden. Wie jedoch in Abb. Wie in den 6 und 7 dargestellt, können zwei Stichproben dieselben Variationen, aber unterschiedliche Mittelwerte aufweisen, oder dieselben Mittelwerte und völlig unterschiedliche Variationen. Die Daten, die dem Polygon B in Abb. entsprechen. 7, viel weniger ändern als die Daten, auf denen Polygon A konstruiert wurde.

Reis. 6. Zwei symmetrische glockenförmige Verteilungen mit gleicher Streuung und unterschiedlichen Mittelwerten

Reis. 7. Zwei symmetrische glockenförmige Verteilungen mit gleichen Mittelwerten und unterschiedlichen Spreads

Es gibt fünf Schätzungen der Datenvariation:

Umfang

Der Bereich ist die Differenz zwischen dem größten und dem kleinsten Element der Stichprobe:

Bereich = XMax – XMindest

Der Bereich einer Stichprobe mit den durchschnittlichen Jahresrenditen von 15 Investmentfonds mit sehr hohem Risiko kann mithilfe der geordneten Matrix berechnet werden (siehe Abbildung 4): Bereich = 18,5 – (–6,1) = 24,6. Dies bedeutet, dass die Differenz zwischen der höchsten und der niedrigsten durchschnittlichen Jahresrendite von Fonds mit sehr hohem Risiko 24,6 % beträgt.

Der Bereich misst die Gesamtverbreitung von Daten. Obwohl der Stichprobenbereich eine sehr einfache Schätzung der Gesamtstreuung der Daten ist, besteht seine Schwäche darin, dass er nicht genau berücksichtigt, wie die Daten zwischen dem Minimum und dem Minimum verteilt sind maximale Elemente. Dieser Effekt ist in Abb. deutlich zu erkennen. 8 zeigt Proben mit demselben Bereich. Skala B zeigt, dass der Stichprobenbereich eine sehr ungenaue Schätzung der Streuung der Daten darstellt, wenn eine Stichprobe mindestens einen Extremwert enthält.

Reis. 8. Vergleich von drei Proben mit demselben Bereich; Das Dreieck symbolisiert die Unterstützung der Skala und seine Position entspricht dem Stichprobenmittelwert

Interquartilbereich

Der Interquartil- oder Durchschnittsbereich ist die Differenz zwischen dem dritten und dem ersten Quartil der Stichprobe:

Interquartilbereich = Q 3 – Q 1

Mit diesem Wert können wir die Streuung von 50 % der Elemente abschätzen und den Einfluss extremer Elemente nicht berücksichtigen. Der Interquartilbereich einer Stichprobe, die die durchschnittlichen Jahresrenditen von 15 Investmentfonds mit sehr hohem Risiko enthält, kann anhand der Daten in Abb. berechnet werden. 4 (zum Beispiel für die Funktion QUARTILE.EXC): Interquartilbereich = 9,8 – (–0,7) = 10,5. Das durch die Zahlen 9,8 und -0,7 begrenzte Intervall wird oft als mittlere Hälfte bezeichnet.

Es ist zu beachten, dass die Werte von Q 1 und Q 3 und damit der Interquartilbereich nicht vom Vorhandensein von Ausreißern abhängen, da bei ihrer Berechnung kein Wert berücksichtigt wird, der kleiner als Q 1 oder größer wäre als Q 3 . Gesamt quantitative Merkmale Werte wie der Median, das erste und dritte Quartil und der Interquartilbereich, die nicht von Ausreißern beeinflusst werden, werden als robuste Maße bezeichnet.

Obwohl der Bereich und der Interquartilbereich Schätzungen der gesamten bzw. durchschnittlichen Streuung einer Stichprobe liefern, berücksichtigt keine dieser Schätzungen genau, wie die Daten verteilt sind. Varianz und Standardabweichung haben diesen Nachteil nicht. Mit diesen Indikatoren können Sie beurteilen, inwieweit die Daten um den Durchschnittswert schwanken. Stichprobenvarianz ist eine Näherung des arithmetischen Mittels, das aus den Quadraten der Differenzen zwischen jedem Stichprobenelement und dem Stichprobenmittelwert berechnet wird. Für eine Stichprobe X 1, X 2, ... X n ergibt sich die Stichprobenvarianz (bezeichnet durch das Symbol S 2) durch die folgende Formel:

IN Allgemeiner Fall Die Stichprobenvarianz ist die Summe der Quadrate der Differenzen zwischen den Stichprobenelementen und dem Stichprobenmittelwert, dividiert durch einen Wert, der der Stichprobengröße minus eins entspricht:

Wo - arithmetisches Mittel, N- Stichprobengröße, X i - ich Auswahlelement X. In Excel vor Version 2007 wurde zur Berechnung der Stichprobenvarianz die Funktion =VARIN() verwendet; seit Version 2010 wird die Funktion =VARIAN() verwendet.

Die praktischste und am weitesten verbreitete Schätzung der Datenverbreitung ist Stichprobenstandardabweichung. Dieser Indikator wird mit dem Symbol S bezeichnet und ist gleich Quadratwurzel aus Stichprobenvarianz:

In Excel vor Version 2007 wurde die Funktion =STDEV.() zur Berechnung der Standardstichprobenabweichung verwendet; seit Version 2010 wird die Funktion =STDEV.V() verwendet. Um diese Funktionen zu berechnen, kann das Datenarray ungeordnet sein.

Weder die Stichprobenvarianz noch die Stichprobenstandardabweichung können negativ sein. Die einzige Situation, in der die Indikatoren S 2 und S Null sein können, ist, wenn alle Elemente der Stichprobe einander gleich sind. In diesem völlig unwahrscheinlichen Fall sind auch die Reichweite und der Interquartilabstand Null.

Numerische Daten sind von Natur aus volatil. Jede Variable kann viele annehmen unterschiedliche Bedeutungen. Zum Beispiel gibt es verschiedene Investmentfonds verschiedene Indikatoren Rentabilität und Verluste. Aufgrund der Variabilität numerischer Daten ist es sehr wichtig, nicht nur Schätzungen des Mittelwerts zu untersuchen, die summarischer Natur sind, sondern auch Schätzungen der Varianz, die die Streuung der Daten charakterisieren.

Mit Streuung und Standardabweichung können Sie die Streuung der Daten um den Durchschnittswert auswerten, d. h. bestimmen, wie viele Stichprobenelemente kleiner als der Durchschnitt und wie viele größer sind. Dispersion hat einige wertvolle mathematische Eigenschaften. Sein Wert ist jedoch das Quadrat der Maßeinheit – Quadratprozent, Quadratdollar, Quadratzoll usw. Ein natürliches Maß für die Streuung ist daher die Standardabweichung, die in gängigen Einkommenseinheiten in Prozent, Dollar oder Zoll ausgedrückt wird.

Mit der Standardabweichung können Sie das Ausmaß der Variation von Stichprobenelementen um den Durchschnittswert abschätzen. In fast allen Situationen liegt die Mehrheit der beobachteten Werte im Bereich von plus oder minus einer Standardabweichung vom Mittelwert. Wenn man also das arithmetische Mittel der Stichprobenelemente und die Standardabweichung der Stichprobe kennt, kann man das Intervall bestimmen, zu dem der Großteil der Daten gehört.

Die Standardabweichung der Renditen für die 15 Investmentfonds mit sehr hohem Risiko beträgt 6,6 (Abbildung 9). Dies bedeutet, dass die Rentabilität des Großteils der Fonds um nicht mehr als 6,6 % vom Durchschnittswert abweicht (d. h. im Bereich von schwankt). -S= 6,2 – 6,6 = –0,4 to +S= 12,8). Tatsächlich liegt die fünfjährige durchschnittliche Jahresrendite von 53,3 % (8 von 15) der Fonds in diesem Bereich.

Reis. 9. Standardabweichung der Stichprobe

Beachten Sie, dass bei der Summierung der quadrierten Differenzen Stichprobenelemente, die weiter vom Mittelwert entfernt sind, stärker gewichtet werden als Elemente, die näher am Mittelwert liegen. Diese Eigenschaft ist der Hauptgrund, warum das arithmetische Mittel am häufigsten zur Schätzung des Mittelwerts einer Verteilung verwendet wird.

Der Variationskoeffizient

Im Gegensatz zu früheren Schätzungen der Streuung handelt es sich beim Variationskoeffizienten um eine relative Schätzung. Es wird immer in Prozent gemessen und nicht in den Einheiten der Originaldaten. Der Variationskoeffizient, mit den Symbolen CV bezeichnet, misst die Streuung der Daten um den Mittelwert. Der Variationskoeffizient entspricht der Standardabweichung geteilt durch das arithmetische Mittel und multipliziert mit 100 %:

Wo S- Standardprobenabweichung, - Stichprobendurchschnitt.

Mit dem Variationskoeffizienten können Sie zwei Proben vergleichen, deren Elemente in unterschiedlichen Maßeinheiten ausgedrückt werden. Beispielsweise möchte der Leiter eines Postzustelldienstes seine LKW-Flotte erneuern. Beim Verladen von Paketen sind zwei Einschränkungen zu berücksichtigen: das Gewicht (in Pfund) und das Volumen (in Kubikfuß) jedes Pakets. Angenommen, in einer Probe mit 200 Beuteln beträgt das Durchschnittsgewicht 26,0 Pfund, die Standardabweichung des Gewichts 3,9 Pfund, das mittlere Beutelvolumen 8,8 Kubikfuß und die Standardabweichung des Volumens 2,2 Kubikfuß. Wie kann man die Gewichts- und Volumenschwankungen von Paketen vergleichen?

Da die Maßeinheiten für Gewicht und Volumen voneinander abweichen, muss der Manager die relative Streuung dieser Größen vergleichen. Der Variationskoeffizient des Gewichts beträgt CV W = 3,9 / 26,0 * 100 % = 15 %, und der Variationskoeffizient des Volumens beträgt CV V = 2,2 / 8,8 * 100 % = 25 %. Somit ist die relative Variation im Volumen der Pakete viel größer als die relative Variation in ihrem Gewicht.

Verteilungsformular

Die dritte wichtige Eigenschaft einer Stichprobe ist die Form ihrer Verteilung. Diese Verteilung kann symmetrisch oder asymmetrisch sein. Um die Form einer Verteilung zu beschreiben, ist es notwendig, ihren Mittelwert und Median zu berechnen. Wenn beide gleich sind, gilt die Variable als symmetrisch verteilt. Ist der Mittelwert einer Variablen größer als der Median, weist ihre Verteilung eine positive Schiefe auf (Abb. 10). Wenn der Median größer als der Mittelwert ist, ist die Verteilung der Variablen negativ verzerrt. Eine positive Schiefe tritt auf, wenn der Mittelwert auf ungewöhnlich hohe Werte ansteigt. Eine negative Schiefe tritt auf, wenn der Mittelwert auf ungewöhnlich kleine Werte absinkt. Eine Variable ist symmetrisch verteilt, wenn sie in keiner Richtung Extremwerte annimmt, sodass sich große und kleine Werte der Variablen gegenseitig aufheben.

Reis. 10. Drei Arten von Verteilungen

Die auf Skala A angezeigten Daten sind negativ verzerrt. Diese Abbildung zeigt einen langen Schwanz und einen Linksversatz, der durch das Vorhandensein ungewöhnlich kleiner Werte verursacht wird. Diese extrem kleinen Werte verschieben den Durchschnittswert nach links, sodass er kleiner als der Median ist. Die auf Skala B dargestellten Daten sind symmetrisch verteilt. Die linke und rechte Hälfte der Verteilung sind ihre eigenen Spiegelreflexionen. Große und kleine Werte gleichen sich aus und Mittelwert und Median sind gleich. Die auf Skala B angezeigten Daten sind positiv verzerrt. Diese Abbildung zeigt einen langen Schwanz und eine Rechtsschiefe, die durch das Vorhandensein ungewöhnlich hoher Werte verursacht wird. Diese zu großen Werte verschieben den Mittelwert nach rechts, sodass er größer als der Median wird.

In Excel können deskriptive Statistiken über ein Add-In abgerufen werden Analysepaket. Gehen Sie durch das Menü DatenDatenanalyse Wählen Sie im sich öffnenden Fenster die Zeile aus Beschreibende Statistik und klicken OK. Im Fenster Beschreibende Statistik unbedingt angeben Eingabeintervall(Abb. 11). Wenn Sie beschreibende Statistiken auf demselben Blatt wie die Originaldaten sehen möchten, aktivieren Sie das Optionsfeld Ausgabeintervall und geben Sie die Zelle an, in der die obere linke Ecke der angezeigten Statistiken platziert werden soll (in unserem Beispiel $C$1). Wenn Sie Daten auf ein neues Blatt oder auf ausgeben möchten neues Buch Wählen Sie einfach den entsprechenden Schalter aus. Aktivieren Sie das Kontrollkästchen neben Zusammengefasste Statistiken. Auf Wunsch können Sie auch wählen Schwierigkeitsgrad,kth kleinste undk-th größte.

Bei Anzahlung Daten im Gebiet Analyse Sie sehen das Symbol nicht Datenanalyse, müssen Sie zuerst das Add-on installieren Analysepaket(siehe zum Beispiel).

Reis. 11. Beschreibende Statistik der fünfjährigen durchschnittlichen jährlichen Rendite von Fonds mit sehr hohem Risiko, berechnet mit dem Add-in Datenanalyse Excel-Programme

Excel berechnet eine Reihe der oben besprochenen Statistiken: Mittelwert, Median, Modus, Standardabweichung, Varianz, Bereich ( Intervall), Minimum, Maximum und Stichprobengröße ( überprüfen). Excel berechnet auch einige für uns neue Statistiken: Standardfehler, Kurtosis und Schiefe. Standart Fehler gleich der Standardabweichung dividiert durch die Quadratwurzel der Stichprobengröße. Asymmetrie charakterisiert die Abweichung von der Symmetrie der Verteilung und ist eine Funktion, die von der Potenz der Differenzen zwischen den Stichprobenelementen und dem Durchschnittswert abhängt. Kurtosis ist ein Maß für die relative Konzentration von Daten um den Mittelwert im Vergleich zu den Enden der Verteilung und hängt von den Unterschieden zwischen den Stichprobenelementen und dem Mittelwert hoch erhöht ab.

Berechnen deskriptiver Statistiken für eine Population

Der Mittelwert, die Streuung und die Form der oben diskutierten Verteilung sind Merkmale, die anhand der Stichprobe ermittelt werden. Wenn der Datensatz jedoch numerische Messungen der gesamten Bevölkerung enthält, können deren Parameter berechnet werden. Zu diesen Parametern gehören der Erwartungswert, die Streuung und die Standardabweichung der Grundgesamtheit.

Erwarteter Wert gleich der Summe aller Werte in der Bevölkerung dividiert durch die Größe der Bevölkerung:

Wo µ - erwarteter Wert, Xich- ich te Beobachtung der Variablen X, N- Volumen der Gesamtbevölkerung. In Excel wird zur Berechnung des mathematischen Erwartungswerts dieselbe Funktion wie für den arithmetischen Durchschnitt verwendet: =AVERAGE().

Populationsvarianz gleich der Summe der Quadrate der Differenzen zwischen den Elementen der Gesamtbevölkerung und der Matte. Erwartung dividiert durch die Bevölkerungsgröße:

Wo σ 2– Zerstreuung der allgemeinen Bevölkerung. In Excel vor Version 2007 wird die Funktion =VARP() verwendet, um die Varianz einer Grundgesamtheit zu berechnen, beginnend mit Version 2010 =VARP().

Bevölkerungsstandardabweichung gleich der Quadratwurzel der Populationsvarianz:

In Excel vor Version 2007 wird die Funktion =STDEV() verwendet, um die Standardabweichung einer Grundgesamtheit zu berechnen, beginnend mit Version 2010 =STDEV.Y(). Beachten Sie, dass sich die Formeln für die Populationsvarianz und die Standardabweichung von den Formeln zur Berechnung der Stichprobenvarianz und der Standardabweichung unterscheiden. Bei der Berechnung von Stichprobenstatistiken S 2 Und S Der Nenner des Bruchs ist n – 1 und bei der Berechnung von Parametern σ 2 Und σ - Volumen der Gesamtbevölkerung N.

Faustregel

In den meisten Situationen konzentriert sich ein großer Teil der Beobachtungen um den Median und bildet einen Cluster. In Datensätzen mit positiver Schiefe befindet sich dieser Cluster links (d. h. unterhalb) der mathematischen Erwartung, und in Datensätzen mit negativer Schiefe befindet sich dieser Cluster rechts (d. h. oberhalb) der mathematischen Erwartung. Bei symmetrischen Daten sind Mittelwert und Median gleich, und die Beobachtungen gruppieren sich um den Mittelwert und bilden eine glockenförmige Verteilung. Wenn die Verteilung nicht eindeutig schief ist und sich die Daten um einen Schwerpunkt konzentrieren, kann zur Schätzung der Variabilität die Faustregel verwendet werden, dass bei einer glockenförmigen Verteilung der Daten etwa 68 % der Beobachtungen innerhalb des Schwerpunkts liegen eine Standardabweichung vom erwarteten Wert. Ungefähr 95 % der Beobachtungen sind nicht mehr als zwei Standardabweichungen von der mathematischen Erwartung entfernt und 99,7 % der Beobachtungen sind nicht mehr als drei Standardabweichungen von der mathematischen Erwartung entfernt.

Daher hilft die Standardabweichung, die eine Schätzung der durchschnittlichen Variation um den erwarteten Wert darstellt, zu verstehen, wie Beobachtungen verteilt sind, und Ausreißer zu identifizieren. Als Faustregel gilt, dass bei glockenförmigen Verteilungen nur jeder zwanzigste Wert um mehr als zwei Standardabweichungen von der mathematischen Erwartung abweicht. Daher Werte außerhalb des Intervalls µ ± 2σ können als Ausreißer betrachtet werden. Zudem weichen nur drei von 1000 Beobachtungen um mehr als drei Standardabweichungen von der mathematischen Erwartung ab. Somit liegen Werte außerhalb des Intervalls µ ± 3σ sind fast immer Ausreißer. Für stark schiefe oder nicht glockenförmige Verteilungen kann die Bienamay-Chebyshev-Faustregel angewendet werden.

Vor mehr als hundert Jahren entdeckten die Mathematiker Bienamay und Chebyshev unabhängig voneinander nützliche Eigenschaft Standardabweichung. Sie fanden heraus, dass für jeden Datensatz, unabhängig von der Form der Verteilung, der Prozentsatz der Beobachtungen, die innerhalb einer Entfernung von liegen k Standardabweichungen von der mathematischen Erwartung, nicht weniger (1 – 1/ k 2)*100 %.

Zum Beispiel, wenn k= 2, die Bienname-Chebyshev-Regel besagt, dass mindestens (1 – (1/2) 2) x 100 % = 75 % der Beobachtungen in dem Intervall liegen müssen µ ± 2σ. Diese Regel gilt für alle k, mehr als eins. Die Bienamay-Chebyshev-Regel ist sehr allgemein und für Verteilungen jeglicher Art gültig. Sie gibt die Mindestanzahl an Beobachtungen an, deren Abstand zur mathematischen Erwartung einen festgelegten Wert nicht überschreitet. Wenn die Verteilung jedoch glockenförmig ist, schätzt die Faustregel die Konzentration der Daten um den erwarteten Wert genauer ein.

Berechnen deskriptiver Statistiken für eine häufigkeitsbasierte Verteilung

Wenn die Originaldaten nicht verfügbar sind, wird die Häufigkeitsverteilung zur einzigen Informationsquelle. In solchen Situationen ist es möglich, Näherungswerte quantitativer Indikatoren der Verteilung zu berechnen, wie zum Beispiel das arithmetische Mittel, die Standardabweichung und Quartile.

Wenn Stichprobendaten als Häufigkeitsverteilung dargestellt werden, kann eine Näherung des arithmetischen Mittels berechnet werden, indem angenommen wird, dass alle Werte innerhalb jeder Klasse am Klassenmittelpunkt konzentriert sind:

Wo - Stichprobendurchschnitt, N- Anzahl der Beobachtungen oder Stichprobengröße, Mit- Anzahl der Klassen in der Häufigkeitsverteilung, mj- Mittelpunkt J Klasse, FJ- Frequenz entsprechend J-te Klasse.

Um die Standardabweichung aus einer Häufigkeitsverteilung zu berechnen, wird außerdem angenommen, dass alle Werte innerhalb jeder Klasse am Klassenmittelpunkt konzentriert sind.

Um zu verstehen, wie Quartile einer Reihe anhand von Häufigkeiten bestimmt werden, betrachten Sie die Berechnung des unteren Quartils auf der Grundlage von Daten für 2013 zur Verteilung der russischen Bevölkerung nach durchschnittlichem Geldeinkommen pro Kopf (Abb. 12).

Reis. 12. Anteil der russischen Bevölkerung mit durchschnittlichem Pro-Kopf-Bareinkommen pro Monat, Rubel

Zur Berechnung des ersten Quartils des Intervalls Variationsreihe Sie können die Formel verwenden:

wobei Q1 der Wert des ersten Quartils ist, xQ1 die untere Grenze des Intervalls, das das erste Quartil enthält (das Intervall wird durch die akkumulierte Häufigkeit bestimmt, die zuerst 25 % überschreitet); i – Intervallwert; Σf – Summe der Frequenzen der gesamten Stichprobe; wahrscheinlich immer gleich 100 %; SQ1–1 – akkumulierte Häufigkeit des Intervalls, das dem Intervall vorausgeht, das das untere Quartil enthält; fQ1 – Häufigkeit des Intervalls, das das untere Quartil enthält. Die Formel für das dritte Quartil unterscheidet sich darin, dass Sie an allen Stellen Q3 anstelle von Q1 verwenden und ¾ anstelle von ¼ ersetzen müssen.

In unserem Beispiel (Abb. 12) liegt das untere Quartil im Bereich 7000,1 – 10.000, dessen kumulierte Häufigkeit 26,4 % beträgt. Die untere Grenze dieses Intervalls beträgt 7000 Rubel, der Wert des Intervalls beträgt 3000 Rubel, die kumulierte Häufigkeit des Intervalls vor dem Intervall, das das untere Quartil enthält, beträgt 13,4 %, die Häufigkeit des Intervalls, das das untere Quartil enthält, beträgt 13,0 %. Also: Q1 = 7000 + 3000 * (¼ * 100 – 13,4) / 13 = 9677 Rubel.

Fallstricke im Zusammenhang mit deskriptiver Statistik

In diesem Beitrag haben wir untersucht, wie man einen Datensatz mithilfe verschiedener Statistiken beschreibt, die seinen Mittelwert, seine Streuung und seine Verteilung bewerten. Der nächste Schritt ist die Datenanalyse und -interpretation. Bisher haben wir die objektiven Eigenschaften von Daten untersucht und kommen nun zu ihrer subjektiven Interpretation. Der Forscher sieht sich zwei Fehlern gegenüber: einem falsch gewählten Analysegegenstand und einer falschen Interpretation der Ergebnisse.

Die Analyse der Renditen von 15 Investmentfonds mit sehr hohem Risiko ist recht unvoreingenommen. Er führte zu völlig objektiven Schlussfolgerungen: Alle Investmentfonds haben unterschiedliche Renditen, die Spanne der Fondsrenditen liegt zwischen -6,1 und 18,5 und die durchschnittliche Rendite beträgt 6,08. Die Objektivität der Datenanalyse ist gewährleistet die richtige Entscheidung gesamte quantitative Verteilungsindikatoren. Es wurden verschiedene Methoden zur Schätzung des Mittelwerts und der Streuung von Daten in Betracht gezogen und deren Vor- und Nachteile aufgezeigt. Wie wählt man die richtigen Statistiken aus, um eine objektive und unparteiische Analyse zu liefern? Wenn die Datenverteilung leicht verzerrt ist, sollten Sie dann den Median anstelle des Mittelwerts wählen? Welcher Indikator charakterisiert die Datenverteilung genauer: Standardabweichung oder Bereich? Sollten wir darauf hinweisen, dass die Verteilung positiv verzerrt ist?

Andererseits ist die Dateninterpretation ein subjektiver Prozess. Unterschiedliche Leute kommen bei der Interpretation der gleichen Ergebnisse zu unterschiedlichen Schlussfolgerungen. Jeder hat seinen eigenen Standpunkt. Jemand hält die durchschnittliche Gesamtjahresrendite von 15 Fonds mit sehr hohem Risiko für gut und ist mit den erzielten Erträgen durchaus zufrieden. Andere könnten das Gefühl haben, dass diese Fonds zu niedrige Renditen erzielen. Daher sollte Subjektivität durch Ehrlichkeit, Neutralität und Klarheit der Schlussfolgerungen kompensiert werden.

Ethische Fragen

Die Datenanalyse ist untrennbar mit ethischen Fragen verbunden. Sie sollten Informationen, die über Zeitungen, Radio, Fernsehen und das Internet verbreitet werden, kritisch gegenüberstehen. Mit der Zeit werden Sie lernen, nicht nur den Ergebnissen, sondern auch den Zielen, dem Gegenstand und der Objektivität der Forschung skeptisch gegenüberzustehen. Der berühmte britische Politiker Benjamin Disraeli brachte es auf den Punkt: „Es gibt drei Arten von Lügen: Lügen, verdammte Lügen und Statistiken.“

Wie in der Anmerkung erwähnt, ergeben sich ethische Fragen bei der Auswahl der Ergebnisse, die im Bericht dargestellt werden sollen. Sowohl positive als auch negative Ergebnisse sollten veröffentlicht werden. Darüber hinaus müssen bei der Erstellung eines Berichts bzw. schriftlichen Berichts die Ergebnisse ehrlich, neutral und objektiv dargestellt werden. Es ist zwischen erfolglosen und unredlichen Präsentationen zu unterscheiden. Dazu ist es notwendig, die Absichten des Sprechers zu ermitteln. Manchmal lässt der Sprecher wichtige Informationen aus Unwissenheit aus, und manchmal geschieht dies auch absichtlich (z. B. wenn er das arithmetische Mittel verwendet, um den Durchschnitt deutlich verzerrter Daten zu schätzen, um das gewünschte Ergebnis zu erzielen). Es ist auch unredlich, Ergebnisse zu unterdrücken, die nicht der Sichtweise des Forschers entsprechen.

Es werden Materialien aus dem Buch Levin et al. „Statistics for Managers“ verwendet. – M.: Williams, 2004. – S. 178–209

Die QUARTILE-Funktion wurde aus Kompatibilitätsgründen mit früheren Excel-Versionen beibehalten.

In der Mathematik ist das arithmetische Mittel von Zahlen (oder einfach der Durchschnitt) die Summe aller Zahlen in einer bestimmten Menge dividiert durch die Anzahl der Zahlen. Dies ist das am weitesten verbreitete und am weitesten verbreitete Konzept des Durchschnittswerts. Wie Sie bereits verstanden haben, müssen Sie zur Ermittlung des Durchschnitts alle Ihnen gegebenen Zahlen aufsummieren und das resultierende Ergebnis durch die Anzahl der Terme dividieren.

Was ist das arithmetische Mittel?

Schauen wir uns ein Beispiel an.

Beispiel 1. Gegebene Zahlen: 6, 7, 11. Sie müssen ihren Durchschnittswert ermitteln.

Lösung.

Lassen Sie uns zunächst die Summe aller dieser Zahlen ermitteln.

Teilen Sie nun die resultierende Summe durch die Anzahl der Terme. Da wir drei Terme haben, teilen wir durch drei.

Daher beträgt der Durchschnitt der Zahlen 6, 7 und 11 8. Warum 8? Ja, denn die Summe aus 6, 7 und 11 ergibt drei Achter. Dies ist in der Abbildung deutlich zu erkennen.

Der Durchschnitt ist ein bisschen so, als würde man eine Reihe von Zahlen „ausgleichen“. Wie Sie sehen, sind die Bleistiftstapel auf dem gleichen Niveau.

Schauen wir uns ein weiteres Beispiel an, um die gewonnenen Erkenntnisse zu festigen.

Beispiel 2. Gegebene Zahlen: 3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29. Sie müssen ihr arithmetisches Mittel ermitteln.

Lösung.

Finden Sie den Betrag.

3 + 7 + 5 + 13 + 20 + 23 + 39 + 23 + 40 + 23 + 14 + 12 + 56 + 23 + 29 = 330

Teilen Sie durch die Anzahl der Begriffe (in diesem Fall - 15).

Daher beträgt der Durchschnittswert dieser Zahlenreihe 22.

Lassen Sie uns nun überlegen negative Zahlen. Erinnern wir uns daran, wie man sie zusammenfasst. Sie haben beispielsweise zwei Zahlen: 1 und -4. Finden wir ihre Summe.

1 + (-4) = 1 – 4 = -3

Schauen wir uns in diesem Wissen ein weiteres Beispiel an.

Beispiel 3. Finden Sie den Durchschnittswert einer Reihe von Zahlen: 3, -7, 5, 13, -2.

Lösung.

Finden Sie die Summe der Zahlen.

3 + (-7) + 5 + 13 + (-2) = 12

Da es 5 Terme gibt, teilen Sie die resultierende Summe durch 5.

Daher beträgt das arithmetische Mittel der Zahlen 3, -7, 5, 13, -2 2,4.

In unserer Zeit des technologischen Fortschritts ist es viel bequemer, den Durchschnittswert zu ermitteln Computerprogramme. Microsoft Office Excel ist eines davon. Den Durchschnitt in Excel zu ermitteln ist schnell und einfach. Darüber hinaus ist dieses Programm im Microsoft Office-Softwarepaket enthalten. Schauen wir uns eine kurze Anleitung an, wie Sie mit diesem Programm das arithmetische Mittel ermitteln.

Um den Durchschnittswert einer Zahlenreihe zu berechnen, müssen Sie die Funktion AVERAGE verwenden. Die Syntax für diese Funktion lautet:
= Durchschnitt(Argument1, Argument2, ... Argument255)
Dabei sind Argument1, Argument2, ... Argument255 entweder Zahlen oder Zellbezüge (mit Zellen meinen wir Bereiche und Arrays).

Um es klarer zu machen, probieren wir die gewonnenen Erkenntnisse aus.

  1. Geben Sie die Zahlen 11, 12, 13, 14, 15, 16 in die Zellen C1 – C6 ein.
  2. Wählen Sie Zelle C7 aus, indem Sie darauf klicken. In dieser Zelle zeigen wir den Durchschnittswert an.
  3. Klicken Sie auf die Registerkarte Formeln.
  4. Wählen Sie Weitere Funktionen > Statistik, um die Dropdown-Liste zu öffnen.
  5. Wählen Sie DURCHSCHNITT. Danach sollte sich ein Dialogfeld öffnen.
  6. Wählen Sie die Zellen C1 bis C6 aus und ziehen Sie sie dorthin, um den Bereich im Dialogfeld festzulegen.
  7. Bestätigen Sie Ihre Aktionen mit der Schaltfläche „OK“.
  8. Wenn Sie alles richtig gemacht haben, sollten Sie die Antwort in Zelle C7 - 13.7 haben. Wenn Sie auf Zelle C7 klicken, erscheint die Funktion (=Durchschnitt(C1:C6)) in der Bearbeitungsleiste.

Diese Funktion ist sehr nützlich für die Buchhaltung, Rechnungen oder wenn Sie einfach den Durchschnitt einer sehr langen Zahlenreihe ermitteln müssen. Daher wird es häufig in Büros und großen Unternehmen eingesetzt. Dadurch haben Sie Ordnung in Ihren Unterlagen und können schnell etwas berechnen (zum Beispiel das durchschnittliche Monatseinkommen). Sie können Excel auch verwenden, um den Durchschnittswert einer Funktion zu ermitteln.

Arithmetische Mittel

Dieser Begriff hat andere Bedeutungen, siehe durchschnittliche Bedeutung.

Arithmetische Mittel(in der Mathematik und Statistik) Zahlenmengen – die Summe aller Zahlen dividiert durch ihre Zahl. Es ist eines der gebräuchlichsten Maße der zentralen Tendenz.

Es wurde (zusammen mit dem geometrischen Mittel und dem harmonischen Mittel) von den Pythagoräern vorgeschlagen.

Sonderfälle des arithmetischen Mittels sind der Mittelwert (Grundgesamtheit) und der Stichprobenmittelwert (Stichprobe).

Einführung

Bezeichnen wir den Datensatz X = (X 1 , X 2 , …, X N), dann wird der Stichprobenmittelwert normalerweise durch einen horizontalen Balken über der Variablen (x ¯ (\displaystyle (\bar (x))) angezeigt, ausgesprochen „ X mit einer Linie").

Der griechische Buchstabe μ bezeichnet das arithmetische Mittel der Gesamtbevölkerung. Für eine Zufallsvariable, für die der Mittelwert bestimmt wird, beträgt μ probabilistischer Durchschnitt oder die mathematische Erwartung einer Zufallsvariablen. Wenn das Set X ist eine Sammlung von Zufallszahlen mit einem probabilistischen Mittelwert μ, also für jede Stichprobe X ich aus dieser Menge μ = E( X ich) ist der mathematische Erwartungswert dieser Stichprobe.

In der Praxis besteht der Unterschied zwischen μ und x ¯ (\displaystyle (\bar (x))) darin, dass μ eine typische Variable ist, da man eine Stichprobe und nicht die gesamte Grundgesamtheit sehen kann. Wenn die Stichprobe daher zufällig dargestellt wird (im Sinne der Wahrscheinlichkeitstheorie), kann x ¯ (\displaystyle (\bar (x)}) (jedoch nicht μ) als Zufallsvariable mit einer Wahrscheinlichkeitsverteilung auf der Stichprobe behandelt werden ( die Wahrscheinlichkeitsverteilung des Mittelwerts).

Beide Größen werden auf die gleiche Weise berechnet:

X ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + ⋯ + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\cdots +x_(n)).)

Wenn X eine Zufallsvariable ist, dann die mathematische Erwartung X kann als arithmetisches Mittel der Werte bei wiederholten Messungen einer Größe betrachtet werden X. Dies ist eine Manifestation des Gesetzes große Zahlen. Daher wird der Stichprobenmittelwert zur Schätzung des unbekannten Erwartungswerts verwendet.

In der elementaren Algebra wurde bewiesen, dass der Mittelwert N+ 1 Zahlen über dem Durchschnitt N Zahlen genau dann, wenn die neue Zahl größer als der alte Durchschnitt ist, kleiner genau dann, wenn die neue Zahl kleiner als der Durchschnitt ist, und sich genau dann nicht ändert, wenn die neue Zahl gleich dem Durchschnitt ist. Je mehr N, desto geringer ist die Differenz zwischen dem neuen und dem alten Durchschnitt.

Beachten Sie, dass mehrere andere „Durchschnitte“ verfügbar sind, darunter der Potenzmittelwert, der Kolmogorov-Mittelwert, der harmonische Mittelwert, der arithmetisch-geometrische Mittelwert und verschiedene gewichtete Mittelwerte (z. B. gewichteter arithmetischer Mittelwert, gewichteter geometrischer Mittelwert, gewichteter harmonischer Mittelwert).

Beispiele

  • Bei drei Zahlen müssen Sie diese addieren und durch 3 dividieren:
x 1 + x 2 + x 3 3 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3))(3)).)
  • Bei vier Zahlen müssen Sie diese addieren und durch 4 dividieren:
x 1 + x 2 + x 3 + x 4 4 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3)+x_(4))(4)).)

Oder einfacher 5+5=10, 10:2. Da wir zwei Zahlen addiert haben, d. h. wie viele Zahlen wir addieren, dividieren wir durch diese Anzahl.

Kontinuierliche Zufallsvariable

Für eine kontinuierlich verteilte Größe f (x) (\displaystyle f(x)) ist das arithmetische Mittel auf dem Intervall [ a ; b ] (\displaystyle ) wird durch ein bestimmtes Integral bestimmt:

F (x) ¯ [ a ; b ] = 1 b − a ∫ a b f (x) d x (\displaystyle (\overline (f(x)))_()=(\frac (1)(b-a))\int _(a)^(b) f(x)dx)

Einige Probleme bei der Verwendung des Durchschnitts

Mangelnde Robustheit

Hauptartikel: Robustheit in der Statistik

Obwohl arithmetische Mittel häufig als Durchschnittswerte oder zentrale Tendenzen verwendet werden, handelt es sich bei diesem Konzept nicht um eine robuste Statistik, was bedeutet, dass das arithmetische Mittel stark von „großen Abweichungen“ beeinflusst wird. Es ist bemerkenswert, dass bei Verteilungen mit einem großen Schiefekoeffizienten das arithmetische Mittel möglicherweise nicht dem Konzept des „Mittelwerts“ entspricht und die Werte des Mittelwerts aus robusten Statistiken (z. B. der Median) den Zentralwert möglicherweise besser beschreiben Tendenz.

Ein klassisches Beispiel ist die Berechnung des Durchschnittseinkommens. Das arithmetische Mittel kann als Median fehlinterpretiert werden, was zu dem Schluss führen kann, dass es mehr Menschen mit höherem Einkommen gibt, als es tatsächlich gibt. Unter „durchschnittlichem“ Einkommen versteht man, dass die meisten Menschen über ein Einkommen in der Größenordnung dieser Zahl verfügen. Dieses „durchschnittliche“ (im Sinne des arithmetischen Mittels) Einkommen ist höher als das Einkommen der meisten Menschen, da ein hohes Einkommen mit großer Abweichung vom Durchschnitt zu einer starken Schiefe des arithmetischen Mittels führt (im Gegensatz zum Durchschnittseinkommen am Median). „widersteht“ einer solchen Verzerrung). Dieses „durchschnittliche“ Einkommen sagt jedoch nichts über die Anzahl der Menschen in der Nähe des Medianeinkommens aus (und sagt nichts über die Anzahl der Menschen in der Nähe des modalen Einkommens aus). Wenn man jedoch die Begriffe „durchschnittlich“ und „die meisten Menschen“ auf die leichte Schulter nimmt, kann man zu der falschen Schlussfolgerung kommen, dass die meisten Menschen über ein höheres Einkommen verfügen, als sie tatsächlich haben. Beispielsweise wird ein Bericht über das „durchschnittliche“ Nettoeinkommen in Medina, Washington, berechnet als arithmetischer Durchschnitt aller jährlichen Nettoeinkommen der Einwohner, überraschende Ergebnisse liefern große Nummer wegen Bill Gates. Betrachten Sie die Stichprobe (1, 2, 2, 2, 3, 9). Der arithmetische Mittelwert liegt bei 3,17, allerdings liegen fünf von sechs Werten unter diesem Mittelwert.

Zinseszins

Hauptartikel: Kapitalrendite

Wenn die Zahlen multiplizieren, und nicht falten, müssen Sie das geometrische Mittel verwenden, nicht das arithmetische Mittel. Am häufigsten tritt dieser Vorfall bei der Berechnung der Kapitalrendite im Finanzbereich auf.

Wenn eine Aktie beispielsweise im ersten Jahr um 10 % fiel und im zweiten Jahr um 30 % stieg, dann ist es falsch, den „durchschnittlichen“ Anstieg über diese zwei Jahre als arithmetisches Mittel (−10 % + 30 %) / 2 zu berechnen = 10 %; Der korrekte Durchschnitt ergibt sich in diesem Fall aus der durchschnittlichen jährlichen Wachstumsrate, die eine jährliche Wachstumsrate von nur etwa 8,16653826392 % ≈ 8,2 % ergibt.

Der Grund dafür ist, dass Prozentsätze jedes Mal einen neuen Ausgangspunkt haben: 30 % ist 30 % ab einer Zahl, die unter dem Preis zu Beginn des ersten Jahres liegt: Wenn eine Aktie bei 30 $ startete und um 10 % fiel, ist sie zu Beginn des zweiten Jahres 27 $ wert. Wenn die Aktie um 30 % steigen würde, wäre sie am Ende des zweiten Jahres 35,1 $ wert. Der arithmetische Durchschnitt dieses Wachstums beträgt 10 %, aber da die Aktie in zwei Jahren nur um 5,1 $ gestiegen ist, ergibt das durchschnittliche Wachstum von 8,2 % ein Endergebnis von 35,1 $:

[30 $ (1 - 0,1) (1 + 0,3) = 30 $ (1 + 0,082) (1 + 0,082) = 35,1 $]. Wenn wir den arithmetischen Durchschnitt von 10 % auf die gleiche Weise verwenden, erhalten wir nicht den tatsächlichen Wert: [30 $ (1 + 0,1) (1 + 0,1) = 36,3 $].

Zinseszins am Ende von 2 Jahren: 90 % * 130 % = 117 %, d. h. die Gesamtsteigerung beträgt 17 %, und der durchschnittliche jährliche Zinseszins beträgt 117 % ≈ 108,2 % (\displaystyle (\sqrt ))\ca. 108,2\%), also ein durchschnittlicher jährlicher Anstieg von 8,2 %.

Richtungen

Hauptartikel: Zielstatistiken

Bei der Berechnung des arithmetischen Mittels einer Variablen, die sich zyklisch ändert (z. B. Phase oder Winkel), ist besondere Vorsicht geboten. Zum Beispiel wäre der Durchschnitt von 1° und 359° 1 ∘ + 359 ∘ 2 = (\displaystyle (\frac (1^(\circ )+359^(\circ ))(2))=) 180°. Diese Zahl ist aus zwei Gründen falsch.

  • Erstens, Winkelmaße sind nur für den Bereich von 0° bis 360° (oder von 0 bis 2π bei Messung im Bogenmaß) definiert. Das gleiche Zahlenpaar könnte also als (1° und −1°) oder als (1° und 719°) geschrieben werden. Die Durchschnittswerte jedes Paares werden unterschiedlich sein: 1 ∘ + (− 1 ∘) 2 = 0 ∘ (\displaystyle (\frac (1^(\circ )+(-1^(\circ )))(2 ))=0 ^(\circ )) , 1 ∘ + 719 ∘ 2 = 360 ∘ (\displaystyle (\frac (1^(\circ )+719^(\circ ))(2))=360^(\ Kreis )).
  • Zweitens ist in diesem Fall ein Wert von 0° (entspricht 360°) ein geometrisch besserer Durchschnittswert, da die Zahlen von 0° weniger abweichen als von jedem anderen Wert (der Wert 0° weist die geringste Varianz auf). Vergleichen:
    • die Zahl 1° weicht von 0° nur um 1° ab;
    • die Zahl 1° weicht um 179° vom berechneten Mittelwert von 180° ab.

Der nach obiger Formel berechnete Durchschnittswert einer zyklischen Variablen wird gegenüber dem realen Durchschnitt künstlich in die Mitte des Zahlenbereichs verschoben. Aus diesem Grund wird der Durchschnitt auf andere Weise berechnet, nämlich die Zahl mit der geringsten Varianz (der Mittelpunkt) wird als Durchschnittswert ausgewählt. Außerdem wird anstelle der Subtraktion der Modulabstand (also der Umfangsabstand) verwendet. Beispielsweise beträgt der Modulabstand zwischen 1° und 359° 2°, nicht 358° (auf dem Kreis zwischen 359° und 360° ==0° - ein Grad, zwischen 0° und 1° - insgesamt auch 1° - 2°).

Gewichteter Durchschnitt – was ist das und wie berechnet man ihn?

Im Laufe des Mathematikstudiums werden Schüler mit dem Konzept des arithmetischen Mittels vertraut gemacht. Später in der Statistik und einigen anderen Wissenschaften werden Studierende mit der Berechnung anderer Durchschnittswerte konfrontiert. Was können sie sein und wie unterscheiden sie sich voneinander?

Durchschnittswerte: Bedeutung und Unterschiede

Genaue Indikatoren ermöglichen nicht immer ein Verständnis der Situation. Um eine bestimmte Situation beurteilen zu können, ist manchmal eine Analyse erforderlich große Menge Zahlen Und dann kommen Durchschnittswerte zur Rettung. Sie ermöglichen uns, die Situation als Ganzes einzuschätzen.


Viele Erwachsene erinnern sich seit der Schulzeit an die Existenz des arithmetischen Mittels. Die Berechnung ist sehr einfach: Die Summe einer Folge von n Termen wird durch n geteilt. Das heißt, wenn Sie das arithmetische Mittel in der Folge der Werte 27, 22, 34 und 37 berechnen müssen, müssen Sie den Ausdruck (27+22+34+37)/4 lösen, da 4 Werte vorhanden sind werden in den Berechnungen verwendet. In diesem Fall beträgt der erforderliche Wert 30.

Oft innerhalb Schulkurs Auch das geometrische Mittel wird untersucht. Die Berechnung dieses Wertes basiert auf der Extraktion der n-ten Wurzel aus dem Produkt von n Termen. Wenn wir die gleichen Zahlen nehmen: 27, 22, 34 und 37, dann ist das Ergebnis der Berechnungen 29,4.

Harmonisches Mittel in weiterführende Schule ist in der Regel nicht Gegenstand des Studiums. Es wird jedoch recht häufig verwendet. Dieser Wert ist der Kehrwert des arithmetischen Mittels und wird als Quotient aus n – der Anzahl der Werte und der Summe 1/a 1 +1/a 2 +...+1/a n berechnet. Wenn wir erneut die gleiche Zahlenreihe zur Berechnung heranziehen, beträgt die Harmonische 29,6.

Gewichteter Durchschnitt: Funktionen

Allerdings dürfen nicht überall alle oben genannten Werte verwendet werden. Beispielsweise spielt in der Statistik bei der Berechnung bestimmter Durchschnittswerte das „Gewicht“ jeder in den Berechnungen verwendeten Zahl eine wichtige Rolle. Die Ergebnisse sind aussagekräftiger und korrekter, da sie berücksichtigen Mehr Informationen. Diese Mengengruppe ist gemeinsamen Namen„gewichteter Durchschnitt“. Sie werden in der Schule nicht gelehrt, daher lohnt es sich, sie genauer zu betrachten.

Zunächst lohnt es sich zu erklären, was unter dem „Gewicht“ eines bestimmten Wertes zu verstehen ist. Der einfachste Weg, dies zu erklären, ist konkretes Beispiel. Zweimal täglich wird im Krankenhaus die Körpertemperatur jedes Patienten gemessen. Von 100 Patienten in verschiedenen Abteilungen des Krankenhauses haben 44 eine normale Temperatur von 36,6 Grad. Weitere 30 haben einen erhöhten Wert - 37,2, 14 - 38, 7 - 38,5, 3 - 39 und die restlichen zwei - 40. Und wenn wir den arithmetischen Durchschnitt nehmen, dann wird dieser Wert im Allgemeinen für das Krankenhaus mehr als 38 betragen Grad! Aber fast die Hälfte der Patienten hat eine völlig normale Temperatur. Und hier wäre es richtiger, einen gewichteten Durchschnitt zu verwenden, und das „Gewicht“ jedes Werts wäre die Anzahl der Personen. In diesem Fall beträgt das Berechnungsergebnis 37,25 Grad. Der Unterschied ist offensichtlich.

Bei gewichteten Durchschnittsberechnungen kann als „Gewicht“ die Anzahl der Sendungen, die Anzahl der an einem bestimmten Tag arbeitenden Personen, im Allgemeinen alles, was gemessen werden kann und das Endergebnis beeinflusst, verstanden werden.

Sorten

Der gewichtete Durchschnitt bezieht sich auf das arithmetische Mittel, das am Anfang des Artikels diskutiert wurde. Allerdings berücksichtigt der erste Wert, wie bereits erwähnt, auch das Gewicht jeder in den Berechnungen verwendeten Zahl. Darüber hinaus gibt es auch gewichtete geometrische und harmonische Werte.

Es gibt eine weitere interessante Variante, die in Zahlenreihen verwendet wird. Es geht umüber einen gewichteten gleitenden Durchschnitt. Auf dieser Grundlage werden Trends berechnet. Neben den Werten selbst und deren Gewicht wird dort auch die Periodizität verwendet. Und bei der Berechnung des Durchschnittswertes zu einem bestimmten Zeitpunkt werden auch Werte für frühere Zeiträume berücksichtigt.

Die Berechnung all dieser Werte ist nicht so schwierig, in der Praxis wird jedoch meist nur der gewöhnliche gewichtete Durchschnitt verwendet.

Berechnungsmethoden

Im Zeitalter der weit verbreiteten Computerisierung besteht keine Notwendigkeit, den gewichteten Durchschnitt manuell zu berechnen. Es wäre jedoch hilfreich, die Berechnungsformel zu kennen, um die erhaltenen Ergebnisse überprüfen und gegebenenfalls anpassen zu können.

Am einfachsten ist es, die Berechnung anhand eines konkreten Beispiels zu betrachten.

Es ist notwendig, herauszufinden, wie hoch der Durchschnittslohn in diesem Unternehmen ist, und zwar unter Berücksichtigung der Anzahl der Arbeitnehmer, die das eine oder andere Gehalt beziehen.

Der gewichtete Durchschnitt wird also nach der folgenden Formel berechnet:

x = (a 1 *w 1 +a 2 *w 2 +...+a n *w n)/(w 1 +w 2 +...+w n)

Die Berechnung würde beispielsweise so aussehen:

x = (32*20+33*35+34*14+40*6)/(20+35+14+6) = (640+1155+476+240)/75 = 33,48

Offensichtlich stellt die manuelle Berechnung des gewichteten Durchschnitts keine besonderen Schwierigkeiten dar. Die Formel zur Berechnung dieses Wertes in einer der beliebtesten Formelanwendungen – Excel – sieht aus wie die Funktion SUMPRODUCT (Zahlenreihe; Gewichtsreihe) / SUMME (Gewichtsreihe).

Wie finde ich den Durchschnitt in Excel?

Wie finde ich das arithmetische Mittel in Excel?

Vladimir09854

So einfach wie Kuchen. Um den Durchschnitt in Excel zu ermitteln, benötigen Sie nur 3 Zellen. Im ersten schreiben wir eine Zahl, im zweiten eine andere. Und in die dritte Zelle geben wir eine Formel ein, die uns den Durchschnittswert zwischen diesen beiden Zahlen aus der ersten und zweiten Zelle liefert. Wenn Zelle Nr. 1 A1 und Zelle Nr. 2 B1 heißt, müssen Sie in die Zelle mit der Formel Folgendes schreiben:

Diese Formel berechnet das arithmetische Mittel zweier Zahlen.

Um unsere Berechnungen schöner zu gestalten, können wir die Zellen mit Linien in Form einer Platte hervorheben.

In Excel selbst gibt es auch eine Funktion zur Ermittlung des Durchschnittswertes, allerdings nutze ich die altmodische Methode und gebe die benötigte Formel ein. Daher bin ich sicher, dass Excel genau so rechnet, wie ich es benötige, und keine eigenen Rundungen vornehmen wird.

M3sergey

Dies ist sehr einfach, wenn die Daten bereits in den Zellen eingegeben sind. Wenn Sie nur an einer Zahl interessiert sind, wählen Sie einfach den/die gewünschten Bereich(e) aus und der Wert der Summe dieser Zahlen, ihr arithmetisches Mittel und ihre Zahl werden unten rechts in der Statusleiste angezeigt.

Sie können eine leere Zelle auswählen, auf das Dreieck (Dropdown-Liste) „AutoSumme“ klicken und dort „Durchschnitt“ auswählen. Anschließend stimmen Sie dem vorgeschlagenen Berechnungsbereich zu oder wählen Ihren eigenen aus.

Schließlich können Sie Formeln direkt verwenden, indem Sie neben der Bearbeitungsleiste und der Zellenadresse auf „Funktion einfügen“ klicken. Die Funktion AVERAGE befindet sich in der Kategorie „Statistisch“ und verwendet als Argumente sowohl Zahlen als auch Zellbezüge usw. Dort können Sie auch komplexere Optionen auswählen, zum Beispiel AVERAGEIF – Berechnung des Durchschnitts entsprechend der Bedingung.

Finden Sie den Durchschnittswert in Excel ist eine ziemlich einfache Aufgabe. Hier müssen Sie verstehen, ob Sie diesen Durchschnittswert in einigen Formeln verwenden möchten oder nicht.

Wenn Sie nur den Wert ermitteln müssen, wählen Sie einfach den gewünschten Zahlenbereich aus. Anschließend berechnet Excel automatisch den Durchschnittswert. Dieser wird in der Statusleiste mit der Überschrift „Durchschnitt“ angezeigt.

Wenn Sie das Ergebnis in Formeln verwenden möchten, können Sie Folgendes tun:

1) Summieren Sie die Zellen mit der SUM-Funktion und dividieren Sie alles durch die Anzahl der Zahlen.

2) Eine korrektere Option ist die Verwendung einer speziellen Funktion namens AVERAGE. Die Argumente dieser Funktion können sequentiell angegebene Zahlen oder ein Zahlenbereich sein.

Wladimir Tichonow

Kreisen Sie die Werte ein, die an der Berechnung beteiligt sind, klicken Sie auf die Registerkarte „Formeln“. Dort sehen Sie links „AutoSumme“ und daneben ein nach unten zeigendes Dreieck. Klicken Sie auf dieses Dreieck und wählen Sie „Mittel“. Voila, fertig) Am Ende der Spalte sehen Sie den Durchschnittswert :)

Ekaterina Mutalapova

Beginnen wir von vorne und der Reihe nach. Was bedeutet Durchschnitt?

Der Mittelwert ist ein Wert, der das arithmetische Mittel ist, d. h. wird berechnet, indem man eine Reihe von Zahlen addiert und dann die Gesamtsumme der Zahlen durch ihre Zahl dividiert. Für die Zahlen 2, 3, 6, 7, 2 ergibt sich beispielsweise 4 (die Summe der Zahlen 20 wird durch ihre Zahl 5 geteilt)

In einer Excel-Tabelle war es für mich persönlich am einfachsten, die Formel = DURCHSCHNITT zu verwenden. Um den Durchschnittswert zu berechnen, müssen Sie Daten in die Tabelle eingeben, die Funktion =AVERAGE() unter die Datenspalte schreiben und den Zahlenbereich in den Zellen in Klammern angeben, wobei Sie die Spalte mit den Daten hervorheben. Drücken Sie anschließend die EINGABETASTE oder klicken Sie einfach mit der linken Maustaste auf eine beliebige Zelle. Das Ergebnis erscheint in der Zelle unterhalb der Spalte. Es sieht unverständlich beschrieben aus, aber tatsächlich handelt es sich um eine Frage von Minuten.

Abenteurer 2000

Excel ist ein vielfältiges Programm, daher gibt es mehrere Optionen, mit denen Sie Durchschnittswerte ermitteln können:

Erste Wahl. Sie summieren einfach alle Zellen und dividieren durch ihre Anzahl.

Zweite Option. Verwenden Sie einen speziellen Befehl und schreiben Sie die Formel „= DURCHSCHNITT (und geben Sie hier den Zellbereich an)“ in die gewünschte Zelle.

Dritte Option. Wenn Sie den gewünschten Bereich auswählen, beachten Sie bitte, dass auf der Seite unten auch der Durchschnittswert in diesen Zellen angezeigt wird.

Daher gibt es viele Möglichkeiten, den Durchschnitt zu ermitteln. Sie müssen lediglich die für Sie beste auswählen und diese ständig verwenden.

In Excel können Sie die Funktion AVERAGE verwenden, um den einfachen arithmetischen Durchschnitt zu berechnen. Dazu müssen Sie eine Reihe von Werten eingeben. Drücken Sie „Gleich“ und wählen Sie „Statistisch“ in der Kategorie aus, unter der Sie die Funktion „MITTELWERT“ auswählen



Mithilfe statistischer Formeln können Sie außerdem das gewichtete arithmetische Mittel berechnen, das als genauer gilt. Zur Berechnung benötigen wir Indikatorwerte und Häufigkeit.

Wie finde ich den Durchschnitt in Excel?

Das ist die Situation. Es gibt folgende Tabelle:

Die rot schattierten Spalten enthalten die Zahlenwerte der Noten in den Fächern. In der Spalte „ Durchschnittsnote„Es ist notwendig, ihren Durchschnittswert zu berechnen.
Das Problem ist folgendes: Insgesamt sind es 60–70 Elemente und einige davon befinden sich auf einem anderen Blatt.
Ich habe in einem anderen Dokument nachgesehen und der Durchschnitt wurde bereits berechnet, und in der Zelle befindet sich eine Formel wie
="Blattname"!|E12
aber das wurde von einem Programmierer gemacht, der gefeuert wurde.
Bitte sagen Sie mir, wer das versteht.

Tyrannisieren

In der Funktionszeile fügen Sie „AVERAGE“ aus den vorgeschlagenen Funktionen ein und wählen aus, wo diese berechnet werden sollen (B6:N6), zum Beispiel für Ivanov. Über die nebenstehenden Blätter weiß ich nichts Genaues, aber es ist wahrscheinlich in der Standard-Windows-Hilfe enthalten

Sagen Sie mir, wie ich den Durchschnittswert in Word berechnen kann

Bitte sagen Sie mir, wie ich den Durchschnittswert in Word berechnen kann. Nämlich der Durchschnittswert der Bewertungen und nicht die Anzahl der Personen, die die Bewertungen erhalten haben.


Julia Pawlowa

Word kann mit Makros viel anfangen. Drücken Sie ALT+F11 und schreiben Sie ein Makroprogramm.
Darüber hinaus können Sie mit Insert-Object... andere Programme, sogar Excel, verwenden, um ein Blatt mit einer Tabelle in einem Word-Dokument zu erstellen.
Aber in diesem Fall müssen Sie Ihre Zahlen in eine Spalte der Tabelle eintragen und den Durchschnitt in die unterste Zelle derselben Spalte eingeben, oder?
Fügen Sie dazu ein Feld in die unterste Zelle ein.
Feld einfügen... -Formel
Feldinhalt
[=DURCHSCHNITT(OBEN)]
gibt den Durchschnitt der Summe der oben genannten Zellen an.
Wenn Sie ein Feld auswählen und mit der rechten Maustaste klicken, können Sie es aktualisieren, wenn sich die Zahlen geändert haben.
Zeigen Sie den Code oder Wert eines Felds an und ändern Sie den Code direkt im Feld.
Wenn etwas schief geht, löschen Sie das gesamte Feld in der Zelle und erstellen Sie es erneut.
DURCHSCHNITT bedeutet Durchschnitt, OBEN – ungefähr, also eine Anzahl darüber liegender Zellen.
Ich wusste das alles selbst nicht, aber mit etwas Nachdenken habe ich es natürlich leicht in HILFE entdeckt.



Lesen Sie auch: