Mittelwert und Varianzwert. Es ist praktisch, die Dispersion mithilfe einer Formel zu berechnen, die sich leicht aus den Eigenschaften der Dispersion ermitteln lässt

Arten von Dispersionen:

Gesamtvarianz charakterisiert die Variation eines Merkmals der Gesamtpopulation unter dem Einfluss aller Faktoren, die diese Variation verursacht haben. Dieser Wert wird durch die Formel bestimmt

Wo ist das arithmetische Gesamtmittel der gesamten untersuchten Bevölkerung?

Durchschnittliche Varianz innerhalb der Gruppe bezeichnet eine zufällige Variation, die unter dem Einfluss nicht berücksichtigter Faktoren entstehen kann und die nicht von dem Faktorattribut abhängt, das die Grundlage der Gruppierung bildet. Diese Varianz wird wie folgt berechnet: Zuerst werden die Varianzen für einzelne Gruppen berechnet (), dann wird die durchschnittliche Varianz innerhalb der Gruppe berechnet:

wobei n i die Anzahl der Einheiten in der Gruppe ist

Intergruppenvarianz(Varianz der Gruppenmittelwerte) charakterisiert die systematische Variation, d.h. Unterschiede im Wert des untersuchten Merkmals, die unter dem Einfluss des Faktorzeichens entstehen, das der Gruppierung zugrunde liegt.

Wo ist der Durchschnittswert für eine separate Gruppe?

Alle drei Arten von Varianz hängen miteinander zusammen: Die Gesamtvarianz ist gleich der Summe der durchschnittlichen Varianz innerhalb der Gruppe und der Varianz zwischen den Gruppen:

Eigenschaften:

25 Relative Variationsmaße

Schwingungskoeffizient

Relative lineare Abweichung

Der Variationskoeffizient

Coef. Osz. Ö spiegelt die relative Schwankung der Extremwerte eines Merkmals um den Durchschnitt wider. Rel. lin. aus. charakterisiert den Anteil des Mittelwerts am Vorzeichen der absoluten Abweichungen vom Mittelwert. Coef. Variation ist das am häufigsten verwendete Variabilitätsmaß zur Beurteilung der Typizität von Durchschnittswerten.

In der Statistik gelten Populationen mit einem Variationskoeffizienten von mehr als 30–35 % als heterogen.

    Regelmäßigkeit der Verteilungsreihen. Momente der Verteilung. Indikatoren für die Verteilungsform

Bei Variationsreihen besteht ein Zusammenhang zwischen den Häufigkeiten und den Werten des variierenden Merkmals: Bei einer Zunahme des Merkmals steigt der Häufigkeitswert zunächst bis zu einem bestimmten Grenzwert an und nimmt dann ab. Solche Änderungen werden aufgerufen Verteilungsmuster.

Die Form der Verteilung wird anhand von Schiefe- und Kurtosis-Indikatoren untersucht. Bei der Berechnung dieser Indikatoren werden Verteilungsmomente verwendet.

Das Moment k-ter Ordnung ist der Durchschnitt der k-ten Abweichungsgrade der Variantenwerte eines Merkmals von einem konstanten Wert. Die Reihenfolge des Augenblicks wird durch den Wert von k bestimmt. Bei der Analyse von Variationsreihen beschränkt man sich auf die Berechnung der Momente der ersten vier Ordnungen. Bei der Berechnung von Momenten können Frequenzen oder Frequenzen als Gewichte verwendet werden. Abhängig von der Wahl des konstanten Wertes werden anfängliche, bedingte und zentrale Momente unterschieden.

Indikatoren für die Verteilungsform:

Asymmetrie(As) Indikator, der den Grad der Verteilungsasymmetrie charakterisiert .

Daher mit (linksseitiger) negativer Asymmetrie . Mit (rechtsseitiger) positiver Asymmetrie .

Zentralmomente können zur Berechnung der Asymmetrie herangezogen werden. Dann:

,

wo μ 3 – zentrales Moment dritter Ordnung.

- Kurtosis (E Zu ) charakterisiert die Steilheit des Funktionsgraphen im Vergleich zur Normalverteilung bei gleicher Variationsstärke:

,

wobei μ 4 das Zentralmoment 4. Ordnung ist.

    Normalverteilungsgesetz

Für eine Normalverteilung (Gaußverteilung) hat die Verteilungsfunktion folgende Form:

Erwartung - Standardabweichung

Die Normalverteilung ist symmetrisch und wird durch die folgende Beziehung charakterisiert: Xav=Me=Mo

Die Kurtosis einer Normalverteilung beträgt 3 und der Schiefekoeffizient beträgt 0.

Die Normalverteilungskurve ist ein Polygon (symmetrische glockenförmige Gerade)

    Arten von Dispersionen. Die Regel zum Addieren von Varianzen. Das Wesen des empirischen Bestimmtheitskoeffizienten.

Wenn die ursprüngliche Grundgesamtheit nach einem signifikanten Merkmal in Gruppen eingeteilt wird, werden die folgenden Arten von Varianzen berechnet:

    Gesamtvarianz der Originalpopulation:

wobei der Gesamtdurchschnittswert der ursprünglichen Population ist; f die Häufigkeit der ursprünglichen Population ist. Die Gesamtstreuung charakterisiert die Abweichung einzelner Werte eines Merkmals vom Gesamtdurchschnittswert der ursprünglichen Grundgesamtheit.

    Varianzen innerhalb der Gruppe:

Dabei ist j die Nummer der Gruppe; der Durchschnittswert in jeder j-ten Gruppe ist die Häufigkeit der j-ten Gruppe. Varianzen innerhalb der Gruppe charakterisieren die Abweichung des individuellen Werts eines Merkmals in jeder Gruppe vom Gruppendurchschnittswert. Aus allen Varianzen innerhalb der Gruppe wird der Durchschnitt mithilfe der Formel berechnet: wobei die Anzahl der Einheiten in jeder j-ten Gruppe ist.

    Intergruppenvarianz:

Die Intergruppenstreuung charakterisiert die Abweichung der Gruppendurchschnitte vom Gesamtdurchschnitt der ursprünglichen Population.

Varianzadditionsregel ist, dass die Gesamtvarianz der ursprünglichen Grundgesamtheit gleich der Summe der Varianzen zwischen den Gruppen und dem Durchschnitt der Varianzen innerhalb der Gruppe sein sollte:

Empirisches Bestimmtheitsmaß zeigt den Anteil der Variation im untersuchten Merkmal aufgrund der Variation im Gruppierungsmerkmal und wird nach der Formel berechnet:

    Zählmethode von einem bedingten Nullpunkt (Momentenmethode) zur Berechnung des Durchschnittswerts und der Varianz

Die Berechnung der Streuung nach der Momentenmethode basiert auf der Verwendung der Formel und den Eigenschaften 3 und 4 der Streuung.

(3. Wenn alle Werte des Attributs (Optionen) um eine konstante Zahl A erhöht (verringert) werden, ändert sich die Varianz der neuen Grundgesamtheit nicht.

4. Wenn alle Werte des Attributs (Optionen) um das K-fache erhöht (multipliziert) werden, wobei K eine konstante Zahl ist, dann erhöht (sinkt) die Varianz der neuen Grundgesamtheit um das K-fache.)

Wir erhalten eine Formel zur Berechnung der Streuung in Variationsreihen mit gleichen Intervallen nach der Momentenmethode:

A - bedingte Null, gleich der Option mit der maximalen Häufigkeit (die Mitte des Intervalls mit der maximalen Häufigkeit)

Auch die Berechnung des Durchschnittswertes nach der Momentenmethode basiert auf der Nutzung der Eigenschaften des Durchschnitts.

    Das Konzept der selektiven Beobachtung. Phasen der Untersuchung wirtschaftlicher Phänomene mithilfe einer Stichprobenmethode

Eine Stichprobenbeobachtung ist eine Beobachtung, bei der nicht alle Einheiten der Grundgesamtheit, sondern nur ein Teil der Einheiten untersucht und untersucht werden und das Ergebnis der Untersuchung eines Teils der Grundgesamtheit für die gesamte Grundgesamtheit gilt. Die Grundgesamtheit, aus der Einheiten zur weiteren Untersuchung und Untersuchung ausgewählt werden, wird aufgerufen allgemein und alle Indikatoren, die diese Gesamtheit charakterisieren, werden aufgerufen allgemein.

Mögliche Grenzen der Abweichungen des Stichprobenmittelwerts vom allgemeinen Durchschnittswert werden genannt Stichprobenfehler.

Die Menge der ausgewählten Einheiten wird aufgerufen selektiv und alle Indikatoren, die diese Gesamtheit charakterisieren, werden aufgerufen selektiv.

Die Probenforschung umfasst die folgenden Phasen:

Merkmale des Untersuchungsgegenstandes (massenwirtschaftliche Phänomene). Wenn die Population klein ist, wird eine umfassende Untersuchung nicht empfohlen;

Berechnung der Stichprobengröße. Es ist wichtig, das optimale Volumen zu bestimmen, das es ermöglicht, dass der Probenahmefehler bei geringsten Kosten im akzeptablen Bereich liegt;

Auswahl der Beobachtungseinheiten unter Berücksichtigung der Anforderungen der Zufälligkeit und Verhältnismäßigkeit.

Nachweis der Repräsentativität basierend auf einer Schätzung des Stichprobenfehlers. Bei einer Zufallsstichprobe wird der Fehler anhand von Formeln berechnet. Für die Zielstichprobe wird die Repräsentativität anhand qualitativer Methoden (Vergleich, Experiment) beurteilt;

Analyse der Stichprobenpopulation. Erfüllt die generierte Stichprobe die Anforderungen an Repräsentativität, wird sie anhand analytischer Indikatoren (Durchschnitt, relativ usw.) analysiert.

Neben der Untersuchung der Variation eines Merkmals in der gesamten Population ist es oft notwendig, quantitative Veränderungen des Merkmals über die Gruppen hinweg, in die die Population aufgeteilt ist, sowie zwischen Gruppen zu verfolgen. Diese Variationsstudie wird durch die Berechnung und Analyse verschiedener Varianzarten erreicht.
Es gibt Gesamt-, Intergruppen- und Intragruppenvarianzen.
Gesamtvarianz σ 2 misst die Variation eines Merkmals in der gesamten Population unter dem Einfluss aller Faktoren, die diese Variation verursacht haben.

Die Intergruppenvarianz (δ) charakterisiert die systematische Variation, d. h. Unterschiede im Wert des untersuchten Merkmals, die unter dem Einfluss des der Gruppe zugrunde liegenden Faktormerkmals entstehen. Die Berechnung erfolgt nach folgender Formel:
.

Varianz innerhalb der Gruppe (σ) spiegelt zufällige Variationen wider, d. h. Teil der Variation, der unter dem Einfluss nicht berücksichtigter Faktoren auftritt und nicht von dem Faktorattribut abhängt, das die Grundlage der Gruppe bildet. Es wird nach der Formel berechnet:
.

Durchschnitt der gruppeninternen Varianzen: .

Es gibt ein Gesetz, das drei Arten der Dispersion verbindet. Die Gesamtvarianz entspricht der Summe des Durchschnitts der gruppeninternen und gruppenübergreifenden Varianz: .
Dieses Verhältnis heißt Regel zum Addieren von Varianzen.

Ein in der Analyse häufig verwendeter Indikator ist der Anteil der Varianz zwischen Gruppen an der Gesamtvarianz. Es heißt empirisches Bestimmtheitsmaß (η 2): .
Die Quadratwurzel des empirischen Bestimmtheitsmaßes heißt empirisches Korrelationsverhältnis (η):
.
Es charakterisiert den Einfluss des der Gruppe zugrunde liegenden Merkmals auf die Variation des resultierenden Merkmals. Das empirische Korrelationsverhältnis liegt zwischen 0 und 1.
Lassen Sie uns den praktischen Nutzen anhand des folgenden Beispiels demonstrieren (Tabelle 1).

Beispiel Nr. 1. Tabelle 1 – Arbeitsproduktivität von zwei Gruppen von Arbeitern in einer der Werkstätten von NPO Cyclone

Berechnen wir die Gesamt- und Gruppenmittelwerte und -varianzen:




Die Ausgangsdaten zur Berechnung des Durchschnitts der Intragruppen- und Intergruppenvarianz sind in der Tabelle dargestellt. 2.
Tabelle 2
Berechnung und δ 2 für zwei Gruppen von Arbeitnehmern.


Arbeitergruppen
Anzahl der Arbeiter, Personen Durchschnittlich, Kinder/Schicht Streuung

Abgeschlossene technische Ausbildung

5 95 42,0

Diejenigen, die keine technische Ausbildung abgeschlossen haben

5 81 231,2

Alle Arbeiter

10 88 185,6
Berechnen wir die Indikatoren. Durchschnitt der gruppeninternen Varianzen:
.
Intergruppenvarianz

Gesamtvarianz:
Somit beträgt das empirische Korrelationsverhältnis: .

Neben der Variation quantitativer Merkmale sind auch Variationen qualitativer Merkmale zu beobachten. Diese Variationsstudie wird durch die Berechnung der folgenden Varianztypen erreicht:

Die gruppeninterne Streuung des Anteils wird durch die Formel bestimmt

Wo n i– Anzahl der Einheiten in separaten Gruppen.
Der Anteil des untersuchten Merkmals an der Gesamtpopulation, der durch die Formel bestimmt wird:
Die drei Varianzarten hängen wie folgt miteinander zusammen:
.

Dieses Varianzverhältnis wird als Varianzadditionssatz des Merkmalsanteils bezeichnet.

Variationsbereich (oder Variationsbereich) - Dies ist die Differenz zwischen den Maximal- und Minimalwerten des Merkmals:

In unserem Beispiel beträgt die Schwankungsbreite der Schichtleistung der Arbeiter: in der ersten Brigade R = 105-95 = 10 Kinder, in der zweiten Brigade R = 125-75 = 50 Kinder. (5 mal mehr). Dies deutet darauf hin, dass die Leistung der 1. Brigade „stabiler“ ist, die zweite Brigade jedoch über mehr Reserven zur Leistungssteigerung verfügt, weil Wenn alle Arbeiter die maximale Leistung dieser Brigade erreichen, kann sie 3 * 125 = 375 Teile produzieren, in der 1. Brigade nur 105 * 3 = 315 Teile.
Wenn die Extremwerte eines Merkmals nicht typisch für die Grundgesamtheit sind, werden Quartil- oder Dezilbereiche verwendet. Der Quartilbereich RQ= Q3-Q1 deckt 50 % des Bevölkerungsvolumens ab, der erste Dezilbereich RD1 = D9-D1 deckt 80 % der Daten ab, der zweite Dezilbereich RD2= D8-D2 – 60 %.
Der Nachteil des Variationsbereichsindikators besteht darin, dass sein Wert nicht alle Schwankungen des Merkmals widerspiegelt.
Der einfachste allgemeine Indikator, der alle Schwankungen eines Merkmals widerspiegelt, ist durchschnittliche lineare Abweichung, das ist das arithmetische Mittel der absoluten Abweichungen einzelner Optionen von ihrem Durchschnittswert:

,
für gruppierte Daten
,
Dabei ist xi der Wert des Attributs in einer diskreten Reihe oder die Mitte des Intervalls in der Intervallverteilung.
In den obigen Formeln werden die Differenzen im Zähler modulo gebildet, andernfalls ist der Zähler gemäß der Eigenschaft des arithmetischen Mittels immer gleich Null. Daher wird die durchschnittliche lineare Abweichung in der statistischen Praxis selten verwendet, sondern nur in Fällen, in denen die Summierung von Indikatoren ohne Berücksichtigung des Vorzeichens wirtschaftlich sinnvoll ist. Mit seiner Hilfe werden beispielsweise die Zusammensetzung der Belegschaft, die Rentabilität der Produktion und Außenhandelsumsätze analysiert.
Varianz eines Merkmals ist das durchschnittliche Quadrat der Abweichungen von ihrem Durchschnittswert:
einfache Varianz
,
Varianzgewichtet
.
Die Formel zur Berechnung der Varianz kann vereinfacht werden:

Somit ist die Varianz gleich der Differenz zwischen dem Durchschnitt der Optionsquadrate und dem Quadrat des Durchschnitts der Option der Grundgesamtheit:
.
Aufgrund der Summation der quadrierten Abweichungen ergibt die Varianz jedoch ein verzerrtes Bild der Abweichungen, sodass der Durchschnitt auf dieser Grundlage berechnet wird Standardabweichung, die zeigt, wie stark bestimmte Varianten eines Merkmals im Durchschnitt von ihrem Durchschnittswert abweichen. Berechnet durch Ziehen der Quadratwurzel der Varianz:
für nicht gruppierte Daten
,
für Variationsreihen

Je kleiner der Wert der Varianz und der Standardabweichung ist, je homogener die Grundgesamtheit ist, desto zuverlässiger (typischer) ist der Durchschnittswert.
Durchschnittliche lineare Abweichung und Standardabweichung sind benannte Zahlen, d. h. sie werden in Maßeinheiten eines Merkmals ausgedrückt, sind inhaltlich identisch und haben eine ähnliche Bedeutung.
Es empfiehlt sich, absolute Abweichungen anhand von Tabellen zu berechnen.
Tabelle 3 – Berechnung der Variationsmerkmale (am Beispiel des Zeitraums der Daten zur Schichtleistung von Mannschaftsarbeitern)


Anzahl der Arbeiter

Die Mitte des Intervalls

Berechnete Werte

Gesamt:

Durchschnittliche Schichtleistung der Arbeiter:

Durchschnittliche lineare Abweichung:

Produktionsabweichung:

Die Standardabweichung der Leistung einzelner Arbeitnehmer von der durchschnittlichen Leistung:
.

1 Berechnung der Streuung nach der Momentenmethode

Die Berechnung von Varianzen erfordert umständliche Berechnungen (insbesondere, wenn der Durchschnitt als große Zahl mit mehreren Dezimalstellen ausgedrückt wird). Berechnungen können durch die Verwendung einer vereinfachten Formel und Dispersionseigenschaften vereinfacht werden.
Die Dispersion hat folgende Eigenschaften:

  1. Wenn alle Werte eines Merkmals um denselben Wert A verringert oder erhöht werden, verringert sich die Streuung nicht:

,

, dann oder
Indem wir die Eigenschaften der Streuung nutzen und zunächst alle Varianten der Grundgesamtheit um den Wert A reduzieren und dann durch den Wert des Intervalls h dividieren, erhalten wir eine Formel zur Berechnung der Streuung in Variationsreihen mit gleichen Intervallen in gewisser Weise:
,
wo wird die Streuung nach der Momentenmethode berechnet?
h – der Wert des Intervalls der Variationsreihe;
– Option für neue (transformierte) Werte;
A ist ein konstanter Wert, der als Mitte des Intervalls mit der höchsten Häufigkeit verwendet wird; oder die Option mit der höchsten Häufigkeit;
– Quadrat des Moments erster Ordnung;
– Moment zweiter Ordnung.
Berechnen wir die Streuung mithilfe der Momentenmethode basierend auf Daten über die Schichtleistung der Mitarbeiter des Teams.
Tabelle 4 – Berechnung der Varianz mit der Momentenmethode


Gruppen von Produktionsarbeitern, Stk.

Anzahl der Arbeiter

Die Mitte des Intervalls

Berechnete Werte

Berechnungsverfahren:


  1. Wir berechnen die Varianz:

2 Berechnung der Varianz eines alternativen Merkmals

Unter den von der Statistik untersuchten Merkmalen gibt es auch solche, die nur zwei sich gegenseitig ausschließende Bedeutungen haben. Dies sind alternative Zeichen. Sie erhalten jeweils zwei quantitative Werte: Option 1 und 0. Die Häufigkeit von Option 1, die mit p bezeichnet wird, ist der Anteil der Einheiten, die dieses Merkmal besitzen. Die Differenz 1-ð=q ist die Häufigkeit der Optionen 0. Somit ist


xi

Arithmetisches Mittel des Alternativzeichens
, weil p+q=1.

Alternative Merkmalsvarianz
, Weil 1-ð=q
Somit ist die Varianz eines alternativen Merkmals gleich dem Produkt aus dem Anteil der Einheiten, die dieses Merkmal besitzen, und dem Anteil der Einheiten, die dieses Merkmal nicht besitzen.
Treten die Werte 1 und 0 gleich häufig auf, also p=q, erreicht die Varianz ihr Maximum pq=0,25.
Die Varianz eines Alternativmerkmals wird in Stichprobenerhebungen beispielsweise zur Produktqualität verwendet.

3 Varianz zwischen Gruppen. Varianzadditionsregel

Im Gegensatz zu anderen Variationsmerkmalen handelt es sich bei der Dispersion um eine additive Größe. Das heißt, im Aggregat, das nach Faktormerkmalen in Gruppen eingeteilt wird X , Varianz des resultierenden Merkmals j kann in die Varianz innerhalb jeder Gruppe (innerhalb von Gruppen) und die Varianz zwischen Gruppen (zwischen Gruppen) zerlegt werden. Dann wird es neben der Untersuchung der Variation eines Merkmals in der gesamten Population auch möglich, die Variation in jeder Gruppe sowie zwischen diesen Gruppen zu untersuchen.

Gesamtvarianz misst die Variation eines Merkmals bei in seiner Gesamtheit unter dem Einfluss aller Faktoren, die diese Variation (Abweichungen) verursacht haben. Sie entspricht der mittleren quadratischen Abweichung einzelner Werte des Attributs bei aus dem Gesamtdurchschnitt und kann als einfache oder gewichtete Varianz berechnet werden.
Intergruppenvarianz charakterisiert die Variation des resultierenden Merkmals bei verursacht durch den Einfluss des Faktorzeichens X, die die Grundlage der Gruppierung bildete. Es charakterisiert die Variation der Gruppendurchschnitte und entspricht dem mittleren Quadrat der Abweichungen der Gruppendurchschnitte vom Gesamtdurchschnitt:
,
wo ist das arithmetische Mittel der i-ten Gruppe;
– Anzahl der Einheiten in der i-ten Gruppe (Häufigkeit der i-ten Gruppe);
– der Gesamtdurchschnitt der Bevölkerung.
Varianz innerhalb der Gruppe spiegelt die zufällige Variation wider, d. h. den Teil der Variation, der durch den Einfluss nicht berücksichtigter Faktoren verursacht wird und nicht von dem Faktorattribut abhängt, das die Grundlage der Gruppierung bildet. Es charakterisiert die Variation einzelner Werte relativ zu Gruppendurchschnitten und ist gleich der mittleren quadratischen Abweichung einzelner Werte des Attributs bei innerhalb einer Gruppe aus dem arithmetischen Mittel dieser Gruppe (Gruppenmittel) und wird als einfache oder gewichtete Varianz für jede Gruppe berechnet:
oder ,
Wo ist die Anzahl der Einheiten in der Gruppe?
Basierend auf den gruppeninternen Varianzen für jede Gruppe kann man bestimmen Gesamtmittelwert der gruppeninternen Varianzen:
.
Den Zusammenhang zwischen den drei Streuungen nennt man Regeln zum Addieren von Varianzen, wonach die Gesamtvarianz gleich der Summe der Varianz zwischen den Gruppen und dem Durchschnitt der Varianzen innerhalb der Gruppe ist:

Beispiel. Bei der Untersuchung des Einflusses der Tarifkategorie (Qualifikation) von Arbeitnehmern auf das Produktivitätsniveau ihrer Arbeit wurden folgende Daten ermittelt.
Tabelle 5 – Verteilung der Arbeitnehmer nach durchschnittlicher Stundenleistung.



p/p

Arbeiter der 4. Kategorie

Arbeiter der 5. Kategorie

Ausgabe
Arbeiter, Stk.,

Ausgabe
Arbeiter, Stk.,

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

In diesem Beispiel werden Arbeitnehmer nach Faktormerkmalen in zwei Gruppen eingeteilt X– Qualifikationen, die durch ihren Rang gekennzeichnet sind. Das resultierende Merkmal – die Produktion – variiert sowohl unter seinem Einfluss (Intergruppenvariation) als auch aufgrund anderer Zufallsfaktoren (Intragruppenvariation). Das Ziel besteht darin, diese Variationen anhand von drei Varianzen zu messen: insgesamt, zwischen Gruppen und innerhalb von Gruppen. Das empirische Bestimmtheitsmaß gibt den Variationsanteil des resultierenden Merkmals an bei unter dem Einfluss eines Faktorzeichens X. Rest der Gesamtvariante bei verursacht durch Veränderungen anderer Faktoren.
Im Beispiel beträgt das empirische Bestimmtheitsmaß:
oder 66,7 %,
Dies bedeutet, dass 66,7 % der Unterschiede in der Arbeitsproduktivität auf Qualifikationsunterschiede zurückzuführen sind und 33,3 % auf den Einfluss anderer Faktoren zurückzuführen sind.
Empirische Korrelationsbeziehung zeigt den engen Zusammenhang zwischen Gruppierung und Leistungsmerkmalen. Berechnet als Quadratwurzel des empirischen Bestimmtheitsmaßes:

Das empirische Korrelationsverhältnis kann Werte von 0 bis 1 annehmen.
Wenn keine Verbindung besteht, dann =0. In diesem Fall =0, d. h. die Gruppenmittelwerte sind einander gleich und es gibt keine Variation zwischen den Gruppen. Dies bedeutet, dass das Gruppierungsmerkmal - Faktor keinen Einfluss auf die Bildung allgemeiner Variation hat.
Wenn die Verbindung funktionsfähig ist, dann =1. In diesem Fall ist die Varianz der Gruppenmittelwerte gleich der Gesamtvarianz (), d. h. es gibt keine Variation innerhalb der Gruppe. Dies bedeutet, dass das Gruppierungsmerkmal die Variation des resultierenden untersuchten Merkmals vollständig bestimmt.
Je näher der Wert des Korrelationsverhältnisses an Eins liegt, desto näher, näher an der funktionalen Abhängigkeit, ist der Zusammenhang zwischen den Merkmalen.
Um die Nähe von Zusammenhängen zwischen Merkmalen qualitativ zu beurteilen, werden Chaddock-Beziehungen verwendet.

Im Beispiel , was auf einen engen Zusammenhang zwischen der Produktivität der Arbeitnehmer und ihren Qualifikationen hinweist.

Die wichtigsten verallgemeinernden Indikatoren für die Variation in Statistiken sind Streuungen und Standardabweichungen.

Streuung das arithmetisches Mittel quadrierte Abweichungen jedes Merkmalswerts vom Gesamtdurchschnitt. Die Varianz wird üblicherweise als mittleres Abweichungsquadrat bezeichnet und mit  2 bezeichnet. Abhängig von den Quelldaten kann die Varianz mithilfe des einfachen oder gewichteten arithmetischen Mittels berechnet werden:

 ungewichtete (einfache) Varianz;

 Varianzgewichtet.

Standardabweichung Dies ist ein verallgemeinerndes Merkmal absoluter Größen Variationen Zeichen im Aggregat. Es wird in denselben Maßeinheiten wie das Attribut ausgedrückt (in Metern, Tonnen, Prozent, Hektar usw.).

Die Standardabweichung ist die Quadratwurzel der Varianz und wird mit  bezeichnet:

 Standardabweichung ungewichtet;

 gewichtete Standardabweichung.

Die Standardabweichung ist ein Maß für die Zuverlässigkeit des Mittelwerts. Je kleiner die Standardabweichung, desto besser spiegelt das arithmetische Mittel die gesamte dargestellte Grundgesamtheit wider.

Der Berechnung der Standardabweichung geht die Berechnung der Varianz voraus.

Das Verfahren zur Berechnung der gewichteten Varianz ist wie folgt:

1) Bestimmen Sie das gewichtete arithmetische Mittel:

2) Berechnen Sie die Abweichungen der Optionen vom Durchschnitt:

3) Quadrieren Sie die Abweichung jeder Option vom Durchschnitt:

4) Multiplizieren Sie die Quadrate der Abweichungen mit Gewichten (Häufigkeiten):

5) Fassen Sie die resultierenden Produkte zusammen:

6) Der resultierende Betrag wird durch die Summe der Gewichte dividiert:

Beispiel 2.1

Berechnen wir das gewichtete arithmetische Mittel:

Die Werte der Abweichungen vom Mittelwert und ihre Quadrate sind in der Tabelle dargestellt. Definieren wir die Varianz:

Die Standardabweichung beträgt:

Wenn die Quelldaten in Form eines Intervalls dargestellt werden Vertriebsreihe , dann müssen Sie zunächst den diskreten Wert des Attributs ermitteln und dann die beschriebene Methode anwenden.

Beispiel 2.2

Zeigen wir die Varianzberechnung für eine Intervallreihe anhand von Daten zur Verteilung der Aussaatfläche einer Kollektivwirtschaft nach Weizenertrag.

Das arithmetische Mittel ist:

Berechnen wir die Varianz:

6.3. Berechnung der Varianz anhand einer Formel auf Basis individueller Daten

Berechnungstechnik Abweichungen komplex und bei großen Optionen- und Häufigkeitswerten kann es umständlich sein. Mithilfe der Eigenschaften der Dispersion können Berechnungen vereinfacht werden.

Die Dispersion hat die folgenden Eigenschaften.

1. Das Reduzieren oder Erhöhen der Gewichte (Frequenzen) einer variierenden Charakteristik um eine bestimmte Anzahl von Malen verändert die Streuung nicht.

2. Verringern oder erhöhen Sie jeden Wert eines Merkmals um denselben konstanten Betrag A verändert die Streuung nicht.

3. Verringern oder erhöhen Sie jeden Wert eines Merkmals um eine bestimmte Anzahl von Malen k verringert bzw. erhöht die Varianz in k 2 mal Standardabweichung  Zoll k einmal.

4. Die Streuung eines Merkmals relativ zu einem willkürlichen Wert ist immer größer als die Streuung relativ zum arithmetischen Mittel pro Quadrat der Differenz zwischen Durchschnitts- und willkürlichen Werten:

Wenn A 0, dann kommen wir zu folgender Gleichheit:

das heißt, die Varianz des Merkmals ist gleich der Differenz zwischen dem mittleren Quadrat der charakteristischen Werte und dem Quadrat des Mittelwerts.

Jede Eigenschaft kann einzeln oder in Kombination mit anderen zur Berechnung der Varianz verwendet werden.

Das Verfahren zur Berechnung der Varianz ist einfach:

1) bestimmen arithmetisches Mittel :

2) Quadrieren Sie das arithmetische Mittel:

3) Quadrieren Sie die Abweichung jeder Variante der Reihe:

X ich 2 .

4) Finden Sie die Quadratsumme der Optionen:

5) Teilen Sie die Summe der Quadrate der Optionen durch ihre Anzahl, d. h. bestimmen Sie das durchschnittliche Quadrat:

6) Bestimmen Sie die Differenz zwischen dem mittleren Quadrat des Merkmals und dem Quadrat des Mittelwerts:

Beispiel 3.1 Zur Arbeitsproduktivität liegen folgende Daten vor:

Lassen Sie uns die folgenden Berechnungen durchführen:

Auf dieser Seite wird ein Standardbeispiel zum Ermitteln der Varianz beschrieben. Sie können sich auch andere Probleme zum Ermitteln der Varianz ansehen

Beispiel 1. Bestimmung von Gruppe, Gruppendurchschnitt, Intergruppen- und Gesamtvarianz

Beispiel 2. Ermitteln der Varianz und des Variationskoeffizienten in einer Gruppierungstabelle

Beispiel 3. Varianz in einer diskreten Reihe ermitteln

Beispiel 4. Die folgenden Daten liegen für eine Gruppe von 20 Fernstudenten vor. Es ist notwendig, eine Intervallreihe der Verteilung des Merkmals zu erstellen, den Durchschnittswert des Merkmals zu berechnen und seine Streuung zu untersuchen

Lassen Sie uns eine Intervallgruppierung erstellen. Bestimmen wir den Bereich des Intervalls anhand der Formel:

wobei X max der Maximalwert des Gruppierungsmerkmals ist;
X min – Mindestwert des Gruppierungsmerkmals;
n – Anzahl der Intervalle:

Wir akzeptieren n=5. Der Schritt ist: h = (192 - 159)/ 5 = 6,6

Lassen Sie uns eine Intervallgruppierung erstellen

Für weitere Berechnungen erstellen wir eine Hilfstabelle:

X"i – die Mitte des Intervalls. (zum Beispiel die Mitte des Intervalls 159 – 165,6 = 162,3)

Wir ermitteln die durchschnittliche Körpergröße der Schüler anhand der gewichteten arithmetischen Durchschnittsformel:

Bestimmen wir die Varianz mit der Formel:

Die Formel lässt sich wie folgt umwandeln:

Aus dieser Formel folgt das Varianz ist gleich die Differenz zwischen dem Durchschnitt der Quadrate der Optionen und dem Quadrat und dem Durchschnitt.

Streuung in Variationsreihen mit gleichen Intervallen unter Verwendung der Momentenmethode kann auf folgende Weise unter Verwendung der zweiten Eigenschaft der Streuung berechnet werden (Dividieren aller Optionen durch den Wert des Intervalls). Varianz bestimmen, berechnet nach der Momentenmethode, ist die Verwendung der folgenden Formel weniger aufwendig:

wobei i der Wert des Intervalls ist;
A ist eine konventionelle Nullstelle, für die es zweckmäßig ist, die Mitte des Intervalls mit der höchsten Frequenz zu verwenden;
m1 ist das Quadrat des Moments erster Ordnung;
m2 - Moment zweiter Ordnung

Alternative Merkmalsvarianz (Ändert sich in einer statistischen Grundgesamtheit ein Merkmal so, dass es nur zwei sich gegenseitig ausschließende Optionen gibt, dann nennt man diese Variabilität alternativ) kann nach folgender Formel berechnet werden:

Wenn wir q = 1- p in diese Dispersionsformel einsetzen, erhalten wir:

Arten der Varianz

Gesamtvarianz misst die Variation eines Merkmals in der gesamten Population unter dem Einfluss aller Faktoren, die diese Variation verursachen. Sie entspricht dem mittleren Quadrat der Abweichungen einzelner Werte eines Merkmals x vom Gesamtmittelwert von x und kann als einfache Varianz oder gewichtete Varianz definiert werden.

Varianz innerhalb der Gruppe charakterisiert zufällige Variation, d.h. Teil der Variation, der auf den Einfluss nicht berücksichtigter Faktoren zurückzuführen ist und nicht von dem Faktorattribut abhängt, das die Grundlage der Gruppe bildet. Eine solche Streuung entspricht dem mittleren Quadrat der Abweichungen einzelner Werte des Attributs innerhalb der Gruppe X vom arithmetischen Mittel der Gruppe und kann als einfache Streuung oder als gewichtete Streuung berechnet werden.



Auf diese Weise, Varianzmaße innerhalb der Gruppe Variation eines Merkmals innerhalb einer Gruppe und wird durch die Formel bestimmt:

wobei xi der Gruppendurchschnitt ist;
ni ist die Anzahl der Einheiten in der Gruppe.

Beispielsweise zeigen gruppeninterne Varianzen, die bei der Untersuchung des Einflusses der Qualifikationen der Arbeitnehmer auf das Niveau der Arbeitsproduktivität in einer Werkstatt ermittelt werden müssen, Schwankungen im Output in jeder Gruppe, die durch alle möglichen Faktoren (technischer Zustand der Ausrüstung, Verfügbarkeit von ...) verursacht werden Werkzeuge und Materialien, Alter der Arbeiter, Arbeitsintensität usw.), mit Ausnahme von Unterschieden in der Qualifikationskategorie (innerhalb einer Gruppe haben alle Arbeiter die gleichen Qualifikationen).