Kapitel 2 Grundbegriffe und Datenerhebung

Lesen Sie hierzu bitte Kapitel 3.1.2 und 3.1.3 von Zimmermann-Janschitz (2014). Im Folgenden finden Sie Leitfragen und Ergänzungen zu diesen Kapiteln.

2.1 Statistische Grundbegriffe

Die statistische Masse umfasst all jene Elemente (Anzahl \(N\)), die für eine statistische Untersuchung Relevanz besitzen. Für die Bestimmung der statistischen Masse sind inhaltliche, zeitliche und räumliche Abgrenzungskriterien erforderlich. Alternative Begriffe sind (die geläufigsten fett gedruckt): statistische Grundmenge, Grundgesamtheit, Population, Kollektiv. Beispiele finden Sie in Zimmermann-Janschitz (2014), Kapitel 3.1.3.

Die statistische Einheit \(e_i\) mit \(i=1, \ldots, n\) stellt das Untersuchungselement und somit die kleinste Einheit in einer statistischen Untersuchung dar. Diese statistische Einheit trägt jene Information (auch als Merkmal \(X\) bezeichnet), die im Zentrum der statistischen Untersuchung steht. Alternative Begriffe sind, je nach Kontext: Untersuchungseinheit, Proband, Merkmalsträger. Siehe Zimmermann-Janschitz (2014), Kapitel 3.1.3 für Beispiele.

Jene Eigenschaft eines Untersuchungselements, die für die statistische Untersuchung von Bedeutung ist, wird als Merkmal \(X\) des Elements bezeichnet. Eine statistische Einheit weist mindestens ein Merkmal auf, kann aber ebenso durch mehrere Merkmale gekennzeichnet sein. Alternative Begriffe sind: Variable, Indikator. Beispiele finden Sie wiederum in Zimmermann-Janschitz (2014), Kapitel 3.1.3.

Die Merkmalsausprägungen \(a_j\) mit \(j=1, \ldots, m\) eines Merkmals \(X\) umfassen jene Manifestationen, die ein Merkmal im Rahmen einer statistischen Untersuchung annehmen kann. Alternative Begriffe sind: Merkmalskategorien, Modalitäten. Z.B. kann das Merkmal Schneedeckenhöhe Werte von null (kein Schnee vorhanden) bis zu mehreren Metern einnehmen.

Der Merkmalswert \(x_i\) mit \(i=1, \ldots, n\) schließlich ist jener Wert, den ein Merkmal \(X\) in einer statistischen Untersuchung tatsächlich annimmt. Alternative Begriffe sind: Beobachtungswert, Datum (Plural: Daten). Beispiel: Tatsächliche Schneedeckenmessung an einem Punkt von 285,5cm.

2.2 Datenerhebung

Leitfragen zu Zimmermann-Janschitz (2014), Kapitel 3.1.2:

  • Was ist der Unterschied zwischen Primärdaten und Sekundärdaten?
  • Was sind die Vor- und Nachteile?
  • Was sind Metadaten?
  • Wozu sind sie wichtig?
  • Was ist der Unterschied zwischen Gesamterhebung und Teilerhebung?

Zur Primärdatenerhebung hören Sie mehr im Seminar Einführung in die Geographie. An dieser Stelle aber noch ein paar Worte zur Auswahl einer Stichprobe aus einer Grundgesamtheit. Aus statistischer Perspektive sind dabei prinzipiell drei Aspekte zu beachten:

  1. Repräsentativität: Eine Stichprobe sollte die Variabilität der Grundgesamtheit möglichst genau abbilden, z.B. bezüglich Demographien oder räumlicher Unterschiede.
  2. Zufälligkeit: Jede Merkmalsausprägung der Grundgesamtheit sollte die gleiche “Chance” haben ausgewählt zu werden. In der Praxis ist dies oft nur näherungsweise möglich.
  3. Stichprobenumfang: Eine Stichprobe sollte ausreichend groß sein. Mehr dazu in der schließenden Statistik (Kapitel 8 - 10).

2.3 Skalenniveaus

Die Skalenniveaus von Daten bestimmen den Informationsgehalt der Daten und damit das Analyse- und Interpretationspotenzial. In der Reihenfolge Nominalskala - Ordinalskala - metrische Skalen werden jeweils zusätzliche mathematische Operationen erschlossen (s. Zimmermann-Janschitz 2014, Tabelle 3.8, S. 79).

Qualitative, klassifikatorische Merkmale befinden sich auf der Nominalskala. Die Kategorien können verbale Bezeichnungen oder Zahlencodes sein (Achtung: Die Zahl ist in dem Fall ein Code und keine natürliche Zahl mit der gerechnet werden kann.) Die zulässige mathematische Operation ist der Vergleich, d.h. Merkmalswerte von statistischen Einheiten sind entweder gleich oder verschieden. Beispiel: Art des Vulkanausbruchs (Tabelle 2.1). Obwohl \(1+2=3\) ist, ist Lava plus Gestein nicht gleich Gas!

Tabelle 2.1: Art des Vulkanausbruchs.
Lava Gestein Gas Asche
1 2 3 4

Qualitative, komparative Merkmale (Rangmerkmale) finden Sie auf der Ordinalskala. Wieder können die Kategorien verbale Bezeichnungen sein oder mittels Zahlen codiert. Die zulässigen mathematischen Operationen sind der Vergleich sowie Wertung/Reihung/Ordnung. Es sind keine Aussagen über Distanz oder Ähnlichkeit benachbarter Merkmalsausprägungen möglich. Beispiel: Komfort der Unterkunft (Tabelle 2.2). Der Komfort eines ***Hotels ist größer als der Komfort eines *Hotels, aber nicht unbedingt 3x so groß!

Tabelle 2.2: Komfort der Unterkunft.
Jugendherberge *Hotel **Hotel ***Hotel
0 1 2 3

Quantitative Merkmale befinden sich auf metrischen Skalen. Sie werden mit reellen Zahlen bezeichnet. Die zulässigen mathematischen Operationen sind der Vergleich, Wertung/Reihung/Ordnung sowie Addition/Subtraktion und im Falle der Rationalskala auch Multiplikation/Division. Die Unterscheidung Intervallskala und Rationalskala (Verhältnisskala) ist für uns nicht so wichtig. Intervallskalen fehlt ein natürlicher Nullpunkt und daher ist die Berechnung von Relationen nicht möglich. Sie kann aber auf einen Referenznullpunkt umgerechnet werden, wodurch Multiplikation und Division möglich werden. Wenn wir also in diesem Kurs von einer metrischen Skala sprechen dann sind die mathematischen Operationen Vergleich, Wertung/Reihung/Ordnung, Addition/Subtraktion und Multiplikation/Division alle zulässig.

Literatur

Zimmermann-Janschitz, S. 2014. Statistik in Der Geographie. Berlin: Springer Spektrum.