Das Stata Starter Kit - eswf.uni-koeln.deeswf.uni-koeln.de/lehre/05/01/Statakit.pdf · Übersicht...

18
Das Stata Starter Kit Katrin Golsch Aktualisierte Fassung für Stata 8 Januar 2005 1. Die Stata Oberfläche 1.1 Die Stata Menüleiste 1.2 Die Stata Toolbar 1.3 Das Eingabefenster 1.4 Das Variablenfenster 1.5 Das Ergebnisfenster 1.6 Das Review-Fenster 1.7 Der Stata Editor und Browser 1.8 Grafikfenster 2. I log... 3. I do... 4. Die ersten Stata-Befehle 5. Elemente der Stata-Kommandos 5.1 Optionen 5.2 Operatoren 5.3 Funktionen 6. Interne Resultate 7. Variablennamen, -label, Wertelabel und Storage- Types 7.1 Variablennamen 7.2 Variablen- und Wertelabels 7.3 Storage Types 8. Where to go from here... 8.1 Stata Hilfe 8.2 Stata Tutorials im Internet 8.3 Literatur

Transcript of Das Stata Starter Kit - eswf.uni-koeln.deeswf.uni-koeln.de/lehre/05/01/Statakit.pdf · Übersicht...

Page 1: Das Stata Starter Kit - eswf.uni-koeln.deeswf.uni-koeln.de/lehre/05/01/Statakit.pdf · Übersicht ist es hilfreich für den Datensatz, Do- und Log-File einheitliche Namen zu vergeben,

Das Stata Starter Kit Katrin Golsch Aktualisierte Fassung für Stata 8 Januar 2005

1. Die Stata Oberfläche

1.1 Die Stata Menüleiste 1.2 Die Stata Toolbar 1.3 Das Eingabefenster 1.4 Das Variablenfenster 1.5 Das Ergebnisfenster 1.6 Das Review-Fenster 1.7 Der Stata Editor und Browser 1.8 Grafikfenster

2. I log...

3. I do...

4. Die ersten Stata-Befehle

5. Elemente der Stata-Kommandos

5.1 Optionen 5.2 Operatoren 5.3 Funktionen

6. Interne Resultate

7. Variablennamen, -label, Wertelabel und Storage-Types

7.1 Variablennamen 7.2 Variablen- und Wertelabels 7.3 Storage Types

8. Where to go from here...

8.1 Stata Hilfe 8.2 Stata Tutorials im Internet 8.3 Literatur

Page 2: Das Stata Starter Kit - eswf.uni-koeln.deeswf.uni-koeln.de/lehre/05/01/Statakit.pdf · Übersicht ist es hilfreich für den Datensatz, Do- und Log-File einheitliche Namen zu vergeben,

2

1. Die Stata Oberfläche

Nach dem Aufruf von Stata erscheint folgender Bildschirm.

Die Stata Oberfläche setzt sich aus einer Menüleiste, einer Toolbar, sowie vier weiteren Fenstern, dem Review-Fenster, dem Ergebnisfenster (Stata-Results), dem Variablenfenster und dem Eingabefenster (Stata Command) zusammen. Darüber hinaus gibt es den Stata Editor und Stata Browser, Log-Files, den Do-File Editor sowie Grafikfenster. Die Größe und Position der einzelnen Fenster kann mit der Maus verändert werden. Dazu führt man den Mauszeiger einfach an den Fensterrahmen, klickt die linke Maustaste sobald sich der Mauszeiger in einen Doppelpfeil verwandelt und zieht den Mauszeiger bei gedrückter Maustaste in die bestimmte Richtung. Die Fenster lassen sich weiterhin mit den Symbolen in der rechten oberen Ecke des jeweiligen Fensters schließen und minimieren. Geschlossene Fenster können über die Menüleiste (Window) wieder geöffnet werden. Hat man einmal eine ansprechende und nützliche Bildschirmansicht gefunden, sollte man diese als Voreinstellung speichern. Hierzu geht man in die Menüleiste unter Pref und dann zu Save Windowing Preferences. Die vorgenommenen Einstellungen werden übernommen und bei jedem weiteren Aufruf von Stata erscheint die gewünschte Bildschirmansicht. Mit Default Windowing kann man wieder zu der voreingestellten Bildschirmansicht zurückkehren.

1.1 Die Stata Menüleiste

Page 3: Das Stata Starter Kit - eswf.uni-koeln.deeswf.uni-koeln.de/lehre/05/01/Statakit.pdf · Übersicht ist es hilfreich für den Datensatz, Do- und Log-File einheitliche Namen zu vergeben,

3

Die Menüleiste setzt sich aus neun Pull-Down Menüs zusammen. Unter File können Datensätze geöffnet und gespeichert, Ergebnisse und Grafiken ausgedruckt, Do-Files an Stata zur Verarbeitung übergeben, und Stata beendet werden. Unter Edit kann kopiert und eingefügt, sowie Einstellungen für Tabellen und Grafiken verändert werden. Pref erlaubt es Einstellungen für den Ergebnisoutput, Tabellen und Grafiken zu verändern. Unter Window können einzelne Fenster geöffnet werden, Help bietet ein umfangreiches Hilfemenü. Die anderen Menüs erlauben es über Dialogfelder Daten zu verändern, Grafiken zu erstellen und Statistiken abzurufen.

1.2 Die Stata Toolbar

Die Stata Toolbar besteht aus zwölf Buttons. Mit ihrer Hilfe kann man

• einen Datensatz öffnen • den geöffneten Datensatz speichern • Grafiken oder Ausgabedateien (so genannte Log-Files) drucken • einen neuen Log-File öffnen bzw. einen geöffneten Log-File in den

Bildschirmvordergrund bringen • das Dialog-Fenster öffnen • das Ergebnisfenster in den Vordergrund holen • eine erstellte Grafik in den Bildschirmvordergrund holen • den Do-File Editor öffnen bzw. in den Vordergrund bringen • den Data Editor öffnen bzw. in den Vordergrund bringen • den Data Browser öffnen bzw. in den Vordergrund bringen • Unterbrechungen in der Ausgabe von Ergebnissen vermeiden • den laufenden Task abbrechen

1.3 Das Eingabefenster

In diesem Fenster können einzelne Befehle eingegeben und Stata zur Verarbeitung übergeben werden. Eingegebene Befehle werden durch drücken der Eingabetaste "abgeschickt". Um Befehle zu verändern oder alte Befehle neu aufzurufen können folgende Shortcuts verwendet werden:

Shortcuts Beschreibung

delete löscht das Zeichen rechts vom Kursor

backspace löscht das Zeichen links vom Kursor

Page 4: Das Stata Starter Kit - eswf.uni-koeln.deeswf.uni-koeln.de/lehre/05/01/Statakit.pdf · Übersicht ist es hilfreich für den Datensatz, Do- und Log-File einheitliche Namen zu vergeben,

4

Esc löscht die gesamte Befehlszeile

home bringt den Kursor zum Anfang der Zeile

end bringt den Kursor zum Ende der Zeile

Page Up bringt den vorangegangen Befehl zurück

Page Down blättert vor zum nächsten Befehl

Strg + Pause bricht den laufenden Befehl ab und stellt den vorhergenden Datensatz wieder her

1.4 Das Variablenfenster

Das Variablenfenster zeigt eine Liste aller Variablen im geöffneten Datensatz und ihre Labels. Ein einmaliges Klicken auf einen Variablennamen kopiert diesen in das Eingabefenster.

1.5 Das Ergebnisfenster

Übergibt man Stata Befehle zur Verarbeitung erscheinen alle Ergebnisse in diesem Fenster. Übernimmt man die Standardeinstellungen so werden alle Befehle in weiß, Fehlermeldungen in rot, alle Rückmeldungen von Stata (Anzahl der geänderten Fälle, Fehlerbezeichnungen) in blau, und alle Ergebnisoutputs in grün/gelb wiedergegeben.

Page 5: Das Stata Starter Kit - eswf.uni-koeln.deeswf.uni-koeln.de/lehre/05/01/Statakit.pdf · Übersicht ist es hilfreich für den Datensatz, Do- und Log-File einheitliche Namen zu vergeben,

5

1.6 Das Review-fenster

Das Review-Fenster zeigt alle bisher verwendeten Befehle. Ein einmaliges Klicken auf einen Befehl kopiert diesen in das Eingabefenster, ein Doppelklick kopiert diesen und führt ihn dann automatisch aus.

1.7 Der Stata Editor und Browser

Ruft man den Stata Editor auf erscheint eine Datenmatrix. In den Spalten stehen die Variablen des geöffneten Datensatzes und in den Zeilen werden die entsprechenden Ausprägungen für alle Beobachtungen wiedergegeben. In diesem Editor können die Daten (Variablen, einzelne Ausprägungen oder Fälle) verändert werden. Möchte man nur einen Blick in die Datenmatrix werfen, so sollte man den Stata Browser aufrufen. Es erscheint die gleiche Datenmatrix wie im Stata Editor, ein Verändern der Daten ist jedoch nicht möglich.

Page 6: Das Stata Starter Kit - eswf.uni-koeln.deeswf.uni-koeln.de/lehre/05/01/Statakit.pdf · Übersicht ist es hilfreich für den Datensatz, Do- und Log-File einheitliche Namen zu vergeben,

6

1.8 Grafikfenster

Für jede neue Grafik öffnet Stata automatisch ein neues Grafikfenster. Grafiken werden nicht in Log-Files gespeichert. Grafiken können einfach kopiert (STRG+C) und bspw. in Word wieder eingefügt werden (STRG+V).

Page 7: Das Stata Starter Kit - eswf.uni-koeln.deeswf.uni-koeln.de/lehre/05/01/Statakit.pdf · Übersicht ist es hilfreich für den Datensatz, Do- und Log-File einheitliche Namen zu vergeben,

7

2. I log...

Stata protokolliert zwar alle Befehle und Ergebnisse im Ergebnisfenster, der Inhalt dieses Fensters kann jedoch nicht gespeichert werden. Das Ergebnisfenster zeigt nur die letzten Befehle einer Stata-Sitzung. Wünschenswert wäre jedoch, ein genaues Protokoll jeder Stata-Sitzung zu erstellen.

In Stata werden mit Hilfe der so genannten Log-Files verwendete Befehle, Fehlermeldungen, Ergebnisse etc. protokolliert. Dabei ist es möglich eine genaue Auswahl der aufzuzeichnenden Befehle/Outputs zu bestimmen:

Befehle zum Arbeiten mit Log-Files

Befehl Beschreibung

log using filename

beginnt ein neuen Log-File

log using filename, append

hängt neue Ergebnisse an einen bereits vorhandenen Log-File an

Page 8: Das Stata Starter Kit - eswf.uni-koeln.deeswf.uni-koeln.de/lehre/05/01/Statakit.pdf · Übersicht ist es hilfreich für den Datensatz, Do- und Log-File einheitliche Namen zu vergeben,

8

log using filename, replace

überschreibt einen bereits vorhandenen Log-File

log close schließt einen geöffneten Log-File

log off / log on

das Protokoll kann vorübergehend unterbrochen und dann wieder aufgenommen werden ohne den Log-File zu schließen

cmdlog using filename

schreibt nur die Befehle in den Log-File

cmdlog off / cmdlog on

das Protokoll kann vorübergehend unterbrochen und dann wieder aufgenommen werden ohne den Log-File zu schließen

set logtype definiert das Format in dem Log-Files gespeichert werden sollen: SMCL (Stata Markup and Control Language= =Standardeinstellung) oder Text (ASCII). Der Befehl translate erlaubt es, SMCL logs in ASCII Text oder andere Formate zu konvertieren

Für die Präsentation der Ergebnisse in Word-Dokumenten etc. kann man die entsprechende Tabelle im Log-File kopieren (STRG+C) und in Excel einfügen (STRG+V). In Stata werden die Spalten durch Leerzeichen getrennt und die kopierten Daten können daher in Excel einfach in eine Tabelle umgeschrieben werden (dazu die Daten markieren und im Menü Daten die Funktion Text in Spalten wählen. Unter Format/Zellen können darüber hinaus Koeffizienten gerundet werden.). Alternativ kann man auch die Tabelle im Stata Log-File markieren, dann die rechte Maustaste drücken und „Copy Table“ auswählen. Mit STRG+C wird dann die Tabelle in Excel eingefügt.

3. I do...

Syntax-Dateien werden in Stata Do-Files genannt. Hier kann man eine Liste verschiedener Befehle erstellen und diese in einem Schritt Stata zur Verarbeitung übergeben. Dies stellt sicher, dass man auch später die gleichen Ergebnisse reproduzieren kann. Weiterhin hat man die Möglichkeit, Kommentare einzufügen, um später die einzelnen Schritte besser nachvollziehen zu können. Da in Do-Files eine Reihe von verschiedenen Befehlen eingegeben werden können, muss jeder einzelne Befehl abgeschlossen werden. Dies kann entweder mit einem Zeilenwechsel (dazu drückt man einfach einmal die Entertaste) oder einem Semikolon erfolgen.

Befehle zum Arbeiten mit Do-Files

Befehl Beschreibung

Page 9: Das Stata Starter Kit - eswf.uni-koeln.deeswf.uni-koeln.de/lehre/05/01/Statakit.pdf · Übersicht ist es hilfreich für den Datensatz, Do- und Log-File einheitliche Namen zu vergeben,

9

doedit startet den Stata-Do-File-Editor

do filename führt einen Do-File aus

run filename führt einen Do-File aus, die Ergebnisse werden jedoch nicht im Ergebnisfenster mitprotokolliert

#review zeigt die letzten fünf Befehle. Durch Angabe einer Zahl kann spezifiziert werden, wie viele Befehle aufgelistet werden sollen (max. 100)

#delimit ; definiert das Semikolon als Befehlsende. Befehle können dann über mehrere Zeilen eines Do-Files fortgesetzt werden und werden mit einem Semikolon abgeschlossen

#delimit cr definiert als Befehlsende wieder den Zeilenumbruch (Standardeinstellung in Stata)

* leitet eine Kommentarzeile ein.

/* leitet einen Kommentar innerhalb einer Zeile ein

*/ beendet einen Kommentar innerhalb einer Zeile

Es empfiehlt sich, Do-Files immer nach einem gleichen Schema aufzubauen. Wichtig ist, genau zu beschreiben, welche Daten verwendet werden, wie sie verändert werden und warum, unter welchem Namen sie gespeichert und wie die Ergebnisse protokolliert werden. Zur besseren Übersicht ist es hilfreich für den Datensatz, Do- und Log-File einheitliche Namen zu vergeben, die sich nur durch ihre Extension (.dta, .do, .log) unterscheiden. Eine einheitliche Maske könnte bspw. so aussehen:

Page 10: Das Stata Starter Kit - eswf.uni-koeln.deeswf.uni-koeln.de/lehre/05/01/Statakit.pdf · Übersicht ist es hilfreich für den Datensatz, Do- und Log-File einheitliche Namen zu vergeben,

10

4. Die ersten Stata-Befehle

Befehle wie auch Variablennamen können in Stata abgekürzt werden. Wie einzelne Befehle abgekürzt werden können wird bspw. in der Stata-Hilfe ersichtlich: Befehle werden in blauen und schwarzen Buchstaben dargestellt, wobei die blauen Buchstaben Stata zur Erkennung eines Befehls genügen. Bei Variablennamen ist es wichtig, auf die Groß- und Kleinschreibung zu achten.

Datensätze laden, betrachten & speichern

Befehl Beschreibung

use filename Datensätze werden geladen

describe varname

erstellt eine Datensatzbeschreibung

codebook erstellt eine Datensatzbeschreibung (genauer als describe)

lookfor string sucht nach Variablen, in deren Namen oder Labels der Suchbegriff vorkommt

list varname zeigt eine Liste des Datensatzes, einzelne Variablen und Fälle können ausgewählt werden

preserve speichert den geöffneten Datensatz, jetzt kann problemlos mit anderen Datensätzen gearbeitet werden

restore der zuvor geöffnete und mit preserve gespeicherte Datensatz wird wieder hergestellt

save filename speichert den geöffneten Datensatz

save filename, replace

überschreibt den bereits vorhandenen Datensatz

clear löscht die Datenmatrix

erase filename

löscht eine Datei

exit beendet die Stata-Sitzung

Überblick: Daten verändern und beschreiben

Befehl Beschreibung

summarize varname

gibt zusammenfassende Maßzahlen: arithmetisches Mittel, Fallzahl, Standardabweichung, kleinster und größter Wert

summarize varname , detail

gibt zusätzlich Perzentile (das erste und dritte Quartil, Median)

Page 11: Das Stata Starter Kit - eswf.uni-koeln.deeswf.uni-koeln.de/lehre/05/01/Statakit.pdf · Übersicht ist es hilfreich für den Datensatz, Do- und Log-File einheitliche Namen zu vergeben,

11

tabulate varname

erstellt eine eindimensionale Häufigkeitstabelle

tabulate varname1 varname2

erstellt eine zweidimensionale Häufigkeitstabelle, wobei die Ausprägungen von varname1 in den Zeilen, die von varname2 in den Spalten abgetragen werden

generate newvar = expression

erzeugt eine neue Variable

replace oldvar = expression

verändert Variablen

sort varname der Datensatz wird nach der spezifizierten Variable sortiert

drop varname

Variablen werden gelöscht

mvencode varlist, mv(#)

alle missings der spezifizierten Variablen werden zu #

mvdecode varlist, mv(#)

der Wert # der spezifizierten Variablen wird zu missing

Weitere Befehle

Befehl Beschreibung

pwd zeigt aktuelles Arbeitsverzeichnis an

cd\ zurück zum Verzeichnis C:

cd directory name

wechselt in ein anderes Verzeichnis

dir zeigt den Inhalt des aktuellen Verzeichnisses

dir *.dat zeigt alle im aktuellen Verzeichnis abgelegten Dateien mit der Extension ".dat"

mkdir erstellt ein neues Verzeichnis

Dateiextensionen

Befehl Beschreibung

filename.dta für Datensätze

filename.do für Do-Files

filename.smcl für Log-Files (Stata Markup and Control Language)

Page 12: Das Stata Starter Kit - eswf.uni-koeln.deeswf.uni-koeln.de/lehre/05/01/Statakit.pdf · Übersicht ist es hilfreich für den Datensatz, Do- und Log-File einheitliche Namen zu vergeben,

12

filename.txt für Log-Files (ASCII)

filename.log für Log-Files

filename.gph für Grafiken

5. Elemente der Stata-Kommandos

Stata-Kommandos können durch verschiedene Befehls-Präfixe, Gewichtungsanweisungen, Ausdrücke, Funktionen und Optionen erweitert werden. Möchte man sich bspw. die zusammenfassenden Maßzahlen einer Variablen ausgeben lassen, so kann der Befehl summarize weiter spezifiziert werden:

[by varlist :] summarize varlist [weight] [if expression] [in range] [, detail ] Der Befehl tabulate kann bspw. so erweitert werden: [by varlist :] tabulate varname1 varname2 [weight] [if expression] [in range], missing nofreq nolabel

Welche Optionen etc. für die verschiedenen Befehle zulässig sind, kann der Stata-Hilfe entnommen werden. Hier eine Liste einiger wichtiger Befehlserweiterungen:

Befehl Beschreibung

by varlist :

der nachfolgende Befehl wird für alle Kategorien bzw. Kombinationen der Kategorien der varlist wiederholt. Zuvor muss der Datensatz nach den Variablen der varlist sortiert werden. Dieser Befehls-Präfix kann bspw. in Kombination mit summarize, generate oder tabulate benutzt werden.

for varlist varlist: tabulate varname X

der Stata-Befehl wird nacheinander für alle in der varlist genannten Variablen durchgeführt. Dabei ist X der entsprechende Platzhalter für die Variablen der forlist. Dieser Befehl ist zwar veraltet, funktioniert aber noch. Ein neuer, umfangreicherer Befehl ist foreach, der hier jedoch nicht weiter ausgeführt wird.

[weight]

Stata unterscheidet vier Typen von Gewichtungsvariablen: Frequency Weights, Analytic Weights, Sampling Weights und Importance Weights. Sie werden durch folgende Befehlserweiterung angefordert: fweight = varname aweight = varname pweight = varname iweight = varname

Page 13: Das Stata Starter Kit - eswf.uni-koeln.deeswf.uni-koeln.de/lehre/05/01/Statakit.pdf · Übersicht ist es hilfreich für den Datensatz, Do- und Log-File einheitliche Namen zu vergeben,

13

if expression

der voranstehende Befehl wird nur für diejenigen Fälle ausgeführt, für die der nachstehende Ausdruck wahr ist. Hier können die verschiedensten Operatoren und Funktionen zur Fallselektion verwendet werden.

in range

der voranstehende Befehl wird nur für diejenigen Fälle eines Datensatzes ausgeführt, die zu dem spezifizierten Fallbereich zählen. Mit in 50 kann man bspw. den Befehl nur für den 50. Fall, mit in 50/100 für den 50. bis 100. Fall ausführen.

5.1 Optionen

Optionen stehen stets nach dem Befehl und werden von diesem mit einem Komma getrennt. Je nach Befehl stehen unterschiedliche Optionen zur Verfügung. Hier einige wichtige Beispiele:

Option Beschreibung

summarize varname, detail

detail ist eine Option des Befehls summarize. Sie gibt zusätzlich Perzentile (das erste und dritte Quartil, Median) der spezifizierten Variablen an.

tabulate varname, missing

Missings werden wie alle anderen Ausprägungen einer Variablen bei der Berechnung von Häufigkeiten und Prozenten berücksichtigt

tabulate varname, nolabel

unterdrückt die Wertelabels

tabulate varname1 varname2, nofreq column row

unterdrückt die Ausgabe von Häufigkeiten und gibt stattdessen die Spalten- und Zeilenprozente

5.2 Operatoren

In Stata werden folgende Operatoren verwendet:

Arithemtic Beschreibung

+ addition

- subtraction

* Multiplication

/ division

Page 14: Das Stata Starter Kit - eswf.uni-koeln.deeswf.uni-koeln.de/lehre/05/01/Statakit.pdf · Übersicht ist es hilfreich für den Datensatz, Do- und Log-File einheitliche Namen zu vergeben,

14

^ power

Logical Beschreibung

~ oder ! not

| or

& and

Relational Beschreibung

> greater than

< less than

>= greater or equal

<= lower or equal

= = equal

~ = oder !=

not equal

5.3 Funktionen

Mit help functions kann man eine Liste aller Funktionen, die in Stata zur Verfügung stehen, aufrufen. Hier einige Beispiele:

Funktion Beschreibung

abs(x) absolute value

sqrt(x) square root

ln(x) natural logarithm

exp(x) Exponentiation

6. Interne Resultate

In vielen Fällen ist das Ergebnis einer ersten Analyse wichtig für weitere Analysen. So benötigt man bspw. den Mittelwert einer Variablen um sie in einem zweiten Schritt zu zentrieren (d.h. man zieht von jeder Ausprägung einer Variablen ihren Mittelwert ab). Stata speichert die Ergebnisse solcher "Statistik-Kommandos" als interne Resultate. So produziert der Befehl summarize automatisch folgende interne Resultate, die für weitere Berechungen verwendet werden können.

Page 15: Das Stata Starter Kit - eswf.uni-koeln.deeswf.uni-koeln.de/lehre/05/01/Statakit.pdf · Übersicht ist es hilfreich für den Datensatz, Do- und Log-File einheitliche Namen zu vergeben,

15

Beschreibung

r(N) Fallzahl

r(sum_w) Summe der Gewichtung

r(mean) Arithmetisches Mittel

r(Var) Varianz

R(std) Standardabweichung

r(min) Minimum

r(max) Maximum

r(sum) Summe

Stata speichert interne Resultate nicht nur für solche 'beschreibenden' Auswertungen, sondern auch nach Modellanalysen, wie bspw. nach Regressionen. Diese werden dann als e( ) gespeichert. Mit dem Befehl return list bzw. ereturn list kann man sich einen Überblick über die erzeugten internen Resultate verschaffen.

7. Variablennamen, -label, Wertelabel und Storage-Types

7.1 Variablennamen

In Stata 8 können auch mehr als acht Zeichen für Variablennamen verwendet werden. Zulässige Zeichen sind Buchstaben, Zahlen und der Unterstrich. Groß- und Kleinbuchstaben werden jedoch unterschieden und einige Zeichen, wie bspw. +, -, (), sind nicht erlaubt. Variablennamen können abgekürzt werden so lange sie immer noch eindeutig im Datensatz identifiziert werden können. Weiterhin können Variablenlisten vereinfacht werden: so kann man bspw. gleichzeitig auf eine Gruppe von Variablen, die mit einem gleichen Anfangsbuchstaben beginnen, durch Verwendung des Platzhalters * verweisen. Möchte man einen Befehl auf eine Reihe von Variablen anwenden, die im Datensatz hintereinander stehen, so kann man - statt alle Variablen einzeln aufzulisten - lediglich die erste und letzte Variable benennen und diese mit einem Bindestrich verbinden

7.2 Variablen- und Wertelabels Befehl Beschreibung

label data "label" weist dem geöffneten Datensatz einen Label zu

label define lblname # "label" [# "label" ...] [, add modify]

definiert Wertelabels für einzelne Ausprägungen. Die Labels werden gespeichert und müssen dann Variablen zugewiesen werden. Somit werden einzelne Labels nur einmalig definiert (z.B.

Page 16: Das Stata Starter Kit - eswf.uni-koeln.deeswf.uni-koeln.de/lehre/05/01/Statakit.pdf · Übersicht ist es hilfreich für den Datensatz, Do- und Log-File einheitliche Namen zu vergeben,

16

"yesno" mit 'yes'=1 und 'no'=2) und können dann jeder Variablen mit diesen Ausprägungen zugewiesen werden. Mit der Option add können weitere Wertelabels einem bereits gespeicherten Label zugefügt werden. Modify ermöglicht das Verändern oder Löschen bereits gespeicherter Wertelabels. Neue Wertelabels können hinzugefügt werden.

label dir zeigt eine Liste aller vergebenen Wertelabels

label drop {lblname [lblname ...] | _all}

löscht Wertelabels. Mit der Option _all werden alle vorhanden Wertelabels gelöscht

label list [lblname [lblname ...]]

zeigt eine Liste aller vergebenen Wertelabels und ihren Inhalt

label values varname [lblname]

weist einer Variablen einen bestimmten Wertelabel zu

label variable varname ["label"]

weist einer Variablen einen Label zu

7.3 Storage-Types

Stata unterscheidet zwei Typen von Variablen: alphanumerische (Strings) und numerische (Reals). Alphanumerische Variablen bestehen aus Buchstaben und sonstigen Zeichen. Numerische Variablen sind Zahlen. Mit help datatypes kann man sich die verfügbaren Storage-Types für beide Variablentypen anzeigen lassen:

Numeric Storage Type

Bytes Minimum Maximum Closest to 0 without being 0

byte 1 -127 100 +/-1

int 2 -32,767 32,740 +/-1

long 4 -2,147,483,647 2,147,483,620 +/-1

float 4 -1.70141173319 *10^38

1.70141173319 *10^36

+/-10^-36

double 8 -8.9884656743 *10^307

8.9884656743 *10^308

+/-10^-323

String Storage Type Bytes Maximum Length

str1 1 1

str2 2 2

str80 80 80

Page 17: Das Stata Starter Kit - eswf.uni-koeln.deeswf.uni-koeln.de/lehre/05/01/Statakit.pdf · Übersicht ist es hilfreich für den Datensatz, Do- und Log-File einheitliche Namen zu vergeben,

17

Storage-Types unterscheiden sich in der Speicherplatzmenge, die sie benötigen. So nimmt eine Variable des Storage-Types "byte" genau ein Byte, ein Variable des Speichertypes "double" genau acht Byte Speicherplatz ein. Erstellt man neue Variablen so können die Storage-Types direkt im Befehl generate angeben werden:

generate byte newvar = expression

Verzichtet man auf die Angabe des Storage-Types so wird die neue Variable automatisch als Float-Variable gespeichert. Mit dem Befehl compress kann der Datensatz hinsichtlich der benötigten Speicherplatzmenge optimiert werden. Für Variablen die weniger Speicherplatz benötigen wird der Storage-Typ automatisch geändert. Verändert man Variablen mit dem Befehl replace, so werden Storage-Types ebenfalls automatisch angepasst. Strings werden in Anführungszeichen gesetzt. In einer String-Variable des Types str16 können bis zu 16 Zeichen gespeichert werden. String-Variablen können in Stata leicht in numerische Variablen umgewandelt werden und umgekehrt:

encode varname [if exp] [in range], generate (newvar) [label(name)] decode varname [if exp] [in range], generate (newvar) [maxlength(#)]

Encode erstellt eine neue Variable newvar basierend auf der String-Variable. Decode wandelt eine numerische Variable in eine String-Variable um.

8. Where to go from here...

8.1 Stata Hilfe

Mit search any_word_or_phrase kann man nach einem Befehl suchen. Den Befehl help any_stata_command verwendet man, wenn man den benötigten Befehl für eine bestimmte Rechenoperation etc. kennt, sich aber noch mal die genaue Befehlsstruktur ansehen möchte. Help contents ruft das Hilfemenü auf und erlaubt es thematisch nach einem Befehl zu suchen.

8.2 Stata Tutorials im Internet

• Stata Tutorials: http://www.ats.ucla.edu/stat/stata/sk/ • Stata learning modules: http://www.ats.ucla.edu/stat/stata/modules • Stata Capabilities: http://www.stata.com/capabilities/ • Stata Textbook examples: http://www.ats.ucla.edu/stat/examples

Der Befehl search examples gibt eine Liste aller im Internet abrufbaren Tutorials, Learning Modules, Capabilities und Textbook examples.

Page 18: Das Stata Starter Kit - eswf.uni-koeln.deeswf.uni-koeln.de/lehre/05/01/Statakit.pdf · Übersicht ist es hilfreich für den Datensatz, Do- und Log-File einheitliche Namen zu vergeben,

18

8.3 Literatur

U. Kohler / F. Kreuter (2001): Datenanalyse mit Stata. Allgemeine Konzepte der Datenanalyse und ihre praktische Anwendung. München / Wien: Oldenbourg

Stata Corporation (1999): Getting started with Stata for Windows. College Station, Stata Press.

Stata Corporation (1999): Stata User's Guide. College Station, Stata Press.

Stata Corporation (1999): Stata Reference Manual, Release 6, Volume 1-4.College Station, Stata Press.

© Katrin Golsch (golsch(at)wiso.uni-koeln.de), Januar 2005