Das relativ vielseitige Datenformat Statas ermöglicht es, die Scientific Use Files (SUFs) des NEPS mit einfachen Mitteln um zusätzliche Informationen anzureichern. Um diese angereicherten Informationen für die Nutzer möglichst einfach darstellbar zu machen, stellt das Forschungsdatenzentrum ein Paket mit Zusatzprogrammen für Stata („ado Dateien“) zu Verfügung.
Mehrsprachige Datensätze
Die vom FDZ zu Verfügung gestellten Datensätze stehen mit mehrsprachigen (derzeit: deutschen und englischen) Werte- und Variablenlabels zu Verfügung. Stata-Nutzer können über Statas label language Kommando unmittelbar im Deratensatz umgestellt werden.
. label language
Language for variable and value labels
Available languages:
de
en
Currently set is: . label language de
To select different language: . label language <name>
(more output omitted)
. label language en
Daten-Signaturen
Bei der Veröffentlichung wird für jeden Stata-Datensatz eine Signatur erzeugt, die im Datensatz gespeichert wird. Stata-Nutzer können mit dem Stata-Kommando datasignature confirm prüfen, ob der Datensatz seit der Veröffentlichung modifiziert wurde:
. datasignature confirm
(data unchanged since 05aug2013 15:52)
NEPStools
Wie bereits erwähnt stellt das FDZ einige Stata-Programme als Stata-Paket zu Verfügung.
Installation und Update
Das Paket kann über Statas internen Installationsmechanismus installiert werden:
. net install nepstools, from(http://nocrypt.neps-data.de/stata)
Ein Update sollte von Zeit zu Zeit durchgeführt werden, weil das Programmpaket regelmäßig aktualisiert wird:
adoupdate nepstools , update
Sollte Ihnen Statas regulärer Installationsmechanismus nicht zu Verfügung stehen, können Sie das Paket alternativ manuell als ZIP-Datei herunterladen.
Es ist zu empfehlen, diese Seite und die für jedes zu Verfügung gestellte Programm vorhandenen Stata-Hilfeseite vor der Benutzung aufmerksam zu lesen („help <Programm>“),
neps: – Präfix-Befehl zum bequemen Umgang mit NEPS-SUF-Datensätzen
Dieses Programm vereinfacht den Umgang von NEPS-SUF-Datensätzen, indem es dem Nutzer das Zusammensetzten des Dateinamens aus seinen Bestandteilen (Startkohorte, Versionsnummer, Zugangsweg) abnimmt. Die entsprechenden Parameter können dabei entweder direkt als Option beim Aufruf angegeben werden, oder zur Widerverwendung über den Hilfsbefehl 'neps set'.
Die Stata-Syntax
. use "/Pfad/zur/Datei/SC6_pTarget_D_12-1-0.dta"
. * ... beliebige Analysebefehle ...*
. use "/Pfad/zur/Datei/SC6_Methods_D_12-1-0.dta" , clear
. * ... weitere Analysebefehle ...*
kann somit im Idealfall abgekürzt werden zu:
. neps set study SC6
. neps set level D
. neps set version 12.1.0
. neps : use "pTarget"
. * ... beliebige Analysebefehle ...*
. neps : use "Methods" , clear
. * ... weitere Analysebefehle ...*
Details zur Verwendung enthält die mitgelieferte Stata-Hilfeseite.
nepsmiss – Rekodierung von fehlenden Werten
Dieses Programm rekodiert die in NEPS-SUFs standardmäßig numerisch ausgelieferten Fehlwerte (-97, -98, etc.) in Statas „Extended Missings“ (.a, .b, etc.). Im Gegensatz zu Statas internen Kommandos mvencode und mvdecode werden auch Wertelabels korrekt umgeschrieben, und eine Standardliste mit den NEPS-Fehlwerten ist bereits vordefiniert.
. nepsmiss t731454
Recoded 9450 values in total
Dieser Prozess kann mit der Option reverse rückgängig gemacht werden:
. nepsmiss t731454 , reverse
Recoded 9450 values in total
Es ist zu empfehlen, nach der Aufbereitung der Daten und vor Beginn einer Analyse im Arbeitsdatensatz alle Missings mit nepsmiss umzukodieren (nepsmiss _all).
Beispieldatensatz vor und nach der Anwendung von nepsmiss:
ID_t |
wave |
t731454 |
8010851 |
2 |
-97 |
8012254 |
1 |
-54 |
8002388 |
2 |
-98 |
8012254 |
2 |
5 |
8002388 |
1 |
1 |
|
ID_t |
wave |
t731454 |
8010851 |
2 |
.b |
8012254 |
1 |
.c |
8002388 |
2 |
.a |
8012254 |
2 |
5 |
8002388 |
1 |
1 |
|
infoquery – Darstellung angereicherter Metadaten
Wie Sie möglicherweise bereits wissen, werden NEPS SUFs mit erweiterten Metadaten angereichert. Sie sind in Stata-Datensätzen als characteristics gespeichert. Das Programm infoquery ist dafür gedacht, diese Attribute unmittelbar in Statas Dialogmodus anzuzeigen.
. label language en
. infoquery t514001
---------------------------------------------------------------------------
query result for variable t514001:
t514001[NEPS_instname]:
zufrie1
t514001[NEPS_sufname]:
t514001
t514001[NEPS_questiontext_en]:
[ITEMBAT] I would like to begin by asking you a few questions about how
satisfied you are with various aspects of your life. Please answer using a
scale of 0 to 10 „0“ means that you are totally and utterly dissatisfied;
„10“ means that you are entirely satisfied. You can indicate your opinion
using the numbers „1“ to „9“.
t514001[NEPS_variablequestion_en]:
How satisfied are you currently with your life in general?
---------------------------------------------------------------------------
charren – Umbennenung von Variablen zu ihren Instrument-Variablennamen
Im Zuge der Datenaufbereitung für die NEPS-SUFs werden die ursprünglich im jeweiligen Befragungsinstrument verwendeten Variablennamen in SUF-Variablennamen umbenannt. Möglicherweise kann es aber – insbesondere für Datennutzer, die bspw. als NEPS-Mitarbeiter bereits an die ursprünglichen Namen gewöhnt sind – wünschenswert sein, diesen Aufbereitungsschritt rückgängig zu machen. Das Programm charren ermöglicht dies auf möglichst schnellem Wege auf Basis der in den Stata-Datensätzen gespeicherten Metadaten.
. charren t514001 , to(NEPS_instname) verbose
Info: will rename t514001 to zufrie1
Dabei ist auch eine Rückwärtssuche möglich: Selbst wenn dem Anwender nur ein Instrumentname bekannt ist, wird das Programm zuverlässig die entsprechende SUF-Variable identifizieren und sie entsprechend umbenennen.
. charren zufrie1 , to(NEPS_instname) verbose
Info: zufrie1 is not a variable name in current dataset; searching for
zufrie1 in specified search space
Info: will rename t514001 to zufrie1