Zusammenfassung
Für Datenanalysen, die über wenige Teilschritte hinausgehen, ist die interaktive Arbeitsweise, in der sich eingegebene Befehle mit dem von R erzeugten Output auf der Konsole abwechseln, meist nicht sinnvoll. Stattdessen lässt sich die Auswertung automatisieren, indem alle Befehle zunächst zeilenweise in eine als Skript bezeichnete Textdatei geschrieben werden, die dann ihrerseits von R komplett oder in Teilen ausgeführt wird. Analoges gilt für die Verwaltung empirischer Daten: gewöhnlich werden diese nicht von Hand auf der Konsole eingegeben, sondern in separaten Dateien gespeichert – sei es in R, in Programmen zur Tabellenkalkulation oder in anderen Statistikpaketen.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Notes
- 1.
Natürlich können auch andere Texteditoren zum Erstellen einer Skript-Datei verwendet werden. Nur manchen von ihnen stehen aber auch die Funktionen zum zeilenweisen Ausführen der Befehle zur Verfügung, vgl. Abschn. 1.1.1.
- 2.
Wird das einzulesende Skript nicht gefunden, ist zunächst mit dir() zu prüfen, ob das von R durchsuchte Verzeichnis (ohne Pfadangabe das mit getwd() angezeigte Arbeitsverzeichnis) auch tatsächlich das Skript enthält. Es ist nicht notwendig, R im interaktiven Modus zu starten, um ein Befehlsskript ausführen zu lassen, dafür ist auch der sog. Batch-Modus ausreichend: befindet man sich unter Windows in der Eingabeaufforderung im Verzeichnis mit der ausführbaren Datei Rterm.exe, lautet dazu der Befehl Rterm.exe –no-restore –no-save ↘ → < 〈R–Skriptdatei〉.r > 〈Ausgabedatei〉.txt.
- 3.
Da R mit shell() auch auf Funktionen des Betriebssystems zugreifen kann, sollten aus Sicherheitsgründen nur geprüfte Skripte aus vertrauenswürdiger Quelle ausgeführt werden.
- 4.
Werden die einzulesenden Daten von R nicht gefunden, ist zunächst mit dir() zu prüfen, ob das von R durchsuchte Verzeichnis (ohne Pfadangabe das mit getwd() angezeigte Arbeitsverzeichnis) auch jenes ist, das die Datei enthält.
- 5.
Statt einer Datei akzeptieren die meisten Funktionen für das Argument file allgemein eine sog. Connection, bei der es sich etwa auch um die Verbindung zu einem Vektor von Zeichenketten handeln kann, vgl. ?textConnection und ?connections.
- 6.
Auf diese Weise können bei Microsoft Excel-Versionen älter als Office 2007 maximal 256 Spalten exportiert werden. Darüber hinaus ist der Transfer von Datumsangaben mit dieser Methode fehlerträchtig.
- 7.
Sofern dies nicht in den Ländereinstellungen der Windows Systemsteuerung geändert wurde.
- 8.
Für einen detaillierten Vergleich der Arbeit mit R, SAS und SPSS vgl. Muenchen (2008), in dem auch der Datenaustausch zwischen den Programmen behandelt wird.
- 9.
Die Funktion spss.get() aus dem Paket Hmisc verwendet read.spss() mit geeigneteren Voreinstellungen, verbessert außerdem den Import von Datumsangaben und Variablen-Labels.
- 10.
Diese Möglichkeit setzt voraus, dass ein ODBC-Treiber unter Windows installiert ist.
References
Muenchen, R. A. (2008). R for SAS and SPSS Users. New York, NY: Springer, URL http://RforSASandSPSSusers.com/
Ripley, B. D. (2001). Using Databases with R. R News, 1 (1), 18–20. URL http://CRAN. R-project.org/doc/Rnews/
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
Copyright information
© 2010 Springer-Verlag Berlin Heidelberg
About this chapter
Cite this chapter
Wollschläger, D. (2010). Befehle und Daten verwalten. In: Grundlagen der Datenanalyse mit R. Statistik und ihre Anwendungen. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-12228-6_4
Download citation
DOI: https://doi.org/10.1007/978-3-642-12228-6_4
Published:
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-642-12227-9
Online ISBN: 978-3-642-12228-6
eBook Packages: Life Science and Basic Disciplines (German Language)