Skip to main content

Quantifizierende Analyse von elektronischen Bücher- und Textdatenbanken als Zugang zur Soziologiegeschichte

  • Living reference work entry
  • First Online:
  • 150 Accesses

Part of the book series: Springer Reference Sozialwissenschaften ((SRS))

Zusammenfassung

Digitale bzw. digitalisierte geistes- und sozialwissenschaftliche Bücher und Fachzeitschriften sind wichtige Quellen für die Soziologiegeschichte. In diesem Beitrag werden verschiedene Online-Datenbanken vorgestellt. Zur exemplarischen Veranschaulichung der mit ihnen verbundenen Möglichkeiten und Grenzen wird dabei in quantifizierender Analyse der Frage nachgegangen, ob der ‚Soziologie‘-Begriff sowie verwandte Begriffe wie ‚Sozialwissenschaften‘ in der Zeit des Nationalsozialismus systematisch aus dem öffentlichen Buch- und Zeitschriftendiskurs verschwanden bzw. unterrepräsentiert waren. Das Ergebnis ist eindeutig: Soziologische und sozialwissenschaftliche Fachbezeichnungen sind während des Nationalsozialismus (im Vergleich zu anderen Zeiten und anderen politischen Systemen) systematisch unterrepräsentiert und werden nicht durch alternative Begriffe substituiert.

This is a preview of subscription content, log in via an institution.

Notes

  1. 1.

    Andere Definitionen (als die über die Autorenschaft in soziologischen Monographien und Zeitschriften) legen beispielsweise Denominationen und Fachbezeichnungen in akademischen Personalverzeichnissen und Nachschlagewerken, Mitgliedschaften in sozialwissenschaftlichen Vereinen, wie der Deutschen Gesellschaft für Soziologie (Kaesler 1984), Selbstbeschreibungen und Peer-Urteile als Auswahlkriterium zugrunde (siehe ausführlich Fleck 2007; Holzhauser 2015).

  2. 2.

    Prinzipiell wird dabei davon ausgegangen, dass sich in den jeweiligen Datenmaterialien Querverweise über Zitationen zur je anderen Datensorte finden. Zum Beispiel, wenn Zeitschriftenaufsätze in Monographien referiert, zitiert und im Literaturverzeichnis gelistet werden und umgekehrt.

  3. 3.

    Einführungen in die Nutzung der Datenbanken finden sich auf den Internetseiten der jeweiligen Anbieter.

  4. 4.

    Dieser Unterschied in der Zusammensetzung kann etwa, hier illustriert für die Google Books Ngrams Datenbank, bei der Analyse von sprachlicher Suppression zur Zeit des Nationalsozialismus eine Rolle spielen. Wenn beispielsweise ‚deutschsprachige‘ Texte in einer Datenbank enthalten sind, dann auch die im ausländischen Exil verfassten deutschsprachigen Veröffentlichungen, wie sie sich in heutigen amerikanischen Exil-Bibliotheken und auch wieder in deutschen Bibliotheken befinden. Dies hat zur Folge, dass durch die nicht ortsgebundene, sondern sprachliche Datenzusammensetzung Suppressionseffekte in der Analyse weniger stark ausfallen, als sie tatsächlich waren. Auch können nicht enthaltene Literaturquellen, wie heute verschollene oder verbotene Nazi-Veröffentlichungen, durch ihren retrospektiven Ausschluss bzw. ihre Abwesenheit möglicherweise bestimmte Verfälschungen für die Ergebnisse bedeuten. Diese Effekte sind aufgrund ihres geringen Umfangs m. E. weitestgehend unproblematisch, man sollte sich solcher Materialprobleme jedoch bewusst sein.

  5. 5.

    Hier kann leider keine detaillierte Einführung in die Datenerhebung bzw. Datenextraktion großer Datenmengen (Verarbeitung über die einfache Nutzung der Oberfläche hinaus) als solche gegeben werden.

  6. 6.

    www.scopus.com. Zugegriffen am 06.06.2016.

  7. 7.

    www.wokinfo.com. Zugegriffen am 06.06.2016.

  8. 8.

    Auch kann durch reine kontextfreie Worthäufigkeitsanalysen nicht geklärt werden, ob ein Wort nur benutzt wird, um sich von ihm abzugrenzen, oder ob es gar etwas ganz Anderes meint. Beispielsweise wissen wir ohne Berücksichtigung des Kontextes nicht, ob mit dem Wort ‚Geiger‘ Theodor Geiger gemeint ist, eine andere Person mit diesem Namen, oder z. B. einfach nur ein Violinist. Diese methodologische Problematik kann hier nicht weiter vertieft werden.

  9. 9.

    Scholar.google.de.

  10. 10.

    Das Wort ‚Sociologie‘ wurde als französischer, in den ersten Jahren in Deutschland verwendeter Ursprungsbegriff aufgenommen, die Wörter ‚Sozialwissenschaft‘ und ‚Sozialwissenschaften‘ wurden aufgenommen, da diese in den frühen Jahren der deutschsprachigen Soziologie, anders als heute, nicht allgemeiner zu verstehen waren als ‚Soziologie‘, sondern als Unterkategorien von der allgemeinen Soziologie, d. h. als die einzelnen Sozialwissenschaften verstanden wurden. Die Adjektive wurden exemplarisch gewählt, um grammatische Effekte auszuschließen. Später im Text werden weitere Alternativbegriffe analysiert.

  11. 11.

    books.google.com/ngrams.

  12. 12.

    www.hathitrust.org.

  13. 13.

    Ein 1gram ist ein Wort bzw. eine ununterbrochene Zeichenkette, ein 2gram eine Zeichenkette bestehend aus zwei durch ein Leerzeichen getrennte Zeichenketten usw. Die maximal recherchierbare Zeichenkettenfolgen sind 5grams (Beispiel eines 5grams: Handbuch der Geschichte der Soziologie).

  14. 14.

    Hier (in den Abb. 7 und 8) relativiert an der Gesamtzahl der Seiten je Jahr im Gegensatz zur Relativierung anhand der Gesamtzahl der Bücher in Abb. 6.

  15. 15.

    Auf die Relativierung anhand der Ngrams wird hier bewusst verzichtet, da diese aufgrund der Datenstruktur bestimmte methodische Probleme bei der Interpretation verursachen können, die an anderer Stelle ausführlich methodisch diskutiert werden müssen, hier jedoch zu weit führen würden.

  16. 16.

    Dies hat eine offene Begriffssuche gezeigt, bei der alle (sic!) 1grams aus der Ngrams Datenbank extrahiert wurden, die die Zeichenfolge „soziologie“ enthalten (Veröffentlichung in Vorbereitung).

Literatur

  • Baneyx, Audrey. 2008. „Publish or Perish“ as citation metrics used to analyze scientific output in the humanities: International case studies in economics, geography, social sciences, philosophy, and history. Archivum Immunologiae et Therapiae Experimentalis 56(6): 363–371.

    Article  Google Scholar 

  • Bar-Ilan, Judit. 2010. Citations to the „Introduction to informetrics“ indexed by WOS, Scopus and Google Scholar. Scientometrics 82(3): 495–506.

    Article  Google Scholar 

  • Christenson, Heather. 2011. HathiTrust: A research library at web scale. Library Resources & Technical Services 55(2): 93–102.

    Article  Google Scholar 

  • Duden. 2016. Die häufigsten Wörter in deutschsprachigen Texten. http://www.duden.de/sprachwissen/sprachratgeber/die-haeufigsten-woerter-in-deutschsprachigen-texten. Zugegriffen am 06.06.2016.

  • Etxebarria, Goio, und Mikel Gomez-Uranga. 2010. Use of Scopus and Google Scholar to measure social sciences production in four major Spanish universities. Scientometrics 82(2): 333–349.

    Article  Google Scholar 

  • Fleck, Christian. 2007. Transatlantische Bereicherungen. Zur Erfindung der empirischen Sozialforschung. Frankfurt am Main: Suhrkamp.

    Google Scholar 

  • Geiger, Theodor. 1931. Soziologie. In Handwörterbuch der Soziologie, Hrsg. Alfred von Vierkand, 568–578. Stuttgart: Ferdinand Enke.

    Google Scholar 

  • Haddow, Gaby, und Paul Genoni. 2010. Citation analysis and peer ranking of Australian social science journals. Scientometrics 85(2): 471–487.

    Article  Google Scholar 

  • Harzing, Anne-Wil. 2013. Document categories in the ISI Web of Knowledge: Misunderstanding the Social Sciences? Scientometrics 94(1): 23–34.

    Article  Google Scholar 

  • HathiTrust. 2016. HathiTrust Languages. https://www.hathitrust.org/visualizations_languages. Zugegriffen am 06.06.2016.

  • Holzhauser, Nicole. 2014. Zur Geschlechterungleichheit soziologischer Berufsbezeichnungen im deutschsprachigen Buchdiskurs des 20. Jahrhunderts – eine Culturomics-Analyse. GENDER 6(1): 127–137.

    Google Scholar 

  • Holzhauser, Nicole. 2015. Definitorische und methodologische Probleme bei der Analyse der soziologischen Disziplinentwicklung zur Zeit des Nationalsozialismus. Österreichische Zeitschrift für Soziologie 40(2): 129–146.

    Article  Google Scholar 

  • Kaesler, Dirk. 1984. Die frühe deutsche Soziologie 1909 bis 1934 und ihre Entstehungs-Milieus. Eine wissenschaftssoziologische Untersuchung. Opladen: Westdeutscher Verlag.

    Book  Google Scholar 

  • Klingemann, Carsten. 1981. Heimatsoziologie oder Ordnungsinstrument? Fachgeschichtliche Aspekte der Soziologie in Deutschland zwischen 1933 und 1945. In Soziologie in Deutschland und Österreich 1918–1945. Materialien zur Entwicklung, Emigration und Wirkungsgeschichte, Sonderheft 23, Kölner Zeitschrift für Soziologie und Sozialpsychologie, Hrsg. M. von Rainer Lepsius, 273–307. Opladen: Westdeutscher Verlag.

    Google Scholar 

  • Lepsius, M. Rainer. 1979. Die Entwicklung der Soziologie nach dem Zweiten Weltkrieg 1945 bis 1967. In Deutsche Soziologie seit 1945. Entwicklungslinien und Praxisbezug, Sonderheft 21, Kölner Zeitschrift für Soziologie und Sozialpsychologie, Hrsg. Günther von Lüschen, 25–70. Opladen: Westdeutscher Verlag.

    Google Scholar 

  • Lin, Yuri, Jean-Baptiste Michel, und Erez Lieberman Aiden et al. 2012. Syntactic Annotations for the Google Books Ngram Corpus. In Proceedings of the 50th annual meeting oft he association for computational linguistics, Jeju Republic of Korea, 8–14. July, 169–174.

    Google Scholar 

  • Mayr, Philipp, und Anne-Kathrin Walter. 2006. Abdeckung und Aktualität des Suchdienstes Google Scholar. Information. Wissenschaft & Praxis 57(3): 133–140.

    Google Scholar 

  • Michel, Jean-Baptiste, Yuan Kui Shen, Erez Aiden, et al. 2011. Quantitative analysis of culture using millions of digitized books. Science 331(6014): 176–182.

    Article  Google Scholar 

  • Mongeon, Philippe, und Adèle Paul-Hus. 2016. The journal coverage of web of science and scopus: A comparative analysis. Scientometrics 106(1): 213–228.

    Article  Google Scholar 

  • Pechenick, Eitan Adam, Christopher M. Danforth, und Peter Sheridan Dodds. 2015. Characterizing the google books corpus: Strong limits to inferences of socio-cultural and linguistic evolution. PLOS One 10(10): 1–24.

    Article  Google Scholar 

  • Proesler, Hans. 1931. Literatur zur Soziologie. Nürnberg: Hochschulbuchhandel Krische.

    Google Scholar 

  • Schnitzler, Sonja. 2012. Soziologie im Nationalsozialismus zwischen Wissenschaft und Politik. Elisabeth Pfeil und das ‚Archiv für Bevölkerungswissenschaft und Bevölkerungspolitik‘. Wiesbaden: VS Verlag.

    Book  Google Scholar 

  • Spinella, Michael P. 2008. JSTOR and the changing digital landscape. Interlending & Document Supply 36(2): 79–85.

    Article  Google Scholar 

  • Stölting, Erhard. 1986. Akademische Soziologie in der Weimarer Republik. Berlin: Duncker & Humblot.

    Google Scholar 

  • Wouters, Paul und Rodrigo Costas. 2012. Users, narcissism and control – tracking the impact of scholarly publications in the 21st century. In SURF Foundation. Utrecht: Stichting SURF.

    Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Nicole Holzhauser .

Editor information

Editors and Affiliations

Rights and permissions

Reprints and permissions

Copyright information

© 2016 Springer Fachmedien Wiesbaden

About this entry

Cite this entry

Holzhauser, N. (2016). Quantifizierende Analyse von elektronischen Bücher- und Textdatenbanken als Zugang zur Soziologiegeschichte. In: Moebius, S., Ploder, A. (eds) Handbuch Geschichte der deutschsprachigen Soziologie. Springer Reference Sozialwissenschaften. Springer VS, Wiesbaden. https://doi.org/10.1007/978-3-658-07999-4_17-1

Download citation

  • DOI: https://doi.org/10.1007/978-3-658-07999-4_17-1

  • Received:

  • Accepted:

  • Published:

  • Publisher Name: Springer VS, Wiesbaden

  • Online ISBN: 978-3-658-07999-4

  • eBook Packages: Springer Referenz Sozialwissenschaften und Recht

Publish with us

Policies and ethics