Skip to main content

Sequenzanalyse

  • Chapter
  • First Online:
Neue Trends in den Sozialwissenschaften

Zusammenfassung

Dieses Kapitel gibt eine Einführung in die Sequenzanalyse. Diese ursprünglich für die Analyse der DNA entwickelte Methode findet seit einiger Zeit vor allem in der soziologischen Lebensverlaufsforschung eine breite Anwendung, aber auch andere sozialwissenschaftliche Teilbereiche können von den Möglichkeiten, die die Methode für die Analyse von Transitionen aufeinander folgender Zustände bietet profitieren. Zunächst wird in dem Kapitel die für Sequenzanalysen benötigte Datenstruktur diskutiert bevor die einzelnen Schritte des Vorgehens detailliert besprochen werden. Beispiele aus unterschiedlichen sozialwissenschaftlichen Disziplinen zeigen den Raum an Möglichkeiten, den die Sequenzanalyse bietet.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 29.99
Price excludes VAT (USA)
  • Available as EPUB and PDF
  • Read on any device
  • Instant download
  • Own it forever
Softcover Book
USD 39.99
Price excludes VAT (USA)
  • Compact, lightweight edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Notes

  1. 1.

    Bereits Mitte der 1980er Jahre hatte Abbott sequenzanalytisches Vorgehen für die Analyse von sozialen Prozessen in die Geschichtswissenschaft eingeführt (Abbott 1983, 1984). Daneben wurden Sequenzanalysen von ihm auch schon in gänzlich anderen Themengebieten eingesetzt, z. B. bei der Analyse der Schrittfolgen von irischen Volkstänzen (Abbott und Forrest 1986) oder der Entwicklung der sozialwissenschaftlichen Fachsprache (Abbott und Barman 1997).

  2. 2.

    Genauer zur Ereignisanalyse siehe Box-Steffensmeier und Jones (2004), Jäckle (2015), Mills (2011) und Yamaguchi (1991).

  3. 3.

    Bei der Frage welche Karrierepfade ins Bundesverfassungsgericht nach Karlsruhe führen dürfte es beispielsweise irrelevant sein, ob, und wenn ja, für welchen Zeitraum eine Person Mitglied in einem Sportverein war. Ein Zustand „Mitglied in Fußballverein“ wäre entsprechend bei dieser Fragestellung nicht zielführend. Für die Frage der sozialen Integration benachteiligter Jugendlicher hingegen könnte es durchaus Sinn ergeben einen solchen Zustand zu codieren.

  4. 4.

    Die Sequenzen werden rückwärts gemessen ab dem Zeitpunkt der Ernennung zum Bundesverfassungsrichter. Der Code a02 stünde demnach für das vorletzte Jahr vor Amtsbeginn.

  5. 5.

    Fasang und Liao (2014) schlagen mit dem sogenannten relative frequency sequence plot, eine weitere Form der Darstellung für Sequenzen vor. Hierbei werden 1) die Sequenzen anhand eines sinnvollen Kriteriums geordnet (z. B. dem Zeitpunkt eines relevanten Events, wie der Heirat), 2) der Datensatz in k gleichgroße Teile unterteilt, 3) für jede dieser Teilgruppen die Medoid-Sequenz bestimmt, und 4) die ausgewählten repräsentativen Sequenzen als regulärer Sequenzplot (Sequenzindexplot) gezeichnet . Zusätzlich können anhand von Boxplots die Verteilungen der Sequenzen innerhalb jeder der k Gruppen betrachtet werden und anhand eines R2 und F-Tests bestimmt werden, wie stark der relative frequency sequence plot von den drei a priori zu treffenden Entscheidungen (welches Sortierungskriterium? welches Distanzmaß zur Identifikation der Medoid-Sequenzen? und wie viele Teilguppen k?) abhängt.

  6. 6.

    Neben den Vorteilen, die die idealtypische Betrachtungsweise bei der Darstellung von theoretisch wie empirisch abgeleiteten Sequenztypologien bietet, weisen Martin und Wiggins (2011, S. 397) v. a. darauf hin, dass idealtypische Sequenzen auch eine große Hilfe bei der Erstellung empirischer Klassifikationen selbst darstellen können. Da die für die Klassifikation in der Regel genutzten agglomerativen Clusterverfahren dafür bekannt sind, vor allem bei Vorliegen von Ties in der Distanzmatrix uneinheitliche Ergebnisse zu liefern (vgl. Kap. Clusteranalyse), kann es eine Option sein, zunächst auf Basis einer Teilpopulation mehrere Clusteranalysen durchzuführen. Aus diesen lassen sich dann in einem weiteren Schritt idealtypische Sequenzen extrahieren und das Gesamtsample dann mit diesen vergleichen. Beispiele für ein solches Vorgehen finden sich bei Martin et al. (2008) sowie Stovel und Bolan (2004).

  7. 7.

    Da die Länge der Sequenzen beim OM nicht verändert werden soll, muss auf ein Einfügen (Insertion) zwangsläufig an anderer Stelle ein Löschen (Deletion) folgen.

  8. 8.

    Neben der weiter oben bereits erwähnten dynamischen Hamming Distanz gibt es noch weitere Ansätze, die versuchen, die Probleme mit der zeitlichen Komponente in sozialwissenschaftlichen Sequenzen anzugehen. Halpin (2010) beispielsweise schlägt mit dem OMv-Algorithmus ein Verfahren vor, bei dem die Ersetzungs - und Indel-Kosten umso niedriger angesetzt werden, je länger der Spell ist, in dem ein Zustand geändert werden soll. Auf diese Weise würde beispielsweise eine Transition der Sequenz A-A-A-A-B zu A-A-A-B-B als weniger kostspielig gesehen als eine von A-B-C-C-C zu B-B-C-C-C, da der Spell aus dem heraus die Ersetzung erfolgt im ersten Fall aus vier A besteht, wohingegen er im zweiten Fall aus nur einem A besteht. Daneben hat Elzinga (Elzinga 2003, 2005) ein ganz auf Ersetzungen und Indel-Operationen verzichtendes kombinatorisches Verfahren der Distanzberechnung vorgeschlagen, das die Zahl der in den beiden zu vergleichenden Sequenzen vorkommenden Subsequenzen ins Verhältnis zur Zahl aller Subsequenz en einer Sequenz setzt (Martin und Wiggins 2011, S. 400–402). Weitere Alternativen zum klassischen Optimal Matching, die allesamt ein spezifisch anderes Verständnis von Ähnlichkeit zwischen Sequenzen aufweisen, werden von Halpin (2014a) diskutiert.

  9. 9.

    Zu einem ähnlichen Ergebnis kommen Barban und Billari (2012, S. 773), die in ihrer sowohl auf realen Lebensverlaufdaten als auch auf Simulationen aufbauenden Studie zeigen, dass Optimal Matching mit konstanten Kosten und die Levenshtein II Distanz (= Längste gemeinsame Subsequenz ) praktisch identische Ergebnisse liefern – deutlich abweichend sind hingegen die Clusterlösungen, die auf der Hamming-Distanz aufbauen.

  10. 10.

    Primär werden die administrativen, juristischen und politischen Karrierezustände nach dem Level des föderalen Systems in Positionen auf der Bundes-, Landes-, und unterhalb der Landesebene aufgegliedert (vgl. Jäckle 2016, S. 35).

  11. 11.

    Gauthier et al. (2010, S. 6, 7) beschreiben zwei weitere Möglichkeiten, multidimensionale Sequenzen im Zusammenhang mit Sequenzanalysen zu berücksichtigen. So könnte man die Ergebnisse einer über eine Dimension durchgeführten Sequenzanalyse als abhängige Variable in einem logistischen Regressionsmodel über Indikatoren anderer Sequenzdimensionen zu erklären versuchen. Auch wäre es möglich, die Ergebnisse von getrennten, über die verschiedenen Dimensionen durchgeführten Sequenzanalysen a posteriori in distinkten Typen zu bündeln. Gauthier und Kollegen sehen bei beiden Ansätzen allerdings gravierende Nachteile.

  12. 12.

    Ohne diese abnehmende Funktion, d. h. mit entweder identischen Kosten oder einer linearen Abnahme der Kosten, würden die vergleichsweise seltenen Lynchmorde als Rauschen in den Daten untergehen (Martin und Wiggins 2011, S. 403).

  13. 13.

    Genauer zu diesem für Netzwerkdaten geeigneten Verfahren zur Aufdeckung struktureller Ähnlichkeiten s. Scott (2000, S. 131–142).

  14. 14.

    Eine weitere Option stellt das als Freeware zur Verfügung stehende Programm TDA (Transitional Data Analysis) von Rohwer und Poetter (2005) dar. Es ist allerdings schon etwas veraltet und bietet keine gute Möglichkeit, die für die Sequenzanalyse so immanent wichtigen Grafiken zu erstellen.

  15. 15.

    Installation über ssc install sadi.

  16. 16.

    Konkret kann man mit SADI neben den klassischen OM und Hamming Distanzen auch die OMv-Distanz, Hollister’s OM-Variante, die dynamische Hamming Distanz, die Time-Warp-Edit Distanz und eine Version des von Elzinga vorgeschlagenen Verfahrens über die Anzahl der längsten gemeinsamen Subsequenzen (Halpin 2015).

Literatur

  • Aassve, A., F. Billari, und R. Piccarreta. 2007. Strings of adulthood: A sequence analysis of young British women’s work-family trajectories. European Journal of Population 23 (3–4): 369–388.

    Article  Google Scholar 

  • Abbott, A. 1983. Sequences of social events: Concepts and methods for the analysis of order in social processes. Historical Methods 16 (4): 129–147.

    Article  Google Scholar 

  • Abbott, A. 1984. Event sequence and event duration: Colligation and measurement. Historical Methods 17 (4): 192–204.

    Article  Google Scholar 

  • Abbott, A., und E. Barman. 1997. Sequence comparison via alignment and Gibbs sampling. Sociological Methodology 27 (1): 47–87.

    Article  Google Scholar 

  • Abbott, A., und J. Forrest. 1986. Optimal matching methods for historical sequences. Journal of Interdisciplinary History 16 (3): 471–494.

    Article  Google Scholar 

  • Abbott, A., und A. Hrycak. 1990. Measuring resemblance in sequence data: An optimal matching analysis of musicians’ careers. American Journal of Sociology 96 (1): 144–185.

    Article  Google Scholar 

  • Aisenbrey, S. 2000. Optimal matching analyse: Anwendungen in den Sozialwissenschaften. Opladen: Leske + Budrich.

    Book  Google Scholar 

  • Aisenbrey, Silke, und Anette E. Fasang. 2010. New life for old ideas: The ‚Second Wave‘ of sequence analysis bringing the ‚Course‘ back into the life course. Sociological Methods & Research 38 (3): 420–462. doi:10.1177/0049124109357532.

    Article  Google Scholar 

  • Barban, N., und F. C. Billari. 2012. Classifying life course trajectories: A comparison of latent class and sequence analysis. Journal of the Royal Statistical Society: Series C 61 (5): 756–784.

    Google Scholar 

  • Becker, Howard Saul. 1963. Outsiders: Studies in the sociology of deviance. New York: Free Press.

    Google Scholar 

  • Billari, F. C. 2001. Sequence analysis in demographic research. Canadian Studies in Population 28 (2): 439–458.

    Google Scholar 

  • Bison, Ivano. 2014. Sequence as network: An attempt to apply network analysis to sequence analysis. In Advances in sequence analysis: Theory, method, applications, Hrsg. Philippe Blanchard, Felix Bühlmann, und Jacques-Antoine Gauthier, 231–248. Cham: Springer.

    Google Scholar 

  • Blair-Loy, M. 1999. Career patterns of executive women in finance: An optimal matching analysis. American Journal of Sociology 104 (5): 1346–1397.

    Article  Google Scholar 

  • Blanchard, Philippe. 2011. Sequence analysis for political science. Paper präsentiert auf dem APSA Annual Metting, 2011. Seattle. https://papers.ssrn.com/sol3/papers.cfm?abstract_id=1902086.

  • Blanchard, Philippe, Felix Bühlmann, und Jacques-Antoine Gauthier, Hrsg. 2014. Advances in sequence analysis: Theory, method, applications. Cham: Springer.

    Google Scholar 

  • Box-Steffensmeier, Janet M., und Bradford S. Jones. 2004. Event history modeling: A guide for social scientists. Cambridge: Cambridge University Press.

    Book  Google Scholar 

  • Brzinsky-Fay, Christian, und Ulrich Kohler. 2010. New developments in sequence analysis. Sociological Methods & Research 38 (3): 359–364.

    Article  Google Scholar 

  • Brzinsky-Fay, Christian, Ulrich Kohler, und Magdalena Luniak. 2006. Sequence analysis with Stata. Stata Journal 6 (4): 435–460.

    Google Scholar 

  • Cornwell, Benjamin. 2015. Social sequence analysis: Methods and applications. Structural Analysis in the Social Sciences, Bd. 37. New York: Cambridge University Press.

    Google Scholar 

  • Elzinga, Cees H. 2003. Sequence similarity: A non-aligning technique. Sociological Methods and Research 32 (1): 3–29.

    Article  Google Scholar 

  • Elzinga, Cees H. 2005. Combinatorial representations of token sequences. Journal of Classification 22 (1): 87–118. doi:10.1007/s00357-005-0007-6.

    Article  Google Scholar 

  • Elzinga, Cees H., und A. C. Liefbroer. 2007. De-standardization of family-life trajectories of young adults: A cross-national comparison using sequence analysis. European Journal of Population/Revue européenne de Démographie 23 (3–4): 225–250.

    Article  Google Scholar 

  • Fasang, Anette E., und T. F. Liao. 2014. Visualizing sequences in the social sciences: Relative frequency sequence plots. Sociological Methods & Research 43 (4): 643–676. doi:10.1177/0049124113506563.

    Article  Google Scholar 

  • Gabadinho, Alexis, Gilbert Ritschard, Matthias Studer, und Nicolas S. Müller. 2010. Indice de complexité pour le tri et la comparaison de séquences catégorielles. Extraction et gestion des connaissances, Revue des nouvelles technologies de l’information RNTI E-19:61–66.

    Google Scholar 

  • Gabadinho, Alexis, Gilbert Ritschard, Nicolas S. Müller, und Matthias Studer. 2011a. Analyzing and visualizing state sequences in R with TraMineR. Journal of Statistical Software 40 (4): 1–37.

    Article  Google Scholar 

  • Gabadinho, Alexis, Gilbert Ritschard, Matthias Studer, und Nicolas S. Müller. 2011b. Mining sequence data in R with TraMineR package: A user’s guide. University of Geneva. http://mephisto.unige.ch/traminer/.

  • Gauthier, Jacques-Antoine, Eric D. Widmer, Philipp Bucher, und Cédric Notredame. 2010. Multichannel sequence analysis applied to social science data. Sociological Methodology 40 (1): 1–38. doi:10.1111/j.1467-9531.2010.01227.x.

    Article  Google Scholar 

  • Gauthier, Jacques-Antoine, Felix Bühlmann, und Philippe Blanchard. 2014. Introduction: Sequence analysis in 2014. In Advances in sequence analysis, Hrsg. Jacques-Antoine Gauthier, Felix Bühlmann, und Philippe Blanchard, 1–17. New York: Springer.

    Google Scholar 

  • Halpin, Brendan. 2010. Optimal matching analysis and life-course data: The importance of duration. Sociological Methods & Research 38 (3): 365–388.

    Article  Google Scholar 

  • Halpin, Brendan. 2014a. Three narratives of sequence analysis. In Advances in sequence analysis: Theory, method, applications, Hrsg. Philippe Blanchard, Felix Bühlmann, und Jacques-Antoine Gauthier, 75–103. Cham: Springer.

    Google Scholar 

  • Halpin, Brendan. 2014b. SADI: Stata tools for sequence analysis. Gehalten auf der Stata User Group, London, September 11. http://teaching.sociology.ul.ie/seqanal/sadilondon.pdf.

  • Halpin, Brendan. 2015. SADI: Module to compute sequence analysis distance measures. Boston. http://teaching.sociology.ul.ie/seqanal/.

  • Halpin, Brendan, und Tak Wing Chan. 1998. Class careers as sequences: An optimal matching analysis of work-life histories. European Sociological Review 14 (2): 111–130.

    Article  Google Scholar 

  • Jäckle, Sebastian. 2015. Event-history-analyse. In Methodologie, Methoden, Forschungsdesign, Hrsg. Achim Hildebrandt, Sebastian Jäckle, Frieder Wolf, und Andreas Heindl, 163–189. Wiesbaden: Springer Fachmedien.

    Google Scholar 

  • Jäckle, Sebastian. 2016. Pathways to Karlsruhe: A sequence analysis of the careers of German Federal Constitutional Court judges. German Politics 25 (1): 25–53.

    Article  Google Scholar 

  • Lesnard, Laurent. 2005. SeqComp – Une extension Stata pour la comparaison de séquences. http://laurent.lesnard.free.fr/article.php3?id_article=7.

  • Lesnard, Laurent. 2010. Setting cost in optimal matching to uncover contemporaneous socio-temporal patterns. Sociological Methods & Research 38 (3): 389–419. doi:10.1177/0049124110362526.

    Article  Google Scholar 

  • Lesnard, Laurent. 2014. Using optimal matching analysis in sociology: Cost setting and sociology of time. In Advances in sequence analysis: Theory, method, applications, Hrsg. Philippe Blanchard, Felix Bühlmann, und Jacques-Antoine Gauthier, 39–50. New York: Springer.

    Google Scholar 

  • MacIndoe, Heather, und Andrew Abbott. 2004. Handbook of data analysis. In Sequence analysis and optimal matching techniques for social science data, Hrsg. M. Hardy and A. Bryman, 387–406. Thousand Oaks: Sage.

    Google Scholar 

  • Madero-Cabib, Ignacio, und Anette Eva Fasang. 2016. Gendered work-family life courses and financial well-being in retirement. Advances in Life Course Research 27 (März): 43–60. doi:10.1016/j.alcr.2015.11.003.

  • Manow, Philip. 2012. Wahlkreis- oder Listenabgeordneter, Typus oder Episode? Eine Sequenzanalyse der Wege in den Bundestag. Politische Vierteljahresschrift 53 (1): 53–78.

    Article  Google Scholar 

  • Martin, Peter, und Richard D. Wiggins. 2011. Optimal matching analysis. In The SAGE Handbook of Innovation in Social Research Methods, Hrsg. W. Paul Vogt and Malcolm Williams, 385–408. Los Angeles: Sage.

    Chapter  Google Scholar 

  • Martin, Peter, Ingrid Schoon, und Andy Ross. 2008. Beyond transitions: Applying optimal matching analysis to life course research. International Journal of Social Research Methodology 11 (3): 179–199. doi:10.1080/13645570701622025.

    Article  Google Scholar 

  • Mills, Melinda. 2011. Introducing survival and event history analysis. Los Angeles: Sage.

    Book  Google Scholar 

  • Pollock, Gary. 2007. Holistic trajectories: A study of combined employment, housing and family careers by using multiple-sequence analysis. Journal of the Royal Statistical Society: Series A (Statistics in Society) 170 (1): 167–183. doi:10.1111/j.1467-985X.2006.00450.x.

    Article  Google Scholar 

  • Ritschard, Gilbert, Alexis Gabadinho, Nicolas S. Muller, und Matthias Studer. 2008. Mining event histories: A social science perspective. International Journal of Data Mining, Modelling and Management 1 (1): 68–90.

    Article  Google Scholar 

  • Robette, Nicolas, und Xavier Bry. 2012. Harpoon or bait? A comparison of various metrics in fishing for sequence patterns. Bulletin of Sociological Methodology/Bulletin de Méthodologie Sociologique 116 (1): 5–24.

    Article  Google Scholar 

  • Rohwer, Götz, und Ulrich Pötter. 2005. TDA user’s manual. Bochum, Germany, Ruhr-Universität Bochum. http://www.stat.ruhr-uni-bochum.de/tman.html.

  • Rohwer, Götz, und Heike Trappe. 1997. Describing life courses. An illustration based on NLSY data. Paper präsentiert auf der POLIS Project Conference, 1997. European University Institute, Florenz. http://www.stat.ruhr-uni-bochum.de/papers/polis.pdf.

  • Scherer, S. 2001. Early career patterns: A comparison of Great Britain and West Germany. European Sociological Review 17 (2): 119–144.

    Article  Google Scholar 

  • Scott, John. 2000. Social network analysis: A handbook, 2. Aufl. London: Sage.

    Google Scholar 

  • Stegmann, Michael, Julia Werner, und Heiko Müller. 2013. Sequenzmusteranalyse: Einführung in Theorie und Praxis. Sozialwissenschaftliche Forschungsmethoden, Bd. 5. München: Hampp.

    Google Scholar 

  • Stovel, K. 2001. Local sequential patterns: The structure of lynching in the Deep South, 1882–1930. Social Forces 79 (3): 843–880.

    Article  Google Scholar 

  • Stovel, K., und M. Bolan. 2004. Residential trajectories: Using optimal alignment to reveal the structure of residential mobility. Sociological Methods and Research 32 (4): 559–598.

    Article  Google Scholar 

  • Stovel, K., M. Savage, und P. Bearman. 1996. Ascription into achievement: Models of career systems at Lloyds Bank, 1890–1970. American Journal of Sociology 102 (2): 358–399.

    Article  Google Scholar 

  • Wiggins, R. D., C. Erzberger, M. Hyde, P. Higgs, und D. Blane. 2007. Optimal matching analysis using ideal types to describe the lifecourse: An illustration of how histories of work, partnerships and housing relate to quality of life in early old age. International Journal of Social Research Methodology 10 (4): 259–278.

    Article  Google Scholar 

  • Yamaguchi, Kazuo. 1991. Event history analysis. Newbury Park: Sage.

    Google Scholar 

  • Zwinkels, Tomas, und Melinda Mills. 2015. Pathways to power: Careers, communication skills, political contacts and the obtainment of ministerial office. Paper präsentiert auf der ECPR General Conference (26–29 August 2015). Montreal.

    Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Sebastian Jäckle .

Editor information

Editors and Affiliations

Rights and permissions

Reprints and permissions

Copyright information

© 2017 Springer Fachmedien Wiesbaden GmbH

About this chapter

Cite this chapter

Jäckle, S. (2017). Sequenzanalyse. In: Jäckle, S. (eds) Neue Trends in den Sozialwissenschaften. Springer VS, Wiesbaden. https://doi.org/10.1007/978-3-658-17189-6_12

Download citation

  • DOI: https://doi.org/10.1007/978-3-658-17189-6_12

  • Published:

  • Publisher Name: Springer VS, Wiesbaden

  • Print ISBN: 978-3-658-17188-9

  • Online ISBN: 978-3-658-17189-6

  • eBook Packages: Social Science and Law (German Language)

Publish with us

Policies and ethics