Zusammenfassung
Das methodische Vorgehen in TOSCA lehnte sich in großen Teilen an die nationalen und internationalen Schulleistungsstudien der letzten Jahre an, wobei insbesondere die PISA-Studie (Baumert u.a., 2001, 2003) als Vorbild diente. Im Folgenden (Abschnitt 2) wird auf die konkrete Beschreibung der Untersuchungspopulation eingegangen, die die Grundlage für die Stichprobenziehung (Abschnitt 3) bildete. Im Abschnitt 4 werden Details der Datenerhebungen in den Schulen berichtet. Empirische Schulleistungsstudien — wie im Übrigen alle Feldstudien — haben das Problem, dass nicht alle gezogenen Personen an der Untersuchung teilnehmen, und sich anschließend die Frage stellt, ob dadurch die Aussagekraft der Befunde eingeschränkt ist. Mit diesen Problemen der Selektivität durch Nichtteilnahme beschäftigt sich der Abschnitt 5. Im Abschnitt 6 wird dann auf die Skalierung von Leistungstests eingegangen. Schließlich werden im letzten Teil (Abschnitt 7) statistische Probleme erörtert, die sich zum einen auf den hierarchischen Charakter der erhobenen Daten beziehen (Schülerinnen und Schüler innerhalb von Schulen, Schulen innerhalb von Schulformen), zum anderen auf den adäquaten Umgang mit fehlenden Werten.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Literatur
Adams, R. J., Wilson, M. R. & Wang, W. C. (1997). The multidimensional random coefficients multinomial logit. Applied Psychological Measurement, 21, 1–24.
Adams, R. J., Wu, M. L. & Macaskill, G. (1997). Scaling methodology and procedures for the mathematics and science scales. In M. O. Martin & D. L. Kelly (Eds.), Third International Mathematics and Science Study. Technical report: Vol. II. Implementation and analysis. Primary and middle school years (Chap. 7, pp. 111–146). Chestnut Hill, MA: Boston College.
Allison, P. D. (2001). Missing data. Thousand Oaks, CA: Sage.
Andrich, D. (1978). A rating formulation for ordered response categories. Psychometrika, 43, 561–573.
Andrich, D. (1982). An extension of the Rasch model for ratings providing both location and dispersion parameters. Psychometrika, 47, 105–113.
Baumert, J., Artelt, C., Klieme, E., Neubrand, M., Prenzel, M., Schiefele, U., Schneider, W., Tillmann, K.-J. & Weiß, M. (Hrsg.). (2002). PISA 2000. Die Länder der Bundesrepublik Deutschland im Vergleich. Opladen: Leske + Budrich.
Baumert, J., Artelt, C., Klieme, E., Neubrand, M., Prenzel, M., Schiefele, U., Schneider, W., Tillmann, K.-J. & Weiß, M. (Hrsg.). (2003). PISA 2000. Ein differenzierter Blick auf die Länder der Bundesrepublik Deutschland. Opladen: Leske + Budrich.
Baumert, J., Bos, W. & Lehmann, R. (Hrsg.). (2000a). TIMSS/III. Dritte Internationale Mathematik-und Naturwissenschaftsstudie — Mathematische und naturwissenschaftliche Bildung am Ende der Schullaufbahn: Bd. 1. Mathematische und naturwissenschaftliche Grundbildung am Ende der Schullaufbahn. Opladen: Leske + Budrich.
Baumert, J., Bos, W. & Lehmann, R. (Hrsg.). (2000b). TIMSS/IIL Dritte Internationale Mathematik-und Naturwissenschaftsstudie — Mathematische und naturwissenschaftliche Bildung am Ende der Schullaufbahn: Bd. 2. Mathematische und physikalische Kompetenzen am Ende der gymnasialen Oberstufe. Opladen: Leske + Budrich.
Baumert, J., Klieme, E., Neubrand, M., Prenzel, M., Schiefele, U., Schneider, W., Stanat, P., Tillmann, K.-J. & Weiß, M. (Hrsg.). (2001). PISA 2000. Basiskompetenzen von Schülerinnen und Schülern im internationalen Vergleich. Opladen: Leske + Budrich.
Bortz, J. & Döring, N. (1995). Forschungsmethoden und Evaluation (2. vollst, überarb. u. akt. Aufl.). Berlin: Springer.
Breen, R. (1996). Regression models: Censored, sample-selected, or truncated data. Thousand Oaks, CA: Sage.
Bryk, A. S. & Raudenbush, S. W. (1987). Application of hierarchical linear models to assessing change. Psychological Bulletin, 101, 147–158.
Bryk, A. S. & Raudenbush, S. W. (1989). Toward a more appropriate conceptualization of research on school-effects: A three-level hierarchical linear model. In R. D. Bock (Ed.), Multilevel analysis of educational data (pp. 159–204). San Diego, CA: Academic Press.
Collins, L. M. Schäfer, J. L. & Kam, C.-M. (2001) A comparison of inclusive and restrictive strategies in modern missing data procedures. Psychological Methods, 6, 330–351.
Fischer, G. H. & Molenaar, I. W. (Eds.). (1995). Rasch models. Foundation, recent developments, and applications. New York: Springer.
Graham, J. W., Cumsille, P. E. & Elek-Fisk, E. (2003). Methods for handling missing data. In J. A. Schinka & W. F. Velicer (Eds.), Handbook of psychology: Research methods in psychology (Vol. 2, pp. 87–114). New York: Wiley.
Graham, J. W., Taylor, B. J. & Cumsille, P. E. (2001). Planned missing data designs in the analysis of change. In L. M. Collins & A. G. Sayer (Eds.), New methods for the analysis of change. Washington, DC: American Psychological Association.
Hambleton, R. K. & Swaminathan, H. (1989). Item response theory. Principles and applications. Boston, MA: Kluwer.
Judkins, D. (1990). Fay’s method for variance estimation. Journal of Official Statistics, 6, 223–240.
Kaplan, D. (2000). Structural equation modeling Newbury Park, CA: Sage.
Kish, L. (1965). Survey Sampling. New York: Wiley.
Köller, O., Watermann, R. & Baumert, J. (2001). Skalierung der Leistungstests in PISA. In J. Baumert, E. Klieme, M. Neubrand, M. Prenzel, U. Schiefele, W. Schneider, P. Stanat, K.-J. Tillmann & M. Weiß (Hrsg.), PISA 2000. Basiskompetenzen von Schülerinnen und Schülern im internationalen Vergleich (S. 517–524). Opladen: Leske + Budrich.
Kubinger, K. D. (Hrsg.). (1989). Moderne Testtheorie. Weinheim: Beltz.
Lord, F. M. & Novick, M. R. (1968). Statistical theories of mental test scores. Reading, MA: Addison-Wesley.
Masters, G. N. (1982). A Rasch model for partial credit scoring. Psychometrika, 47, 149–174.
Mislevy, R. J., Beaton, A. E., Kaplan, B. & Sheehan, K. M. (1992). Estimating population characteristics from sparse matrix samples of item responses. Journal of Educational Measurement, 29(2), 133–161.
Mislevy, R. J., Johnson, E. G. & Musaki, E. (1992). Scaling procedures in NAEP. Journal of Educational Statistics, 17(2), 131–154.
Raudenbush, S. W. & Bryk, A. S. (2002). Hierarchical linear models. Applications and data analysis methods (2nd ed.). Newbury Park, CA: Sage.
Rost, J. (1996). Lehrbuch Testtheorie, Testkonstruktion. Bern: Huber.
Rubin, D. B. (1976). Inference and missing data. Biometrika, 63, 581–592.
Rubin, D. B. (1987). Multiple imputation for nonresponse in surveys. New York: Wiley.
Rubin, D. B. (1996). Multiple imputation after 18 + years. Journal of the American Statistical Association, 91, 473–489.
Schafer, J. L. (1997). Analysis of incomplete multivariate data. London: Chapman & Hall.
Schafer, J. L. & Graham, J. W. (2002). Missing data: Our view of the state of the art. Psychological Methods, 7, (2), 147–177.
Sibberns, H. & Baumert, J. (2001). Stichprobenziehung und Stichprobengewichtung. In J. Baumert, E. Klieme, M. Neubrand, M. Prenzel, U. Schiefele, W. Schneider, P. Stanat, K.-J. Tillmann & M. Weiß (Hrsg.), PISA 2000. Basiskompetenzen von Schülerinnen und Schülern im internationalen Vergleich (S. 511–517). Opladen: Leske + Budrich.
Tabachnik, B. G. & Fidell, L. S. (1996). Using multivariate statistics (3rd ed.). New York: HarperCollins.
Wolter, K. M. (1985). Introduction to variance estimation. New York: Springer.
Editor information
Rights and permissions
Copyright information
© 2004 Leske + Budrich, Opladen
About this chapter
Cite this chapter
Lüdtke, O., Köller, O., Bundt, S., Gomolka, J., Watermann, R. (2004). Durchführung und methodische Grundlagen der TOSCA-Studie. In: Köller, O., Watermann, R., Trautwein, U., Lüdtke, O. (eds) Wege zur Hochschulreife in Baden-Württemberg. VS Verlag für Sozialwissenschaften. https://doi.org/10.1007/978-3-322-80906-3_6
Download citation
DOI: https://doi.org/10.1007/978-3-322-80906-3_6
Publisher Name: VS Verlag für Sozialwissenschaften
Print ISBN: 978-3-8100-3728-2
Online ISBN: 978-3-322-80906-3
eBook Packages: Springer Book Archive