Zusammenfassung
Diskrete Kernfunktionen werden als Instrument der Dichteschätzung für kategoriale Variablen entwickelt. Die Darstellung als lineare Transformationen der relativen Häufigkeit zeigt die Ähnlichkeit zu alternativen Glättungsverfahren. Da Dichteschätzung allein meist nicht Endzweck einer Datenanalyse ist, wird der Einsatz der Verfahren in den komplexeren Problemstellungen der Regressions- und Diskriminanzanalyse betrachtet. Dichteschätzer sind ein entscheidender Baustein für den Kernregressionsschätzer. Die Güte dieses Verfahrens der non- parametrischen kategorialen Regression wird entscheidend von der Wahl der Glättungsparameter beeinflußt - dieser Einfluß und alternative Auswahlverfahren werden untersucht. Ein kurzer Abschnitt zeigt die Anwendbarkeit im Bereich der Verweildaueranalyse. Als Baustein der Diskriminanzanalyse läßt sich Kerndichteschätzung auf zweifache Art einsetzen: als direktes Verfahren zur Schätzung der a posteriori-Wahrscheinlichkeit und als indirektes Verfahren zur Schätzung der Merkmalsverteilung in den zu prognostizierenden Klassen. Für beide Möglichkeiten werden Wahlmöglichkeiten für den Glättungsparameter entwickelt.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Literatur
Aitchison, J., Aitken, C. (1976): Multivariate binary discrimination by the kernel method. Biometrika 63, 413–42.
Aitken, C. G. G. (1983): Kernel methods for the estimation of discrete distributions. J. Statist. Comput. Simul. 16, 189–200.
Anderson, J. A. (1982): Logistic discrimination. In: Krishnaiah, P. R., Kanal, L. N. (ed): Classification, Pattern Recognition and Reduction of Dimensionality. North-Holland, Amsterdam.
Anderson, J. A., Phillips, P. (1981): Regression, discrimination and measurement models for ordered categorical variables. Appl. Statist. 30, 22–31.
Benedetti, J. K. (1977): On the nonparametrie estimation of regression functions. J. Roy. Stat. Soc., B, 39, 248–253.
Bowman, A. W. (1980): A note on consistency of the kernel method for the analysis of categorical data. Biometrika 67, 682–684.
Bowman, A. W., Hall, P., Titterington, D. M. (1984): Cross-validation in nonparametrie estimation of probabilities and probability densities. Biometrika 71, 341–351.
Brown, P. J., Rundell, W. K. (1985): Kernel estimates for categorical data. Technometrics 27, 293–299.
Campbell, M. K., Donner, A. (1989): Classification efficiency of multinomial logistic regression relative to ordinal logistic regression. J. Am. Stat. Ass. 84, 587–591.
Copas,J. B. (1983): Plotting p against x. Applied Statistics 32, 25–31.
Dawid, A. P. (1976): Properties of diagnostic data distributions. Biometrics 32, 647–658.
Fienberg, S. E., Holland, P. W. (1973): Simultaneous estimation of multinomial cell probabilities. J. Am. Statist. Assoc. 68, 683–691.
Gasser, T., Müller, H. G. (1979): Kernel estimation of regression functions. In: T. Gasser, Rosenblatt (eds.). Smoothing techniques for curve estimation. Heidelberg: Springer-Verlag.
Gasser, T., Muller, H. (1984): Nonparametrie estimation of regression functions and their derivatives. Scand. J. Statist. 11, 171–185.
Glick, N. (1978): Additive estimators for probabilities of correct classification. Pattern Recognition 10, 211–222.
Groß, H. (1990): Parametrische und nonparametrische Verfahren der Diskriminanz-analyse mit Variablen verschiedenen Skalenniveaus. Dissertation, Universität Regensburg.
Habbema, J. D. F., Hermans, J., Remme, J. (1978): Variable kernel density estimation in discriminant analysis. In: L. C. A. Corster, J. Hermans (eds), Compstat. 1978 (pp. 178–185 ). Vienna: Physica Verlag.
Haberman, S. J. (1978): Analysis of qualitative data, Vol. L Academic Press, New York.
Hardle, W. (1990): Applied nonparametric regression. Cambridge: Cambridge University Press.
Hall, P. (1981): On nonparametric multivariate binary discrimination. Biometrika 68, 287–294.
Hamerle, A., Tutz, G. (1989): Diskrete Modelle zur Analyse von Verweildauern und Lebenszeiten. Berlin: Springer Verlag.
Kalbfleisch, J. D., Prentice, R. L. (1980). The statistical analysis of failure time data. New York: Wiley.
Kappenman, R. F. (1987): Nonparametric estimation of dose-response curves with application to ED 50 estimation. J. Statist. Comput. Simul. 28, 1–13.
Lachenbruch, P. (1975): Discriminant analysis. Hafner Press, New York
Lauder, I. J. (1983): Direct kernel assessment of diagnostic probabilities. Biometrika 70, 251–256.
Lawless, J. F. (1982): Statistical models and methods for life time data. New York.
Lee, E. T. (1974): Computer programs for linear logistic regression analysis. Computer Programs in Biomedicine 4, 82–97.
Leonard, T. (1977): A Bayesian approach to some multinomial and pretesting problems. JASÄ 72, 869–874.
Mccullagh, P. (1980): Regression models for ordinal data. J. R. Statist Soc. B, 42, 109–142.
Mccullagh, P., Nelder, J. A. (1989): Generalized linear models. ( Second edition) London: Chapman and Hall.
Müller, H. G. (1984): Smooth optimum kernel estimatiors of densities, regression curves and modes. Annals of Statistics, 12, 766–774.
Müller, H. G., Stadtmüller, U. (1987): Estimation of heteroscedasticity in regression analysis. Annals of Statistics, 12, 221–232.
Müller, H. G., Schmitt, T. (1988): Kernel and probit estimates in quantal Bioassay. J. Am. Stat Ass. 83, 750–759.
Nadaraya, E. A. (1964): On estimating regression. Theory Prob. Appl 10, 186–190.
Padgett, W. (1988): Nonparametric estimation of density and hazard rate functions when samples are censored. In: P. R. Krishnaiah, C. R. Rao (eds.). Handbook of statistics 7: Quality control and reliability. Amsterdam: North-Holland
Priestley, M. B., Chao, M. T. (1972): Nonparametric function fitting. J. Roy. Stat Soc., B, 34, 385–392.
Read, T., Cressie, N. (1988): Goodness-of-fit statistics for discrete multivariate data. New York: Springer Verlag.
Santner, T., Duffy, D. (1989): The statistical analysis of discrete data. New York: Springer Verlag.
Silverman, B. W. (1984): Spline smoothing: the equivalent variable kernel method. Annals of statistics 12, 898–916.
Simonoff, J. S. (1983): A penalty function approach to smoothing large sparse contingency tables. Ann. Statist., 208–218.
Tanner, M. A., Wong, W. W. (1983). The estimation of the hazard function from randomly censored data by the kernel method. Ann. Statist. 11, 989–993.
Titterington, D. M. (1985): Common structure of smoothing techniques in statistics. Intemation al Statistical Review 52, 141–170.
Titterington, D. M., Bowman, A. W. (1985): A comparative study of smoothing procedures for ordered categorial data. J. Statist. Compart. Simul. 21, 291–312.
Titterington, D. M., Murray, G. D.,Murray, L. S., Spiegelhalter, D. J., Skene, A. M., Habbema, J. D. F., Gelpke, G. J. (1981): Comparison of discrimination techniques applied to a complex data set of head injured patients. J. R. Statist. Soc. A 144, 145–175.
Tutz, G. (1990a): Modelle für kategoriale Daten mit ordinalem Skalenniveau-parametrische und nonparametrische Ansätze. Vandenhoeck & Ruprecht, Gottingen.
Tutz, G. (1990b): Smoothed categorical regression based on direct kernel estimates. Journal of Statistical Computation and Simulation 36, 139–156.
Tutz, G. (1991): Consistency of cross-validatory choice of smoothing parameters for direct kernel estimates. Computational Statistics Quarterly (in print).
Wang, M. -Ch., Van Ryzin, J. (1981): A class of smooth estimators for discrete disributions. Biometrika 68, 301–309.
Watson, G. S. (1964): Smooth regression analysis. Sankhya, Series A, 26, 359–372.
Author information
Authors and Affiliations
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 1991 Springer-Verlag Berlin Heidelberg
About this paper
Cite this paper
Tutz, G. (1991). Glättung mit diskreten Daten: Kernfunktionen in Dichteschätzproblemen, nonparametrischer Regression und Diskriminanzanalyse. In: Seeber, G.U.H., Minder, C.E. (eds) Multivariate Modelle. Medizinische Informatik, Biometrie und Epidemiologie, vol 74. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-95669-0_4
Download citation
DOI: https://doi.org/10.1007/978-3-642-95669-0_4
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-54511-8
Online ISBN: 978-3-642-95669-0
eBook Packages: Springer Book Archive