Advertisement

Nichtparametrische Funktionale und ihre kanonischen Schätzer

  • Hermann Witting
  • Ulrich Müller-Funk

Zusammenfassung

Die bisher behandelten Modelle gingen von einer Verteilungsannahme aus, in der die zur Erklärung des betrachteten stochastischen Sachverhalts zugelassenen Verteilungen bis auf endlich viele reellwertige Parameter spezifiziert werden mußten. Als unbekannt wurden also nur diese Parameter angesehen. Eine so weitgehende Spezifizierung ist selbst approximativ vielfach nicht zu rechtfertigen. Vielmehr möchte man Modelle formulieren, in denen auch die geometrische Gestalt der Verteilung bzw. der Dichte variieren kann. Der Übergang von den engen parametrischen Verteilungsannahmen zu den sehr viel weiteren semiparametrischen oder nichtparametrischen Modellen wird in 7.1.1 beschrieben. Bei der Formulierung von Schätzproblemen in solchen Modellen interessiert man sich auf der einen Seite — den oben erwähnten Parametern entsprechend — für spezielle Aspekte wie Lokation, Dispersion, Schiefe o.a., jetzt also aufgefaßt als Funktionale auf einer großen Klasse von Verteilungen; auf der anderen Seite interessiert auch die Gestalt der Verteilung selber. Ohne weitere Zusatzinformation beschreibt man diese üblicherweise durch die VF, deren Schätzung vielfach durch die empirische VF erfolgen kann. Glaubt man jedoch von der Existenz einer Dichte ausgehen zu können, dann wird man nach gänzlich anders gebauten Schätzern für deren Gestalt suchen. Das Schätzen von Dichten und anderen Verteilungskurven, etwa von Regressionskurven erster oder zweiter Art, wird in Kap. 11 behandelt werden. Hier soll nur in Beispiel 7.1 eine Möglichkeit der Schätzung von Dichten und durch diese bestimmte Gewichtsfunktionen kurz skizziert werden.

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literatur

  1. 1).
    Typischerweise war bei derartigen Modellen die Form der (gemeinsamen) Verteilung vorgegeben, so daß der Parameter statistisch interessierende Größen wie den Mittelwert, die Streuung usw. beschrieb. — Theoretisch ist die Klasse aller k-dimensionalen Verteilungen sogar durch einen reellen Parameter charakterisierbar, denn eine VF ist als rechtsseitig stetige Funktion schon durch ihre Werte auf der Menge der rationalen Zahlentupel bestimmt, welche sich bijektiv auf (0,1) abbilden läßt. Eine derartige Parametrisierung ist jedoch ohne praktisches Interesse, da sie in keinem Zusammenhang mit der zugrundeliegenden statistischen Struktur steht.Google Scholar
  2. 2).
    Für VF F mit F(0) = 0 und A\-Dichte / ist diese definiert gemäß f/(1 — F) .Google Scholar
  3. 3).
    Es würde den Rahmen dieses Buches jedoch übersteigen, die notwendigen bzw. hinreichenden Bedingungen für eine derartige Vorgehensweise im einzelnen zu diskutieren. Auf eine Erörterung dieser Fragen soll auch deshalb verzichtet werden, weil die resultierenden Verfahren oft unhandlich sind und ihre Behandlung methodisch ziemlich aufwendig ist. Vgl. hierzu P. Bickel, C. Klaassen, Y. Ritov, J. Wellner: Efficient and Adaptive Estimation for Semiparametric Modells, John Hopkins (1993)Google Scholar
  4. 4).
    Derartige Modelle entstehen auch in ganz anderem Zusammenhang; vgl. etwa den Übersichtsartikel von J. Wellner: Semiparametric models, progress and problems. Bull. Intern. Stat. Inst., Proc. 45th Session IV, 23.1.Google Scholar
  5. 5).
    Man kann etwa zeigen, daß X (n) nur dann der beste äquivariante Schätzer ist, wenn F die 𝔑(0,1) -oder eine zentrierte Γ-Verteilung ist. Eine analoge Aussage gilt auch, wenn man erwartungstreue Schätzer der Form ∑ b nj x n j zum Vergleich zuläßt. Vgl. etwa L. Bondesson: Scand. J. Stat. 3 (1976) 116–120.MathSciNetzbMATHGoogle Scholar
  6. 6).
    Zum Begriff einer Halbordnung und diesbezüglichen Sprechweisen vgl. Fußnote 88 in 6.5.2.Google Scholar
  7. 7).
    Zur Behandlung des Falls, daß µ unbekannt ist, vgl. Kap. 9.Google Scholar
  8. 9).
    Zur folgenden Vorgehensweise vgl. F.W. Scholz: Can. J. Stat. 8 (1980) 193–203.MathSciNetzbMATHCrossRefGoogle Scholar
  9. 11).
    Im folgenden benötigt man im Sinne der Anmerkung 7.13 nur die untere Ableitung von P bzgl. Q, die der Kürze halber einfach mit L bezeichnet werden soll. Bei der Festsetzung sei abweichend von der sonst üblichen Konvention 0/0 := 1.Google Scholar
  10. 12).
    Vgl. auch hierzu die in Fußnote 9 zitierte Arbeit von F.W. Scholz.Google Scholar
  11. 14).
    Zu dieser und ihren Verallgemeinerungen vgl. A.W. Marshall, I. Olkin: Inequalities: Theory of Majorization and its Applications, Academic Press (1979) .zbMATHGoogle Scholar
  12. 16).
    vgl. J. Dieudonné: Grundzüge der modernen Analysis, Vieweg (1985) , S. 79, Problem 5b.zbMATHGoogle Scholar
  13. 17).
    Zum Beweis vgl. V. Strassen: Ann.Math.Stat. 36 (1965) 423–439.MathSciNetzbMATHCrossRefGoogle Scholar
  14. 18).
    Vgl. E. L. Lehmann: Ann. Math. Stat. 22 (1951) 165–179.MathSciNetzbMATHCrossRefGoogle Scholar
  15. 19).
    Dieses Beispiel wie auch der nachfolgende Satz entstammen im wesentlichen der Arbeit von S. Cambanis, G. Simons und W. Stout: Zeitschr. Wahrsch. Th. u. verw. Geb. 36 (1976) 285–294.MathSciNetzbMATHCrossRefGoogle Scholar
  16. 21).
    Zur Existenz der einseitigen Ableitungen ∂+ Ψ und ∂+ Ψ für konvexes Ψ: R → R vgl. B1.30.Google Scholar
  17. 23).
    Vgl. H.U. Burger: Stat. & Prob. Letters 16 (1993) 1–9MathSciNetzbMATHCrossRefGoogle Scholar
  18. 24).
    Vgl. hierzu die aus der µ-Ordnung folgende Beziehung (7.1.54) mit der Definition (7.1.36) der Dehnungshalbordnung.Google Scholar
  19. 25).
    Zu einer elementaren Darstellung dieses Gebiets vgl. etwa F. Ferschl: Deskriptive Statistik, Physika-Verlag (1978) .Google Scholar
  20. 26).
    Eine Verteilung mit eindeutigem Modalwert m, also eindeutiger Maximalstelle der Dichte, bezeichnet man als rechtsschief, wenn ihre Dichte für x < m rascher gegen 0 strebt als für x > m. Zur Präzisierung des Fechnerschen Lagegesetzes vgl. J.Th. Runnenburg: Stat. Neerl. 32 (1978) 73–79. Einprägsam ist dieses Gesetz anhand der englischen Bezeichnung “mean-median-mode inequality”, bei der die Lageparameter in lexikographisch fallender Ordnung vorkommen.MathSciNetzbMATHCrossRefGoogle Scholar
  21. 28).
    Der Index SK soll an das englische Wort skewness erinnern. — (SK2) formalisiert also die Konvention, rechtsschiefen Verteilungen einen positiven (genauer: nicht-negativen) , linksschiefen Verteilungen einen negativen (genauer: nicht-positiven) Wert zuzuordnen.Google Scholar
  22. 29).
    Vgl. C.G. Small: Intern. Stat. Rev. 58 (1990) 263–277.CrossRefGoogle Scholar
  23. 30).
    Vgl A.W. Marshall, I. Olkin: Journ. Am. Stat. Assoc. 62 (1967) 30–44.MathSciNetzbMATHGoogle Scholar
  24. 31).
    Die analogen Aussagen erhält man bei Vertauschung der Rollen von Y und Z. Google Scholar
  25. 32).
    Eine derartige Aussage läßt sich auch über einem beliebigen (nicht notwendig euklidischen oder metrischen) Raum (𝔛 0 (2), 𝔛 0 (2)) beweisen, sofern G oder H ein perfektes WS-Maß ist; vgl. D. Ramachandran, L. Rüschendorf: A general duality theorem for marginal problems. Erscheint in: Probability Theory and Related Fields (1995)Google Scholar
  26. 33).
    Vgl. R.B. Nelsen: Copulas and Association, in: Advances in Probability Distributions with Given Marginals. (Ed. G. Dall’Aglio, S. Kotz and G. Salinetti) Mathematics and its Applications 67 (1991) 51–74.CrossRefGoogle Scholar
  27. 34).
    Vgl. H. Gebelein: Zeitschr. Angew. Math. Mech. 21 (1941) 364–379MathSciNetCrossRefGoogle Scholar
  28. 35).
    In Anlehnung an W.J. Hall in: Essays in Probability & Statistics, Ed.: Bose et al. (1970) .Google Scholar
  29. 36).
    Vgl. N. Blomquist: Ann. Math. Stat. 21 (1950) 593–600.CrossRefGoogle Scholar
  30. 37).
    Diese Definition folgt im wesentlichen M. Scarsini: Stochastica VIII (1984) 201–218. — Die Forderungen (Kl) , ..., (K5) sind geeignet zu modifizieren, wenn F auf den ersten Quadranten konzentriert oder der Träger von F anderweitig eingeschränkt ist.MathSciNetGoogle Scholar
  31. 38).
    pür eine hiervon abweichende Axiomatik vgl. A. Renyi: Act Math. Acad. Sci. Hungarica 10(1958) 441–451.MathSciNetCrossRefGoogle Scholar
  32. 39).
    Für eine Axiomatisierung vgl. wieder die in Fußnote 31 zitierte Arbeit von W.J. Hall.Google Scholar
  33. 41).
    Dieser Unterabschnitt folgt weitgehend der Arbeit von A. Mandelbaum und L. Rüschendorf: Ann. Stat. 15 (1987) 1229–1244.zbMATHCrossRefGoogle Scholar
  34. 42).
    Offensichtlich impliziert die r-Vollständigkeit von diejenige der konvexen Hülle von 𝔉.Google Scholar
  35. 43).
    Diese Identität, deren linke Seite man als Permanente per(𝒜) von 𝒜 bezeichnet, folgt unmittelbar aus dem Exklusions-Inklusionsprinzip. Für einen Beweis vgl. etwa K. Jacobs: Einführung in die Kombinatorik, de Gruyter (1983) , S.31.zbMATHGoogle Scholar
  36. 44).
    In der in Fußnote 41 zitierten Arbeit von A. Mandelbaum und L. Rüschendorf wird gezeigt, daß die Konvexität nur in weiter abgeschwächter Form benötigt wird.Google Scholar
  37. 45).
    Im Gegensatz zu den in 7.1.3 betrachteten Schiefefunktionalen handelt es sich hier um eine nicht-signierte Größe.Google Scholar
  38. 46).
    Zur allgemeinen Theorie, insbesondere für den Fall endlich vieler Faktorräume 𝔛 1,. .., 𝔛 n und anderer Skalarenkörper, vgl. W. Greub: Multilineare Algebra, Springer (1975)Google Scholar
  39. 47).
    Die Bezeichnung ΓB wird sich in Band III dadurch erklären, daß ΓB die Kovarianzfunktion eines dort wichtigen Gauß-Prozesses, der sog. Brownschen Brücke B, ist.Google Scholar
  40. 48).
    Zum Beweis dieser Ungleichung und des globalen Minimaxsatzes in der folgenden Anmerkung vgl. A. Dvoretzky, J. Kiefer, J. Wolfowitz: Ann. Math. Stat. 27 (1956) 642–669.MathSciNetzbMATHCrossRefGoogle Scholar
  41. 49).
    Vgl. P.W. Millar: Lecture Notes in Math. 976 (1983) , p. 160.MathSciNetGoogle Scholar
  42. 50).
    Zur Motivation vgl. die Diskussion der Kolmogorov-Smirnov-Verteilung in Kap. 10.Google Scholar
  43. 51).
    Dies impliziert u.a., daß man sich bei der Supremumsbildung in (7.2.18) auf eine abzählbar dichte Teilmenge beschränken kann, und daß damit die Größe in (7.2.18) meßbar ist.Google Scholar
  44. 52).
    Die Gesamtheit aller Funktionen g, für welche die Aussagen von Satz 7.92 gelten, läßt sich charakterisieren. Hierzu sowie zu weiteren Verfeinerungen von Satz 7.92 vgl. G. Shorack, J. Wellner: Empirical Processes with Application to Statistics, Wiley (1986) .Google Scholar
  45. 53).
    Solche Konvergenzaussagen kann man z.B. für die „dual bounded Lipschitz-norm“•zeigen. Die Konvergenzrate hängt dann jedoch von der speziellen Norm ab. Vgl. R.M. Dudley: Ann. Math. Stat. 39 (1968) 1563–1573.MathSciNetzbMATHGoogle Scholar
  46. 54).
    Vgl. hierzu und zu Satz 7.96 P.K. Sen, M. Ghosh: Ann. Math. Stat. 42 (1971) 189–203.MathSciNetzbMATHCrossRefGoogle Scholar
  47. 55).
    Zur ersten dieser Ungleichungen vgl. M. Ghosh: Sankhya A34 (1972) 349–356.Google Scholar
  48. 56).
    Vgl. N. Bönner, U. Müller-Funk, H. Witting in: Asymptotic Theory of Statistical Tests and Estimation. Ed. by I.M. Chakravarti, Academic Press (1980) 85–125, Lemma 2.1.Google Scholar
  49. 59).
    Die Aussagen dieses Hilfssatzes finden sich ohne Beweis bei H. Chernoff, J. L. Gastwirth, M. V. Johns: Ann. Math. Stat. 38 (1967) 52–72.MathSciNetzbMATHCrossRefGoogle Scholar
  50. 60).
    Vgl. P. Gänssler, W. Stute: Wahrscheinlichkeitstheorie, Springer (1977) , S. 98.zbMATHGoogle Scholar
  51. 61).
    Zum hiervon wesentlich verschiedenen Limesverhalten extremer Ordnungsstatistiken, d.h. demjenigen von X n†jn mit j n /nu ∈, vgl. 7.2.4.Google Scholar
  52. 63).
    Mit etwas höherem Rechenaufwand liefert die Technik des vorstehenden Beweises auch sogleich eine Berry-Esseen-Typ Aussage; vgl. etwa R.D. Reiss: Ann. Prob. 2 (1974) 741–744.MathSciNetzbMATHCrossRefGoogle Scholar
  53. 66).
    Zur Behandlung allgemeinerer Situationen vgl. H. Witting: Arch. Math. 10 (1959) 468–479MathSciNetzbMATHCrossRefGoogle Scholar
  54. 66a).
    D. S. Moore, M. C. Spruill: Ann. Stat. 3 (1975) 599–616MathSciNetzbMATHGoogle Scholar
  55. 67).
    Diese Thematik wird hier vergleichsweise knapp behandelt. Für eine ausführlichere Darstellung vgl. D. Pfeifer: Einführung in die Extremwertstatistik, Teubner (1989)zbMATHGoogle Scholar
  56. 67a).
    R.-D. Reiss: Approximate Distributions of Order Statistics, Springer (1989) .zbMATHCrossRefGoogle Scholar
  57. 69).
    Die hier nach Weibull bezeichnete Verteilung ergibt sich aus der in (1.1.7) angegebenen Verteilung, wenn man dort A — 1 setzt und diese Verteilung dann am Nullpunkt spiegelt.Google Scholar
  58. 72).
    Vgl. W. Hoeffding: A class of statistics with asymptotically normal distribution. Ann. Math. Stat. 19 (1948) 293–325.MathSciNetzbMATHCrossRefGoogle Scholar
  59. 73).
    Vgl. R. von Mises: On the asymptotic distribution of differentiate statistical functions. Ann. Math. Stat. 18 (1947) 309–348.zbMATHCrossRefGoogle Scholar
  60. 74).
    Vgl. H. Bauer: Wahrscheinlichkeitstheorie, 4. Aufl., de Gruyter (1991) S. 158.zbMATHGoogle Scholar
  61. 75).
    Zum Begriff eines inversen Martingals und zu diesem Konvergenzsatz vgl. H.G. Tucker: AGoogle Scholar
  62. Graduate Course in Probability, Academic Press (1967) .Google Scholar
  63. 76).
    Zum Beweis vgl. etwa P. Gänssler, W. Stute: Wahrscheinlichkeitstheorie, Springer (1977) , S.87.zbMATHGoogle Scholar
  64. 77).
    Vgl. R.H. Berk: Ann. Math. Stat. 37 (1966) 51–58.MathSciNetzbMATHCrossRefGoogle Scholar
  65. 79).
    Aus technischen Gründen ist es manchmal zweckmäßig,die Gewichtung v von n abhängen zu lassen. Dieses ist schon dann der Fall, wenn diskrete Gewichte von n abhängen; vgl. auch (7.3.28) .Google Scholar
  66. 81).
    Vgl. hierzu wie zu Hilfssatz 7.147 W. van Zwet: Ann. Prob. 8 (1980) 986–990.zbMATHCrossRefGoogle Scholar
  67. 82).
    Vgl. N. Dunford, J.T. Schwartz: Linear Operators, Part I, Interscience Publ. (1957) .Google Scholar
  68. 84).
    Die nachfolgenden Überlegungen sind methodisch verwandt mit denjenigen der Arbeit J. Dupacová, R. Wets: Ann. Stat. 16 (1988) 1517–1549.zbMATHCrossRefGoogle Scholar
  69. 85).
    Hier bezeichnet K-lim C n den in B2.12 eingeführten Kuratowski-Limes einer Folge (C n) .Google Scholar
  70. 86).
    Vgl. Theorem 3.9 in der in Fußnote 84 zitierten Arbeit von J. Dupačová, R.Wets.Google Scholar
  71. 87).
    Vgl. R.T. Rockafellar: Lect. Notes Math. 573, Springer (1976)Google Scholar
  72. 88).
    Man beachte, daß diese Räume von n und ⊗ F j abhängen und etwa der unter F j gebildete EW von sj kurz mit Es bezeichnet wird. Nur bei den Statistiken und ihren Projektionen wird im Hinblick auf deren Verwendung beim Grenzübergang n → ∞ die Abhängigkeit von n angegeben. Eine Ausnahme hiervon bilden die Beweise, in denen auf die Indizierung der Statistiken und ihrer Projektionen durch n gelegentlich verzichtet wird.Google Scholar
  73. 89).
    Vgl. etwa E. Hewitt, K. Stromberg: Real and Abstract Analysis, Springer (1969) ; § 16.Google Scholar
  74. 90).
    Die Nebenbedingungeri, welche die Orthogonalität der Räume ℒ(k) sicherstellen, sind von der gleichen Art wie die Orthogonalitätsforderungen, mittels derer sich der Mittelwertraum bei Varianzanalysemodellen orthogonal zerlegen läßt; vgl. 4.2. Die nachfolgende Hoeffding-Zerlegung wird deshalb manchmal auch als ANOVA-Zerlegung bezeichnet.Google Scholar
  75. 91).
    Hieraus läßt sich auch leicht die Hoeffding-Zerlegung 7.176 folgern. Setzt man nämlich (7.4.36) für k = m, also für Ψ = Ψ m, in (7.4.28) ein, so ergibt sich bereits formal die Darstellung (7.4.29) . Man hat also nur noch die Unkorreliertheit der Summanden Ψ k 0 (X K), KN, zu zeigen, was wie im Beweis von Hilfssatz 7.175 erfolgen kann.Google Scholar
  76. 92).
    Besitzt Ψ 0 2 nur endlich viele Eigenwerte, so kann auf den ersten Schritt verzichtet werden; vgl. (5.4.16).Google Scholar
  77. 93).
    Vgl. L. Rüschendorf: Stud. Sci. Math. Hung. 23 (1988) 203–208.zbMATHGoogle Scholar
  78. 94).
    Vgl. H. Rubin, R.A. Vitale: Ann. Stat. 8 (1980) 165–170.MathSciNetzbMATHCrossRefGoogle Scholar
  79. 95).
    Die Herleitung der Limes-Nullverteilung mit Hilfe der Theorie der U-Statistiken geht zurück auf L. Baringhaus, N. Henze: Stat. & Prob. Letters 9 (1990) 299–304.MathSciNetzbMATHCrossRefGoogle Scholar
  80. 96).
    Vgl. R. Serfling: Ann. Stat. 12 (1984) 76–86.MathSciNetzbMATHCrossRefGoogle Scholar
  81. 98).
    Vgl. K.O. Friedrich: Ann. Stat. 17 (1989) 170–183.MathSciNetzbMATHCrossRefGoogle Scholar
  82. 99).
    Im folgenden wird weiterhin p als Abkürzung für 5/3 verwendet, zumal einzelne Abschätzungen und Hilfsaussagen auch für andere Werte von p gelten.Google Scholar
  83. 100).
    Vgl. etwa Y.S. Chow, H. Teicher: Probability Theory, Springer (1978) S.272.zbMATHCrossRefGoogle Scholar
  84. 101).
    Vgl. etwa das in Fußnote 100 zitierte Buch von Y.S. Chow, H. Teicher, S.356Google Scholar
  85. 102).
    Wegen Details vgl. W. Feller: An Introduction to Probability Theory and its Applications II, Wiley (1972) S.544.Google Scholar
  86. 103).
    In Anlehnung an S.M. Stigler: Ann. Stat. 2 (1974) 676–693MathSciNetzbMATHCrossRefGoogle Scholar
  87. 104).
    Bei diesem Ansatz wird b(F0302 n) um den EW des Arguments entwickelt. Deshalb kann mit diesem nur der Fall approximativer Gewichte behandelt werden.Google Scholar
  88. 106).
    Diese Aussage wird in Kap. 10 auch aus einem dort zu beweisenden funktionalen Grenzwertsatz folgen.Google Scholar
  89. 109).
    In Anlehnung an die in Fußnote 108 zitierte Arbeit von Chernoff-Gastwirth-Johns.Google Scholar
  90. 111).
    Dieser Fall läßt sich etwa mit der in Kap. 10 entwickelten L2-Theorie nicht behandeln, da bei dieser die Kovarianzoperatoren der Limesprozesse eine endliche Spur besitzen müssen.Google Scholar
  91. 112).
    Vgl. T. De Wet, J.H. Venter: South Afr. Statist. J. 6 (1972) 135–149.Google Scholar
  92. 116).
    In 6.2.1 wurde gezeigt, daß die Prüfgrößen des LQ- und χ 2-Tests zum Prüfen zusammengesetzter Nullhypothesen bei Vorliegen geeigneter Regularitätsvoraussetzungen unter 𝔉 0 asymptotisch verteilungsfrei sind.Google Scholar
  93. 118).
    Die Forderung g’ ≥ 0 ist offenbar gleichbedeutend damit, daß — logf strikt konvex ist. Nach dem Satz von Ibragimov 6.219 sind derartige Dichten strikt unimodal.Google Scholar
  94. 120).
    Wegen (7.5.94) werden also b und a bei symmetrischem F 0 orthogonal.Google Scholar
  95. 121).
    Diese Aussage wurde von De Wet-Venter direkt für die Schätzer X0305 n und s n bewiesen; vgl. South Afr. Statist. J. 6 (1972) 135–150.Google Scholar

Copyright information

© B. G. Teubner Stuttgart 1995

Authors and Affiliations

  • Hermann Witting
    • 1
  • Ulrich Müller-Funk
    • 2
  1. 1.Universität Freiburg i. Br.Deutschland
  2. 2.Universität Münster/Westf.Deutschland

Personalised recommendations