1 Einleitung

Armut stellt ein gesellschaftlich und politisch relevantes Thema dar, welches in den letzten Jahren in der öffentlichen Diskussion immer weiter an Bedeutung gewonnen hat. Dieser Bedeutungsgewinn ist sicherlich nicht zuletzt auf einen Zuwachs von Armut in Deutschland in den letzten 20 Jahren zurückzuführen. Wie dem fünften Armuts- und Reichtumsbericht der Bundesregierung (Bundesministerium für Arbeit und Soziales 2017) zu entnehmen ist, betrifft relative Einkommensarmut einen nennenswerten Teil der deutschen Gesellschaft. Im politischen Diskurs werden unterschiedliche Kennziffern zur Beschreibung von Armut auf Basis verschiedener Datenquellen herangezogen. Diese Kennziffern sind das Produkt von Analysen im Rahmen der Armutsforschung und Armutsberichterstattung. Zur Analyse von Einkommensarmut werden Haushaltsstudien benötigt, die entsprechende Armutsindikatoren erfassen. Um zudem Aussagen über individuelle Verläufe und somit die Dynamik von Armut machen zu können, müssen diese zusätzlich als Längsschnittdaten vorliegen.

Kennziffern bilden in der Sozialberichterstattung einen festen Bestandteil, um gesellschaftlich relevante Veränderungen zu beschreiben. Bei der Bestimmung von Kennziffern für eine Grundgesamtheit kann unter bestimmten Voraussetzungen auf Informationen einer Stichprobe dieser Grundgesamtheit zurückgegriffen werden. Mittels inferenzstatistischer Methoden können so Rückschlüsse auf die Grundgesamtheit gemacht werden. Beim Stichprobenverfahren können jedoch unterschiedliche Fehlerquellen Einfluss auf die Ergebnisse nehmen. Zum einen kann der Sampling Frame von der gewünschten Zielpopulation abweichen. Dies kann dazu führen, dass nur auf einen Teil der gewünschten Zielpopulation hochrechnet wird. Man spricht hier von Coverage Error. Wenn zudem nicht alle Personen des Sampling Frames die (korrekte) Chance haben in das Sample gezogen zu werden, kann Sampling Bias die Ergebnisse verzerren.Footnote 1 Auch Unit-Non-Response kann, falls die Ausprägungen der relevanten Merkmale der nicht befragten Personen von denen der befragten Personen abweichen, über Non-Response Error zu verzerrten Ergebnissen führen. Weitere Verzerrungen in Form von Adjustment Errors können durch Korrekturen (z. B. die Gewichtung) zustande kommen (Groves et al. 2009, S. 49 ff.).Footnote 2

Üblicherweise werden Armutsanalysen auf Basis von Befragungsdaten mit freiwilliger Teilnahme durchgeführt. Diese weisen spezifische Eigenschaften auf, welche bei der Interpretation der Ergebnisse zu berücksichtigen sind. Dies betrifft u. a. die Teilnahmebereitschaft sowie auch die Interviewsituation, bei der vor allem der Erhebungsmodus von Bedeutung ist. Z. B. kann das Thema einer Befragung die Bereitschaft einer Person zur Teilnahme an der Befragung beeinflussen. Dies führt dann zu sinkenden Unit-Non-Response-Raten. Und mit der Zahl der Befragungswellen nimmt die Kooperation bei der Befragung zu. Dies äußert sich vor allem in sinkenden Item-Non-Response-Raten als auch in einem Rückgang von gerundeten Angaben (Frick und Grabka 2010). Zudem gilt, dass die Befragungsqualität generell höher ist, wenn ein Interviewer bei der Befragung anwesend ist (Leeuw und Collins 1997).

Neben den oben bereits erwähnten Fehlern auf Seite der Stichprobenverfahren können bei der Erhebung von Informationen zudem Messfehler auftreten. Dabei stellt sich zunächst das Problem der Validität einer Messung, d. h. ob durch das Messinstrument tatsächlich das gemessen wird, was gemessen werden soll. Ein Messfehler auf Personenebene kann zudem durch spezifische Effekte, wie z. B. durch soziale Erwünschtheit, eintreten. Zusätzlich kann ein Processing Error, z. B. bei der Verkodung von offenen Angaben oder bei der Korrektur nicht plausibler Angaben, zu verzerrten Ergebnissen führen (Groves et al. 2009, S. 41 ff.).

Eine Möglichkeit den Ergebnissen mehr Sicherheit zuzuweisen ist es, eine Replikation mit unterschiedlichen Daten durchzuführen. Hierzu werden Ergebnisse auf Basis von mehreren verschiedenen Datensätzen, die Informationen über eine vergleichbare Grundgesamtheit zu einem vergleichbaren Zeitraum enthalten, gegenübergestellt. Die Replikation stellt die Wiederholbarkeit von Ergebnissen als eine Voraussetzung wissenschaftlichen Vorgehens in den Mittelpunkt und zielt darauf ab, durch die wiederholte Durchführung ähnlich angelegter Studien, die Zuverlässigkeit von Ergebnissen besser abschätzen zu können und die Grenzen der Aussagekraft der Ergebnisse einer Untersuchung zu identifizieren. Sie soll einen Hinweis darauf geben, inwieweit die Ergebnisse generalisierbar sind und ob die Ergebnisse nicht nur durch die studienspezifischen Bedingungen entstanden sind (King 1995).

Ein Vergleich der erfassten Armut zwischen zwei Haushaltspanelstudien kann einen Hinweis darauf geben, wie zuverlässig Armutsindikatoren auf Basis der ausgewählten Befragungsdaten sind. Dabei können Unterschiede auch auf Defizite in den Mikrodatenbasen hinweisen. Durch den regelmäßigen Abgleich mit anderen Datenquellen können potentielle Fehler so möglichst frühzeitig identifiziert und korrigiert werden.

Zwei Haushaltspanelstudien, die Armutsanalysen für Deutschland zulassen, sind das sozio-oekonomische Panel (SOEP) vom Deutschen Institut für Wirtschaftsforschung (DIW) und das Panel „Arbeitsmarkt und soziale Sicherung“ (PASS) vom Institut für Arbeitsmarkt- und Berufsforschung (IAB). Die beiden Studien weisen viele Gemeinsamkeiten, aber auch Unterschiede auf. Das SOEP wurde mit seinen derzeit 33 Erhebungswellen bereits regelmäßig für Armutsanalysen genutzt. Diese Studie deckt ein weites Themenspektrum ab, mit dem sich vielfältige sozial- und wirtschaftswissenschaftliche Fragestellungen untersuchen lassen. Das PASS stellt bislang zehn Wellen im Scientific-Use-File (SUF) bereit und eignet sich aufgrund des spezifischen Stichprobenaufbaus für Analysen im Niedrigeinkommensbereich, insbesondere für Untersuchungen zu Armutsübergängen. Auch die PASS-Studie ist thematisch breit aufgestellt, legt die Schwerpunkte allerdings auf Fragen in den Bereichen Erwerbsbeteiligung, soziale Teilhabe, Lebenslagen und Erfahrungen im Grundsicherungsleistungsbezug. Zwischen den beiden Studien ergeben sich zudem Unterschiede in der Erhebung von Armutsindikatoren und dem Aufbau der Stichproben. Die Ergebnisse von Armutsanalysen auf Basis dieser beiden Datenquellen lassen sich trotz der Unterschiede der beiden Studien gut miteinander vergleichen. Dies gilt besonders, da auf die Messung von Armut nach dem Ressourcenansatz anhand vergleichbarer Messinstrumente für eine vergleichbare Grundgesamtheit zu einem vergleichbaren Zeitraum zurückgegriffen werden kann.

Ziel dieser Arbeit ist es, die Ergebnisse von Armutsanalysen auf Grundlage der beiden Haushaltspanelstudien PASS und SOEP systematisch miteinander zu vergleichen. Zunächst werden in Abschn. 2 Indikatoren der Armuts- und Einkommensforschung beschrieben. In Abschn. 3 werden anschließend die in den Analysen verwendeten Daten genauer vorgestellt. Um die Ergebnisse auf Basis der Befragungsdaten PASS und SOEP besser einordnen zu können, wird an ausgewählten Stellen der Mikrozensus als Validierungsdatensatz herangezogen. Aufgrund der hohen Fallzahl und der Teilnahmepflicht weist diese Datenquelle auch am unteren Rand der Einkommensverteilung viele Beobachtungen auf. Anschließend werden in Abschn. 4 die Ergebnisse der einzelnen Analysen vorgestellt. Betrachtet werden Einkommensverteilungen, mehrere Armutsmaße, die identifizierten Armutsrisikoquoten von Subpopulationen, Armutsfaktoren, die Betroffenheit von dauerhafter Armut sowie Auf- und Abstiege. In Abschn. 5 folgt abschließend eine Einordnung der Befunde.

2 Indikatoren zur Analyse von Einkommensverteilung und Armut

Untersuchungen zur Armut in Deutschland ziehen häufig den indirekten Ressourcenansatz heran. Der Ressourcenansatz geht von den ökonomischen Mitteln aus, die eine potentielle Versorgungslage beschreiben. Unter Armut wird ein Mangel an Ressourcen verstanden. Das Konzept der Einkommensarmut beruht auf der Annahme, dass das Einkommen als zentrale Ressourcengröße maßgeblich für den Lebensstandard einer Person verantwortlich ist.

Zur Analyse von Einkommensverteilungen und Armut können verschiedene Maße herangezogen werden. Als gängige Maße für die Ungleichverteilung dienen die Lorenzkurve und der daraus abgeleitete Gini-Koeffizient. Die Lorenzkurve zeigt die statistische Verteilung anhand einer graphischen Darstellung. Dabei drückt die Fläche zwischen der perfekten Gleichverteilungsgerade und der beobachteten Lorenz-Kurve den Grad der Ungleichverteilung aus. Je größer diese Fläche ist, desto größer auch die Ungleichheit. Der Gini-Koeffizient gibt diesen Anteil mit einer Kennziffer zwischen 0 (absolute Gleichverteilung) und 1 (absolute Ungleichverteilung) wieder. Dieser lässt sich über die Formel

$$G=\frac{2\sum _{i=1}^{n}ix_{i}}{n\sum _{i=1}^{n}x_{i}}-\frac{n+1}{n}$$

berechnen, wobei \(x_{i}\) das Einkommen der Person \(i\) (bei nach dem Merkmal \(x\) sortierten Daten) und \(n\) die Anzahl der Personen in der Population ist.

Armutsanalysen gehen häufig von einer relativen Armutsgrenze aus. Dabei wird als arm klassifiziert, wer weniger als einen bestimmten Anteil des mittleren Einkommens aufweist. Das mittlere Einkommen wird dabei meist über den Median bestimmt, da dieser gegenüber extremen Werten am Rand der Verteilung robuster ist als das arithmetische Mittel. Neben der in Analysen hauptsächlich verwendeten Grenze bei 60 % – hierbei spricht man von der Armutsrisikogrenze – kann zusätzlich auch eine 40 % Grenze verwendet werden, um strenge Armut abzubilden.Footnote 3

Ein einfaches Armutsmaß besteht darin, die Anzahl der Personen zu zählen, die die Armutsschwelle unterschreiten und diese der Gesamtbevölkerung gegenüberzustellen. Hieraus ergibt sich die Armutsquote. Hierbei wird jedoch nicht die Einkommensverteilung innerhalb der Armutspopulation berücksichtigt. Anhand des so genannten FGT-Maßes (Foster et al. 1984) kann weiter differenziert werden und es lassen sich Aussagen über die Tiefe der Armut treffen. Die generelle Formel für das FGT-Maß lautet:

$$FGT\left(\alpha \right)=\frac{1}{N}\sum _{i=1}^{H}\left(\frac{z-y_{i}}{z}\right)^{\alpha }$$

Durch den Parameter \(\alpha\) wird bei den \(H\) Personen in Armut der \(N\) Personen in der Gesamtpopulation die Lücke zur Armutsschwelle gewichtet und tiefere Armut stärker ins Maß aufgenommen. Während bei der Armutsquote (FGT0: \(\alpha =0\)) der Abstand des individuellen Einkommens \(y_{i}\) zur Armutsschwelle \(z\) unberücksichtigt bleibt, stellt die Armutslücke (FGT1: \(\alpha =1\)) ein Maß für den durchschnittlichen Einkommensabstand zur Überwindung der Armutsgrenze dar. Sie gibt somit Auskunft über das Ausmaß der Armut. Bei der Berechnung der Armutsintensität (FGT2: \(\alpha =2\)) werden in Armut lebende Personen umso stärker gewichtet, je weiter ihr Einkommen unterhalb der Armutsgrenze liegt.

Zur Beschreibung der zeitlichen Dimension von Armut kann das Ausmaß an permanenter Armut ausgegeben werden. Permanent arm sind Personen, die sich dauerhaft im Armutsbereich befinden. Demgegenüber stehen Personen, die nur temporär arm waren oder nie von Armut betroffen sind. Die Dynamik von Armut lässt sich durch Übergangsraten in Armut bzw. aus Armut heraus beschreiben. Diese Raten geben an, wie hoch der Anteil der Personen ist, die den Armutsbereich von einem Jahr zum nächsten verlassen bzw. in den Armutsbereich eintreten.

3 Datenbasis: Sozio-oekonomische Panel (SOEP) und Panel „Arbeitsmarkt und soziale Sicherung“ (PASS)

Für die Analysen in dieser Untersuchung werden die beiden Haushaltspanelstudien SOEP und PASS verwendet.Footnote 4 Ein Vergleich der erfassten Armut nach dem Ressourcenansatz zwischen diesen beiden Befragungsdaten bietet sich aus drei Gründen an. Erstens werden die zur Verfügung stehenden Ressourcen in beiden Studien nach einem vergleichbaren Konzept erhoben. Zweitens lassen die erhobenen Informationen Rückschlüsse auf eine vergleichbare Grundgesamtheit zu. Und drittens sind die Informationen für einen vergleichbaren Zeitraum erfasst.

In den folgenden Analysen werden die Ressourcen über das zur Verfügung stehende monatliche Haushaltsnettoeinkommen definiert. Die Ergebnisse beziehen sich auf Personen in Privathaushalten in Deutschland. Die Untersuchung deckt einen Zeitraum von 2007 bis 2013 ab.

Das SOEP ist eine vom DIW seit 1984 jährlich durchgeführte Wiederholungsbefragung. Die Stichprobe umfasst im Untersuchungszeitraum pro Erhebungsjahr ca. 11.000 Haushalte mit ungefähr 20.000 Befragungspersonen. Das SOEP stellt eine Omnibusbefragung dar, bei der unter anderem die Themenschwerpunkte Arbeit, soziale Netzwerke, Gesundheit, Wohnen und Bildung kontinuierlich erhoben werden. Hierdurch lässt sich eine große Bandbreite von wissenschaftlichen Fragen bearbeiten. Die Auswahl der Befragten erfolgt über eine echte, mehrfach geschichtete Zufallsstichprobe, die aus mehreren Teilstichproben besteht. Im hier ausgewählten Untersuchungszeitraum (Welle X bis BD) stehen zwölf verschiedene Teilstichproben zur Verfügung.Footnote 5 Es wird ein Multi-Mode Verfahren angewendet, d. h. um die Teilnahmebereitschaft zu maximieren, wird angestrebt, den für den Befragten angenehmsten Interviewmode anzubieten. Dies ist typischerweise ein Face-to-Face Interview entweder in Papierform (Paper-and-Pencil Interview, PAPI) oder mit Hilfe eines Laptops (Computer Assisted Personal Interview, CAPI).Footnote 6 Des Weiteren stellt das SOEP die verwendeten Fragebögen in unterschiedlichen Sprachfassungen zur Verfügung, um die Teilnahmebereitschaft von Personen mit Migrationshintergrund zu erhöhen. Ausführliche Personeninterviews werden mit Personen über 16 Jahren durchgeführt. Der Median für die Interviewdauer liegt bei einem Personeninterview bei 30 Minuten. Einen Überblick über die Studie bietet Wagner et al. (2007).

Neben dem SOEP wird für die folgenden Untersuchungen das PASS, ein vom IAB im Rahmen der SGB-II-Forschung erhobenes Haushaltspanel, verwendet. Das PASS ist eine seit Ende 2006/Anfang 2007 jährlich durchgeführte Panelstudie. Der inhaltliche Aufbau der Befragung eignet sich besonders für Analysen zu Determinanten des Zugangs in den bzw. Abgangs aus dem Leistungsbezug des Arbeitslosengelds II (ALG II) und erlaubt detaillierte Beschreibungen und Analysen der Lebenslagen von Leistungsempfängern und Personen in einkommensschwachen Haushalten. Zudem werden Erfahrungen der Befragten mit den Jobcentern und detaillierte Informationen zur Qualität der Beschäftigung regelmäßig erhoben. Darüber hinaus sind u. a. die Themenbereiche Bildung, Erwerbstätigkeit, soziale Netzwerke, Gesundheit und Migration regelmäßig Bestandteil des Befragungsprogramms. Die Analysen werden mit den ersten sieben Wellen des PASS durchgeführt, die einen Zeitraum von 2006/2007Footnote 7 bis 2013 abdecken. Pro Erhebungswelle werden ungefähr zwischen 12.000 bis 19.000 Personen in 8000 bis 13.000 Haushalte befragt.

Das Erhebungsdesign der Studie besteht aus einer zweistufigen Zufallsstichprobe. Um Aussagen sowohl über die Population der ALG-II-Leistungsbezieher als auch über die Gesamtbevölkerung zuzulassen, startete das PASS mit zwei Teilstichproben. Für die erste Teilstichprobe wurden Bedarfsgemeinschaften aus Prozessdaten der Bundesagentur für Arbeit (BA) gezogen. Bei der zweiten Teilstichprobe handelt es sich um eine Bevölkerungsstichprobe mit überproportionaler Berücksichtigung einkommensschwacher Haushalte. Dies dient dem Ziel, auch die Einstiege in den Leistungsbezug mit einer ausreichend großen Fallzahl beobachten zu können. Um die Repräsentativität über die Zeit gewährleisten zu können, wird jedes Jahr eine Zugangsstichprobe von neuen Leistungsempfängern in die Erhebung mit aufgenommen. Diese enthält Personen, die im Juli des Vorjahres zum ersten Mal Leistungen nach dem SGB II erhalten haben. Somit setzt sich das PASS bis zur siebten Welle aus zehn Teilstichproben zusammen (vgl. Berg et al. 2014, S. 14 ff.).Footnote 8

Es wird versucht, innerhalb der ausgewählten Haushalte alle Personen ab einem Alter ab 15 Jahren zu interviewen. Die Befragung findet wahlweise in CAPI oder CATI (Computer Assisted Telephone Interview) statt. Im PASS können die Befragten zwischen verschiedenen Sprachversionen wählen. Neben dem Interview in deutscher Sprache, steht der Fragebogen auch in türkischer, arabischer oder russischer Sprache zu Verfügung.Footnote 9 Das Haushaltsinterview dauert rund 25 Minuten. Das Personeninterview hat eine Dauer von durchschnittlich 30 Minuten (Median). Es besteht die Möglichkeit, den Befragungsdaten Informationen aus den administrativen Daten der BA zuzuspielen. Einen kurzen Überblick über die Erhebung geben Bethmann et al. (2013) und Trappmann et al. (2013).

Bei beiden Stichproben handelt es sich um echte Zufallsstichproben, die sich aus mehreren Teilstichproben zusammensetzen. Das Auswahlverfahren ist in beiden Studien mehrstufig. Dabei wird die Grundgesamtheit in einem ersten Schritt in Primäreinheiten (primary sampling units) eingeteilt, aus denen wiederum in weiteren Schritten Folgeeinheiten gezogen werden (Schnell et al. 2011, S. 274). Wie bei allen freiwilligen Befragungen stellt sich auch beim SOEP und beim PASS das Problem der Befragungsbereitschaft. Die Selektion, die daraus entstehen kann, ist durch eine entsprechende Gewichtung auszugleichen, wie dies sowohl beim SOEP als auch beim PASS geschieht.Footnote 10 Für die Gewichtung werden im SOEP Randinformationen aus dem Mikrozensus herangezogen, die z. B. das Alter, das Geschlecht oder den Migrationsstatus der Befragten umfassen (Kroh 2010). Im PASS wird eine Kalibrierung an Eckwerte des Statistischen Bundesamts, an Eckwerte der Statistik der BA und an Eckwerte des Mikrozensus vorgenommen (Berg et al. 2014, S. 172 ff.). Zudem ergibt sich hier die Besonderheit, dass für die Ausfallsgewichtung auf Informationen aus den administrativen Daten der BA zurückgegriffen werden kann.

Ein wesentlicher Unterschied zwischen den beiden Längsschnittstudien liegt im Zeitpunkt der Studienbeginne. Da das SOEP bereits seit 1984 erhoben wird, nehmen einige Befragte im hier untersuchten Zeitraum schon seit fast 30 Jahren teil. Bei PASS wiederum wird auch die erste Erhebungswelle aus dem Jahr 2006/07 in die Analysen mit aufgenommen, wodurch für alle Personen immer auch die Erstbefragung enthalten ist (zur Qualität von Einkommensdaten in Panelumfragen siehe Frick et al. 2007). Da die Panelattrition vor allem zu Beginn einer Studie recht hoch ist, heißt dies, dass im hier verwendeten Beobachtungszeitraum beim PASS gegenüber dem SOEP mehr Befragte mit nur einer Erhebung enthalten sind.Footnote 11 Zudem ist bei Panelbefragungen mit besonderen Effekten mit der Teilnahmedauer (z. B. Lerneffekten bei bestimmten Fragen) zu rechnen. Dies kann besonders bei einem Vergleich mit dem ersten Erhebungsjahr (2007) Einfluss auf die Ergebnisse haben.

Im PASS findet die Feldphase in der Regel von Januar/Februar bis August/September statt, im SOEP vorwiegend von Februar bis Juni. Da die Feldphasen der einzelnen Wellen zwischen den beiden Studien nur gering voneinander abweichen, ist davon auszugehen, dass diese Unterschiede für einen Vergleich vernachlässigbar klein sind. Es wird zur besseren Darstellung im Folgenden jeder Erhebungswelle jeweils ein Kalenderjahr zugewiesen. Die Zuteilung ist in Tab. 1 zu sehen. Einen Effekt auf die Datenqualität kann auch die Organisation der Feldphase (z. B. das Interviewertraining) haben. PASS wird vom Befragungsinstitut infas durchgeführt, während im SOEP alle Teilsamples von Kantar public erhoben werden. Informationen über den Einfluss des Erhebungsinstituts auf die Datenqualität liegen uns aber nicht vor.Footnote 12

Tab. 1 Zuordnung der Wellen in PASS und SOEP zu den einzelnen Kalenderjahren

Zu Vergleichszwecken werden die Armutskennziffern auf Basis einer dritten Datenquelle herangezogen. Dabei handelt es sich um den Mikrozensus (MZ). Der MZ ist eine repräsentative Haushaltsbefragung der amtlichen Statistik in Deutschland. Rund 830.000 Personen in etwa 370.000 Haushalten werden stellvertretend für die gesamte Bevölkerung zu ihren Lebensbedingungen befragt. Dies entspricht 1 % aller Haushalte in Deutschland. Das Erhebungskonzept wurde ab Januar 2005 auf eine kontinuierliche Erhebung während des ganzen Jahres umgestellt. Wegen der gesetzlichen Auskunftspflicht, die bei den meisten Fragen besteht, besitzt der MZ bei Armutsanalysen einen besonderen Vorteil gegenüber freiwilligen Erhebungen. Die üblicherweise Untererfassung von einkommensschwachen Haushalten bei freiwilligen Erhebungen entfällt dadurch. Trotz dieser Auskunftspflicht liegt auch beim MZ Item-Non-Response bei der Frage nach dem aktuellen Haushaltsnettoeinkommen vor.Footnote 13 Auch kann vermutet werden, dass es durch verpflichtende Teilnahme vermehrt zu bewusst falschen Angaben kommt. Das Einkommen wird im MZ ausschließlich in Kategorien erhoben, wodurch Armutsanalysen nur eingeschränkt möglich sind. Der MZ als SUF ist aktuell bis zum Erhebungsjahr 2012 verfügbar. Da der MZ als rotierende Panelstichprobe angelegt ist, bei der die Haushalte vier Jahre in Folge befragt werden, können eingeschränkt auch Längsschnittanalysen durchgeführt werden. Trotz der ungenaueren Erhebung des Einkommens kann der MZ für Armutsanalysen verwendet werden (Gerhardt et al. 2009). Auch wenn der Mikrozensus nicht als verlässlichere Datenquelle für Armutsanalysen betrachtet werden kann, dienen die damit bestimmten Einkommens- und Armutsmaße auf Basis einer sehr hohen Fallzahl hier als Referenzgröße.

3.1 Messungen von Einkommen in SOEP, PASS und MZ

Zur Bestimmung der Einkommensarmut wird das bedarfsgewichtete Haushaltsnettoeinkommen (auch Äquivalenzeinkommen genannt) eines Haushalts herangezogen. Die Bedarfsgewichtung dient dazu, die Einkommenssituation zwischen Haushalten unterschiedlicher Zusammensetzung vergleichen zu können. Dabei werden den Personen im Haushalt je nach Alter unterschiedliche Bedarfsgewichte zugeteilt. Nach der modifizierten OECD-Skala wird der ersten erwachsenen Person im Haushalte ein Wert von 1 zugeteilt, jeder weiteren Person ab 14 Jahren ein Wert von 0,5 und jeder Person bis unter 14 Jahren ein Wert von 0,3. Durch die Gewichtung weiterer Haushaltmitglieder mit einem Wert kleiner eins wird angenommen, dass sich durch gemeinsames Wirtschaften Ersparnisse (so genannte Skaleneffekte) erzielen lassen. Grundlage für das bedarfsgewichtete Einkommen ist das einem Haushalt zur Verfügung stehende Nettoeinkommen. Das Haushaltsnettoeinkommen ist die Summe der persönlichen Nettoeinkommen aus sämtlichen Einkommensarten aller Haushaltsmitglieder (z. B. Lohn oder Gehalt, Unternehmereinkommen, Rente, Pension, öffentliche Unterstützungen, Einkommen aus Vermietung und Verpachtung, Kindergeld, Wohngeld, Transferleistungen für Unterkunft und Heizung, etc.). Dieses wird in beiden Studien in mehreren Varianten erfasst. Zum einen wird das zum Zeitpunkt der Befragung aktuelle monatliche HaushaltsnettoeinkommenFootnote 14, also die regelmäßigen Einkünfte nach Abzug von Steuern und Sozialabgaben zuzüglich erhaltener Sozialtransfers, durch den Haushaltsvorstand direkt erfragt. Dabei handelt es sich um das sogenannte Screener-Einkommen (siehe Anhang). Zum anderen werden – im PASS für den letzten Monat, im SOEP zusätzlich auch für das zurückliegende Jahr – alle individuellen (Brutto‑)Einkommen aller aktuell im Haushalt befragten Personen und deren gemeinsame Einkommen erhoben. Aus den aufsummierten Werten können, mit Hilfe einer Schätzung der Steuer- und Sozialabgaben und imputierter Werte für fehlende Angaben bzw. nicht befragungsbereiter Personen, die Jahresnettoeinkommen des Vorjahres bzw. Nettoeinkommen des Vormonats errechnet werden. Hierbei spricht man von Komponenten-Einkommen. Beim SOEP wird zudem der Mietwert selbstgenutzten Wohneigentums berücksichtigt sowie für Mieter mit subventionierter Miete auch der fiktive Einkommensvorteil gegenüber einer marktüblichen Miete erfasst (imputed rent) (Frick et al. 2010).

Es gilt die Einflüsse der beiden verschiedenen Arten der Einkommensmessung auf die Ergebnisse zu berücksichtigen. Beim direkt von einem Haushaltsmitglied erhobenen aktuellen Screener-Einkommen wird, vor allem mit zunehmender Haushaltsgröße, die Höhe des verfügbaren Einkommens eher unterschätzt, da bestimmte Einkommenskomponenten oder Einkommen von Haushaltsmitgliedern vergessen werden oder nicht bekannt sind (vgl. Groh-Samberg 2009, S. 127). In Goebel et al. (2009) werden Daten beider Einkommenskonzepte verwendet. In dieser Untersuchung wird darauf hingewiesen, dass es zwischen den beiden Konzepten aufgrund von Sonderzahlungen und Steuerrückzahlungen bei den Vorjahreseinkommen, als auch durch unterjährige Schwankungen beim Einkommensbezug z. B. aufgrund von saisonaler Arbeitslosigkeit, zu einer etwas höheren Ungleichheit und daher zu höheren Armutsquoten kommt. Es konnten aber abgesehen von diesen Niveaueffekten für beide Einkommenskonzepte dieselben Trends im zeitlichen Verlauf festgestellt werden.

Ein Vorteil des aktuellen Screener-Einkommens ist die Konsistenz von Haushaltsstruktur und Einkommen. Während beim Vorjahr als Bezugszeitraum eine Veränderung der Haushaltskonstellation möglich ist, wird beim aktuellen Monatseinkommen der gleiche zeitliche Bezugsrahmen von Soziodemografie und Einkommen verwendet. Auch dürfte es den meisten Personen (besonders bei Schwankungen im Einkommen) leichter fallen, valide Angaben zum aktuellen Monat zu machen als zum gesamten Vorjahr. Zudem erlaubt das Monatseinkommen eine bessere Vergleichbarkeit mit anderen Datenquellen wie z. B. dem MZ, der den gleichen Referenzzeitpunkt beim Haushaltseinkommen verwendet. Und auch die höhere Aktualität der Information spricht für diese Art der Einkommensmessung.Footnote 15

Eine wichtige Frage bei der Analyse von Einkommen betrifft den Umgang mit fehlenden Angaben. Werden Personen in Haushalten mit fehlenden Angaben aus den Analysen ausgeschlossen (Case-Wise-Deletion), kann dies zu verzerrten Schätzern führen, falls der Ausfallprozess nicht einem reinen Zufallsprozess unterliegt (Missing completely at random, MCAR). Ein Vorteil des Screener-Einkommens gegenüber dem Komponenten-Einkommen ist, dass nur bei einer Variablen fehlende Werte auftreten und entsprechend nur eine Einkommenskomponente imputiert werden muss, während beim Komponenteneinkommen sowohl bei jeder Einzelkomponente als auch bei jeder zu befragenden Person Non-Response auftreten kann.Footnote 16

Das Screener-Einkommen wird im SOEP auf Basis einer multiplen Imputation nach dem Chained-Equation Ansatz imputiert (Van Buuren und Groothuis-Oudshoorn 2000).Footnote 17 Beim PASS wurde das Einkommen in der ersten Welle nur als Screener-Einkommen erhoben. In den folgenden Wellen wurden zusätzlich die einzelnen Einkommenskomponenten erfasst, imputierte Werte stehen jedoch zurzeit nicht zur Verfügung. Im Mikrozensus werden das persönliche Nettoeinkommen der einzelnen Haushaltsmitglieder und das Haushaltsnettoeinkommen im Monat vor der Befragung in 24 Einkommensklassen erhoben. Item-Non-Response liegt trotz des verpflichtenden Charakters des MZ vor und wird nicht durch Imputation korrigiert.Footnote 18 Aufgrund dieser Erhebungsform bedarf es eines angemessenen Verfahrens zur Bestimmung der Armutsgrenze. Dabei wird den Haushalten nahe der Armutsschwelle eine Armutswahrscheinlichkeit zwischen 0 und 1 zugeordnet (für eine genaue Beschreibung des Verfahrens siehe Stauder und Hüning 2004 und Gerhardt et al. 2009). Eine wichtige Einschränkung des MZ betrifft die Verwendung von Proxyinterviews. Falls eine Person während der Feldphase nicht anzutreffen ist – vor allem im Falle von mobilen Personen wie junge Erwachsene, Pendler, etc. – werden im MZ auch Proxyinterviews eingesetzt, d. h. eine Referenzperson gibt stellvertretend Auskunft über die abwesende Person. Hierbei ist nicht auszuschließen, dass es zu einer Untererfassung der Erwerbs- und damit verbunden der Einkommenssituation des Haushalts kommen kann.

Bei den folgenden Analysen wird wegen der besseren Vergleichbarkeit das Screener-Einkommen verwendet, da nur dieses für alle drei Datenquellen vorliegt. Da für das PASS keine Imputationen bereit stehen, werden diese für die Analysen erstellt. Das Verfahren wird weiter unten im Abschnitt Datenaufbereitung beschrieben. Gegenüber dem komplexen Imputationsverfahren im SOEP handelt es sich bei den durchgeführten Imputationen um ein vergleichsweise simples Verfahren. Da der Anteil von Item-Non-Response verhältnismäßig klein istFootnote 19, wird die Bedeutung der Unterschiede in den Imputationsmethoden zwischen PASS und SOEP auf die folgenden Analysen als eher gering eingeschätzt.

3.2 Datenaufbereitungsschritte

Bevor die Armutsanalysen durchgeführt werden können, müssen die Datensätze vorbereitet werden. Hierfür gilt es, in den beiden Panelbefragungen spezifische Gegebenheiten zu beachten. Während im SOEP für das Screener-Einkommen imputierte Werte für fehlende Angaben zur Verfügung stehen, kann im PASS einem Großteil der Haushalte mit fehlenden Angaben durch die kategoriale Nachfrage ein Wert zugewiesen werden. Damit nicht alle Haushalte, die die gleiche Einkommenskategorie angegeben haben, einen identischen Wert zugewiesen bekommen (was u. a. zu Unschärfen bei der Bestimmung des Medians führen kann), werden Werte innerhalb des Wertebereiches der jeweiligen Kategorie vergeben. Die Verteilung orientiert sich an der gewichteten Verteilung der beobachteten Werte, die zwischen der jeweiligen Klassenober- und -untergrenze liegen. Für die restlichen Fälle wird eine regressionsbasierte Imputation durchgeführt. Hierbei wird für jede Erhebungswelle ein lineares Regressionsmodell mit den unabhängigen Variablen Wohnregion, Haushaltsgröße, Anzahl der erwachsenen Personen im Haushalt, Anzahl der erwerbstätigen Personen im Haushalt und Bezug von Arbeitslosengeld II im Haushalt und der zu erklärenden Variablen Haushaltsnettoeinkommen geschätzt.Footnote 20 Anhand der Koeffizienten kann für die Haushalte ohne gültige Einkommensangabe ein Wert vorhergesagt werden. Diesen vorhergesagten Werten werden beobachtete Residuen zufällig aufaddiert, um die Varianz des Schätzers zu erhalten. Im SOEP liegen fünf multiple Imputationen für das Screener-Einkommen vor. Daher werden auch fünf multiple Imputationen für das Screener-Einkommen im PASS erstellt, indem jeweils ein unterschiedliches Residuum auf den vorgesagten Wert aufaddiert wird. Da für die fehlenden Werte beim Screener-Einkommen multiple Imputationen zum Einsatz kommen, werden die Punktschätzer als Durchschnitt über die Imputationen und die Standardfehler aus der Varianz innerhalb der Imputationen (Within-Imputation) sowie der Varianz zwischen den Imputationen (Between-Imputation) berechnet (Krug 2010, S. 32 f.). Dieses Vorgehen wird bei der Berechnung der Armutskennziffern angewendet. Bei den weiteren Berechnungen wird die jeweils erste Imputation verwendet.

Für den Vergleich der Armutspopulationen werden verschiedene Gruppen von Merkmalsträgern gebildet. Diese befinden sich zum einen auf der Haushaltsebene. So werden Haushaltstyp, Haushaltsgröße, Arbeitslosengeld-II-Bezug im Haushalt, Wohnregion und Wohnstatus verglichen. Zum anderen handelt es sich um Merkmale auf der Personenebene. Hier werden Bildung, Gesundheitszustand, Migration, Erwerbsstatus, berufliche Stellung und Familienstand verglichen. Die Analysen werden alle auf der Personenebene durchgeführt. Für die Merkmale auf der Haushaltsebene werden die Analysen für alle Personen in den Haushalten durchgeführt. Für die Merkmale auf Ebene der Personen werden die Analysen nur für Personen ab 18 Jahren erstellt.Footnote 21

4 Empirische Analysen

4.1 Einkommensverteilungen

Für einen Vergleich mit den Einkommensangaben im MZ werden die Einkommensangaben aus SOEP und PASS in die beim MZ verwendeten Einkommensklassen eingeteilt. Dabei wird hier auf das Haushaltsnettoeinkommen vor Bedarfsgewichtung zurückgegriffen. Zudem wird auf die Verwendung von Imputationen verzichtet. Die kategorialen Angaben in PASS werden hier jedoch berücksichtigt. Hierdurch soll erkennbar werden, ob die Unterschiede bereits in den original erhobenen Screener-Einkommen ohne Korrektur durch Imputationen und Bedarfsgewichtung vorliegen. Abb. 1 gibt die Verteilung der Einkommen für die Jahre 2007 und 2012 wieder. Im Mittelpunkt stehen die Bereiche, bei denen stärkere Abweichungen in den Verteilungen zwischen SOEP und PASS beobachtet werden. Im Jahr 2007 liegen im Bereich bis 1100 € die Anteilswerte im MZ näher an denen im SOEP. Die Einkommensklasse von 1500 bis 1700 € weist im SOEP in 2007 um etwa zwei Prozentpunkte höhere Anteile auf als in den beiden anderen Studien. Dafür ist die Klasse von 1700 bis 2000 € im PASS etwas stärker besetzt. Im Jahr 2011 fallen die Unterschiede zwischen den drei Datenquellen geringer aus. Die Anteilswerte der unteren Einkommensklassen im PASS weichen nur noch geringfügig von denen im MZ ab. In einzelnen höheren Einkommensklassen liegen die Anteile bei PASS und SOEP (Klassen von 2000 bis 2600) über denen im MZ. Generell weist das PASS, aufgrund der Erhebung von Einkommensklassen bei der Nichtnennung der genauen Einkommenshöhe, nur einen vergleichsweise geringen Anteil von fehlenden Angaben auf.

Abb. 1
figure 1

Einkommensklassen in PASS, SOEP und MZ für die Jahre 2007 und 2012. (Quelle: PASS V1 2006–2013 Wellen 1 und 6, SOEPv30 Wellen X und BC & MZ 2007 und 2012, eigene Berechnung [gewichtet] und Darstellung)

In Abb. 2 sind die Verteilungen der Äquivalenzhaushaltsnettoeinkommen der sieben Erhebungsjahre für die Stichproben des SOEP (lang gestrichelte Linie) und des PASS (durchgezogene Linie) abgebildet. Für das erste Erhebungsjahr von PASS im Jahr 2007 lässt sich erkennen, dass die Verteilung im PASS gegenüber der Verteilung im SOEP leicht nach links verschoben ist. Es ist dabei im PASS ein höherer Anteil von Haushalten mit geringem Einkommen von unter 900 € und ein niedriger Anteil bei den Einkommen zwischen 1000 und 1300 € erkennbar. Im Jahr 2008 weichen die Verteilungen vor allem für den Wertebereich von 600 bis 1300 € voneinander ab. Bei den Einkommen unter 600 € haben sich die Verteilungen stärker angepasst. Im Jahr 2009 nähern sich die Kerndichteschätzer der beiden Erhebungen weiter an. Größere Unterschiede sind hier nur noch im Wertebereich zwischen 1000 und 1200 € erkennbar. In den Jahren 2010 bis 2013 weisen die beiden Einkommensverteilungen die stärksten Überschneidungen auf. Kolmogorow-Smirnow-Tests auf gleiche Verteilung der Einkommen weisen in allen Wellen signifikante Differenzen auf, welche sich aber von 0,064 im Jahr 2007 auf 0,020 im Jahr 2010 zunehmend verringern. In den darauffolgenden Jahren nehmen die Differenzen wieder leicht zu (bis 0,029 im Jahr 2013).

Abb. 2
figure 2

Kerndichteschätzer der Äquivalenzhaushaltsnettoeinkommen in PASS, SOEP und SOEP-Stichprobe H für die Jahre 2007 bis 2013. (Quelle: PASS V1 2006–2013 Wellen 1–7 & SOEPv30 Wellen X–BD, eigene Berechnung [gewichtet] und Darstellung)

Panelattrition tritt bei Panelstudien vor allem beim Übergang von der ersten auf die zweite Erhebungswelle auf. Davon ist das SOEP als langlaufende Panelstudie im hier untersuchten Beobachtungszeitraum nur eingeschränkt betroffen. Anders verhält es sich beim PASS, das erst im Jahr 2007 startete. Die hier beobachtete Annäherung der Kerndichteschätzer kann daher auch das Ergebnis eines Ausfallprozesses im PASS sein, der dazu führt, dass nach mehreren Erhebungswellen bestimmte Personengruppen in den zwei Stichproben nicht mehr ausreichend vertreten sind.

Um diese Überlegung zu prüfen, wird ein Vergleich der Einkommensverteilung im PASS mit der Stichprobe H des SOEP durchgeführt. Bei dieser Stichprobe handelt es sich um eine bevölkerungsrepräsentative Auffrischungsstichprobe die erstmals 2006 befragt wurde. Hier dürfte ein vergleichbarer Prozess der Panelattrition zu beobachten sein. Bei der Interpretation muss jedoch berücksichtigt werden, dass die Stichprobe H des SOEP bereits ein Jahr vor PASS zum ersten Mal befragt wurde. Die Einkommensverteilung der Stichprobe H des SOEP ist ebenfalls in Abb. 2 enthalten (kurz gestrichelte Linie). Hier deutet sich an, dass sich die Einkommensverteilungen zwischen der SOEP-Stichprobe H und der gesamten SOEP-Stichprobe stark ähnelt. Dies gilt vor allem für die Jahre 2007 und 2008. Ab dem Jahr 2009 werden die Unterschiede zur Einkommensverteilung in der PASS-Stichprobe geringer. Ab dem Jahr 2011 sind im Einkommensbereich von 500 bis 1200 € Abweichungen der Einkommensverteilungen zwischen der SOEP-Stichprobe H und den anderen beiden Stichproben zu erkennen und bleiben bis zum Jahr 2013 bestehen.

Neben der Verteilung der Einkommen kann auch die Ungleichheit der Einkommen betrachtet werden. In Abb. 3 sind die Lorenzkurven und Gini-Koeffizienten des Äquivalenzhaushaltsnettoeinkommen in SOEP und PASS für die einzelnen Jahre angegeben. Während beim SOEP der Gini-Koeffizient über die sieben Jahre relativ konstant ist, sind beim PASS stärkere Schwankungen erkennbar. Die größten Unterschiede zwischen den beiden Studien sind in den Jahren 2007 und 2008 zu erkennen. Analog zu der Entwicklung der Differenzen in den Einkommensverteilungen nehmen auch die Unterschiede in den Ungleichheitsmaßen zwischen den beiden Datenquellen über die Jahre ab. Ab dem Jahr 2010 überlappen sich die Konfidenzintervalle, auch wenn die Differenz im Jahr 2013 wieder leicht zunimmt.

Abb. 3
figure 3

Lorenzkurve und Gini-Koeffizient in PASS und SOEP für die Jahre 2007 bis 2013. (Quelle: PASS V1 2006–2013 Wellen 1–7 & SOEPv30 Wellen X–BD, eigene Berechnung [gewichtet] und Darstellung)

In Tab. 2 sind die Medianeinkommen als relevanter Bezugspunkt für die Armutsquotenberechnung und die sich daraus ergebenden Armutsrisikoschwellen sowie weitere Perzentile (10 %, 25 %, 75 % und 90 %) der Verteilung dargestellt.Footnote 22 Es ist zu erkennen, dass sich der Median zwischen SOEP und PASS am stärksten im Jahre 2007 (um 40 €) signifikant unterscheidet. In den Jahren 2008 bis 2013 liegen die Medianeinkommen der beiden Studien sehr nah beieinander. Zum Vergleich werden für die Jahre 2007 bis 2012 die Werte auf Basis der MZ-Stichprobe angegeben. Der Median im MZ liegt in allen sechs Jahren über den Werten in SOEP und PASS. Die 10 %-Perzentile liegen im PASS in allen Jahren unter den Werten im SOEP. Die Werte im MZ liegen durchgängig dazwischen. Die 25 %-Perzentile liegen im SOEP durchgängig über denen im PASS (außer im Jahr 2010) und ähneln denen im MZ. Bei den 90 %-Perzentilen weist das PASS in den meisten Jahren hingegen höhere Werte als das SOEP auf. Hier liegen die Werte im MZ näher bei denen im PASS. Insgesamt sind die Unterschiede zwischen den drei Datenquellen als relativ gering anzusehen. Dies gilt insbesondere vor dem Hintergrund, dass kategoriale Einkommensinformationen vorliegen (in PASS bei fehlenden Antwortangaben zum exakten Einkommen und im MZ für alle Befragten), die unter entsprechenden Annahmen in metrische Informationen überführt wurden.

Tab. 2 Medianeinkommen, Armutsrisikoschwellenwerte und Perzentile (in Euro) in PASS, SOEP und Mikrozensus für die Jahre 2007 bis 2013

4.2 Armutsmaße

Bei der Bestimmung der Ressourcenarmut werden die Armutsquote (FGT0), die Armutslücke (FGT1) und die Armutsintensität (FGT2) berechnet. In Abb. 4 sind diese Armutskennziffern nach der 60 % Armutsrisikogrenze für die sieben untersuchten Erhebungswellen in SOEP (Dreieck) und PASS (Kreis) abgebildet. Zudem sind die 95-Prozent-Konfidenzintervalle ausgewiesen. Für die Jahre 2007 bis 2012 sind auch die Werte im MZ (Rechteck) dargestellt.

Abb. 4
figure 4

Armutsrisikomaße in PASS, SOEP und MZ für die Jahre 2007 bis 2013. (Quelle: PASS V1 2006–2013 Wellen 1–7, SOEPv30 Wellen X–BD & MZ 2007–2012, eigene Berechnung [gewichtet] und Darstellung)

Bei der Kennziffer FGT0, welche die Armutsrisikoquote darstellt, sind deutliche Differenzen zwischen den Werten in den beiden Studien erkennbar. Diese sind besonders im Jahr 2007 ausgeprägt. Die Differenz der Punktschätzer beträgt 3,4 Prozentpunkte. Über die Jahre nähern sich die Werte einander an. Die Konfidenzintervalle überschneiden sich ab dem Jahr 2010. Im PASS werden durchgängig höhere Armutsrisikoquoten ausgegeben. Allerdings zeigen sich zwischen den beiden Datensätzen ähnliche Trends. So sind in beiden Studien ein Rückgang der Armutsrisikoquote in den Jahren 2009 sowie ein Anstieg im Zeitraum danach zu beobachten. Die im MZ ausgewiesene Armutsrisikoquote liegt durchgängig zwischen den Werten in SOEP und PASS.

Die durchgängig höheren Werte im PASS sind auch bei den weiteren Armutsmaßen FGT1 und FGT2 erkennbar. Auch hier nähern sich die Werte zwischen den Datenquellen über die Jahre einander an, allerdings vollzieht sich hier diese Entwicklung über den gesamten Beobachtungszeitraum. Überschneidungen der Konfidenzintervalle liegen ab dem Jahr 2010 (FGT1 und FGT2) vor. Die Werte des MZ liegen ebenfalls durchgängig zwischen denen in SOEP und PASS.Footnote 23

4.3 Bevölkerungsstrukturen und Armutsrisikoquoten von Subgruppen

Die drei Armutsmaße (FGT0 bis FGT2) unterscheiden sich zwischen den beiden Studien von 2007 bis 2009 signifikant voneinander. In einem nächsten Schritt wird versucht zu klären, wo die Quellen für diese Unterschiede liegen könnten. Um ein genaueres Bild zu erhalten, wird für das Jahr 2007 – das Erhebungsjahr mit den größten Unterschieden in den FGT-Werten – ein Blick auf die Verteilung einer Reihe zentraler soziodemographischer Charakteristika in der hochgerechneten Grundgesamtheit sowie den jeweiligen Armutsquoten in den Subpopulationen geworfen. Es werden dabei die Unterschiede zwischen SOEP und PASS nach Haushaltstyp, Haushaltsgröße, Arbeitslosengeld-II-Bezug, Wohnregion, Wohnstatus, Gesundheitszustand, Bildung, Migration, Erwerbsstatus, berufliche Stellung und Familienstand untersucht. Die Armutsrisikoquoten der Subpopulationen werden einander gegenübergestellt, um festzustellen, inwiefern die Armutsbetroffenheit der einzelnen Gruppen übereinstimmt. Um die Armutsrisikoquoten in den Subpopulationen zwischen den beiden Datensätzen besser vergleichen zu können, werden die Differenzen zur jeweils durchschnittlichen Armutsrisikoquote (PASS 16,4 %, SOEP 13,0 %) dargestellt. Dadurch soll erkennbar werden, ob es systematisch qualitativ unterschiedliche Armutsrisikogruppen gibt. Zur Kontrolle werden zusätzlich die Werte des MZ dargestellt.

Betrachtet man die Bevölkerungsstrukturen für die beiden Stichproben in Abb. 5, so zeigen sich bei den haushaltsbezogenen Merkmalen kaum signifikante Unterschiede.Footnote 24 Bei den Werten, die sich durch den MZ bestimmen lassen, kommt es nur zu geringfügigen Abweichungen mit Ausnahme des Bezugs von Arbeitslosengeld-II, der im MZ etwas geringer ausfällt. Bezogen auf die Armutsrisikoquoten innerhalb der Subpopulationen ergeben sich jedoch kaum nennenswerte Unterschiede.

Abb. 5
figure 5

Bevölkerungsstrukturen und Differenzen der Armutsrisikoquote in den Subpopulationen zur Gesamtarmutsrisikoquote (Haushaltsmerkmale) in PASS, SOEP und MZ für das Jahr 2007. (Quelle: PASS V1 2006–2013 Welle 1, SOEPv30 Welle X & MZ 2007, eigene Berechnung [gewichtet] und Darstellung)

Betrachtet man in Abb. 6 die Bevölkerungsstruktur für die Personen ab 18 Jahren, so zeigt sich im PASS ein signifikant höherer Anteil an Personen mit „Fachhochschulabschluss“. Bei einem „mittleren Schulabschluss mit beruflichen Bildungsabschluss“ sowie den „Hochschulabschlüssen“ hat hingegen das SOEP einen signifikant höheren Bevölkerungsanteil. Diese strukturellen Unterschiede spiegeln sich jedoch kaum in den Armutsrisikoquoten wider. Am auffälligsten – wenngleich statistisch nicht signifikant – ist hier der Unterschied in den Armutsrisikoquoten bei den Gruppen „Abitur ohne beruflicher Ausbildung“ und „Hauptschulabschluss ohne beruflicher Ausbildung“, wobei das PASS jeweils einen leicht höheren Wert aufweist.

Abb. 6
figure 6

Bevölkerungsstruktur und Differenz der Armutsrisikoquoten in den Subpopulationen zur Gesamtarmutsrisikoquote (Personenmerkmale) in PASS, SOEP und MZ für das Jahr 2007. (Quelle: PASS V1 Welle 1, SOEPv30 Welle X & MZ 2007, eigene Berechnung [gewichtet] und Darstellung)

Signifikante Unterschiede im Hinblick auf die Bevölkerungsstruktur finden sich auch beim GesundheitszustandFootnote 25, dem Migrationshintergrund und der beruflichen Stellung. Allerdings lassen sich nur bei Letzterem auch signifikante Unterschiede in den Abweichungen von den Armutsrisikoquoten beobachten (bei Beamten und Angestellten). Und auch beim Familienstand ergeben sich markante Unterschiede. So finden sich mehr als doppelt so viele „Ledige“ im SOEP, auch der Anteil der „Geschiedenen“ ist im SOEP signifikant höher. Im Gegenzug sind im PASS „Verheiratete“ weitaus häufiger vertreten. Die Unterschiede können daraus resultieren, dass im PASS die Frage zum Familienstand in der ersten Welle eine vergleichsweise hohe Anzahl von fehlenden Werten aufweist (ca. 5 %). Die Werte im SOEP decken sich größtenteils mit denen im MZ. In den Abweichungen von den durchschnittlichen Armutsrisikoquoten lassen sich hingegen keine Unterschiede erkennen.Footnote 26

4.4 Struktur- und Armutsquoteneffekte

Um genauere Aussagen machen zu können, ob die Unterschiede in den Armutsrisikoquoten entweder auf eine unterschiedliche Erfassung (bzw. Gewichtung) bestimmter Teilpopulationen oder auf ein unterschiedliches Armutsrisiko innerhalb der betrachteten soziodemographischen Gruppen zwischen den beiden Datensätzen zurückzuführen ist, kann die Differenz der Armutsrisikoquoten zwischen den Datensätzen in zwei Teile zerlegt werden. Bezeichnet \(p\) die Gesamtarmutsrisikoquote, \(i\) die Bevölkerungsgruppe, \(q_{i}\) den Anteil dieser Gruppe an der Bevölkerung, \(\Updelta q_{i}\) die Differenz der Gruppenanteile zwischen den beiden Studien und \(p_{i}\) die Armutsrisikoquote der Teilpopulation, lässt sich die Differenz der Gesamtarmutsrisikoquoten zwischen SOEP und PASS beschreiben als:

$$p^{\mathrm{SOEP}}-p^{\mathrm{PASS}}=\sum p_{i}^{\mathrm{SOEP}}\times \Updelta q_{i}+\sum p_{i}^{\mathrm{PASS}}\times \Updelta q_{i}$$

Die erste Summe kann dabei als Struktureffekt interpretiert werden, die zweite als Armutsrisikoquoteneffekt. Der Struktureffekt gibt einen Hinweis darauf, ob sich die Teilpopulationen zwischen den Datensätzen unterscheiden, während der Armutsrisikoquoteneffekt einen Hinweis darauf gibt, ob in den Datensätzen unterschiedliche Anteile an Personen von Armut betroffen sind (vgl. Becker et al. 2008). Diese Zerlegung wird hier für die Merkmale vorgenommen, bei denen zwischen den beiden Datensätzen große Abweichungen in der Bevölkerungsstruktur oder der Armutsrisikoquote vorliegen. Hierzu zählen das Bildungsniveau, der Familienstand und die Form der Beschäftigung.Footnote 27 In Tab. 3 sind die Ergebnisse für die Jahre 2007 und 2010 dargestellt. Während in 2007 deutliche Unterschiede in den Armutskennziffern zu erkennen sind, kommt es bis 2010 zu einer klaren Annäherung.

Tab. 3 Differenzzerlegung in Struktur- und Armutsquoteneffekte in PASS und SOEP für die Jahre 2007 und 2010

Zum einen wird berechnet, wie sich die Armutsrisikoquote im PASS verändert, wenn man die Bevölkerungsanteile des SOEP unterstellt (Struktureffekt). Wäre z. B. für das Jahr 2007 die Struktur des Bildungsniveaus im PASS identisch mit der im SOEP, so würde sich die Differenz in der Armutsrisikoquote um knapp 0,7 Prozentpunkte verringern. Der Armutsrisikoquoteneffekt gibt an, um wie viel sich die Gesamtarmutsrisikoquote im SOEP verändert, wenn die Armutsrisikoquoten vom PASS verwendet werden. Hier ist der Effekt beim Bildungsniveau weitaus größer und beträgt 3,1 Prozentpunkte. Der Gesamteffekt ergibt sich aus der Summe von Struktureffekt und Armutsrisikoquoteneffekt.Footnote 28 Der Gesamteffekt beläuft sich damit auf knapp 3,8 Prozentpunkte und ist besonders stark bei Personen mit Hauptschulabschluss (1,2 Prozentpunkte ohne berufliche Ausbildung und 1,0 Prozentpunkte mit beruflicher Ausbildung). Es ist erkennbar, dass die Differenzen zum größten Teil auf den Armutsrisikoquoteneffekt zurückzuführen sind. Die Struktureffekte sind im Vergleich dazu nur sehr gering.

Beim Familienstand wiederum ist dagegen ein deutlicher Struktureffekt erkennbar, der mit minus drei Prozentpunkten besonders stark bei der Gruppe der „Ledigen“ ausgeprägt ist. Bei dieser Gruppe ergibt sich, wie auch bei der Gruppe der „Verheirateten“, ein starker Armutsrisikoquoteneffekt von jeweils über 2 Prozentpunkten. Der Gesamtstruktureffekt von −1,9 Prozentpunkten wirkt in diesem Fall dem Armutsrisikoquoteneffekt von 5,6 entgegen, so dass sich ein Gesamteffekt von 3,7 Prozentpunkten ergibt.

Betrachtet man die Zerlegung nach der beruflichen Stellung für erwerbstätige Personen ist nur ein geringer Gesamtstruktureffekt von −0,2 Prozentpunkten und ein moderater Armutsrisikoquoteneffekt von 1,9 Prozentpunkten erkennbar, wobei Beamte sich in den beiden Studien sowohl in der Struktur als auch in der Armutsrisikoquote kaum unterscheiden. Am auffallendsten sind die Ergebnisse bei Arbeitern, da der Struktur- und Armutsrisikoquoteneffekt nahezu gleich groß ist, jedoch unterschiedliche Vorzeichen aufweist. Insgesamt ergibt sich ein Gesamteffekt von 1,7 Prozentpunkten.

Vergleicht man die Gesamteffekte für die drei soziodemographischen Indikatoren über die Zeit, so nimmt die Größe dieses Wertes zwischen 2007 und 2010 jeweils ab. Macht im Jahr 2007 der Gesamteffekt beim Bildungsniveau 3,8 Prozentpunkte aus, so sinkt dieser in 2010 auf 2,3 Prozentpunkte. Dies ist vor allem auf eine Reduzierung des Armutsrisikoquoteneffekts von 3,1 auf 1,9 Prozentpunkte zurückzuführen. Der Gesamteffekt in 2010 ergibt sich weiterhin größtenteils durch die Gruppen der Personen mit Hauptschulabschluss (ohne beruflichen Abschluss 0,8 Prozentpunkt und mit beruflichen Abschluss 0,6 Prozentpunkte). Und auch beim Familienstand sinkt der Gesamteffekt von 3,7 auf 2,3 Prozentpunkte, was sich vor allem aus einer Veränderung des Armutsrisikoquoteneffekts von 5,6 auf 3,5 Prozentpunkte ergibt. Innerhalb dieser Gruppe fallen die Verheirateten auf, da die Struktur- und Armutsrisikoquoteneffekte jeweils einen Prozentpunkt ausmachten und sich ein Gesamteffekt von zwei Prozentpunkten ergibt. Bei der Form der Beschäftigung verschwindet der Struktureffekt komplett und der Gesamteffekt, der sich ausschließlich aus dem Armutsrisikoquoteneffekt ergibt, beträgt −0,7 Prozentpunkte. Wiederum stechen die Arbeiter hervor, deren Gesamteffekt sich auf −1,6 Prozentpunkte summiert.

4.5 Armutsrisikofaktoren

Im Folgenden wird eine multivariate Regressionsanalyse (Probit-Modell) des Armutsrisikos in Abhängigkeit von möglichen soziodemografischen Einflussfaktoren durchgeführt. Um die statistische Power zu erhöhen, wird die Analyse über gepoolte Daten der Jahre 2007 bis 2013 durchgeführt. Die Daten von SOEP und PASS werden in einem gemeinsamen Modell verwendet, wobei über Interaktionenterme separate Koeffizienten für die SOEP-Stichprobe und die PASS-Stichprobe bestimmt werden und gleichzeitig geprüft wird, ob die auftretenden Unterschiede signifikant sind. Hierdurch kann der Einfluss einzelner Determinanten für die beiden Datensätze quantifiziert und gleichzeitig miteinander verglichen werden. In dem Modell wird die Wahrscheinlichkeit geschätzt, mit der eine Person beim Vorliegen eines bestimmten Merkmals unter Berücksichtigung aller anderen Variablen als armutsrisikogefährdet gilt. Für eine einfachere Interpretation und um eine Vergleichbarkeit der Effekte mit anderen Modellen zu gewährleisten, werden Average Marginal Effekts geschätzt (vgl. Auspurg und Hinz 2011; Best und Wolf 2012).Footnote 29 Jeder beobachtete Haushalt wird nur einmal in die Analyse aufgenommen, da bei Mehrpersonenhaushalten keine Unabhängigkeit der abhängigen und der unabhängigen Variablen zwischen den Haushaltsmitgliedern gegeben ist.

Zunächst zeigt sich in Tab. 4, dass der Unterschied in der Armutsrisikoquote auch im multivariaten Modell bestehen bleibt und mit −2,5 Prozentpunkten signifikant ist. Dieser Unterschied ist also auch nach Kontrolle der Verteilung der im Modell berücksichtigten unabhängigen Variablen gegeben. Die relevanten Einflussfaktoren sind in beiden Datensätzen annähernd die gleichen. Die Wirkungsrichtung stimmt bei allen signifikanten Faktoren überein. Signifikante Unterschiede in den Effektgrößen ergeben sich bei der Altersgruppe der über 64-Jährigen, Personen mit Berufsabschlüssen, der Wohnregion Ostdeutschland, Mehrgenerationen-Haushalten und nichterwerbstätigen Personen.

Tab. 4 Korrelate des Armutsrisikos in PASS und SOEP für die Jahre 2007 bis 2013

Die Modelle zeigen einen negativen Effekt – und damit eine geringere Wahrscheinlichkeit armutsgefährdet zu sein – für ältere Menschen, FrauenFootnote 30, für Personen mit Berufsabschluss bzw. Hochschulabschluss, Besitzer von Wohneigentum und für in Partnerschaft lebende Personen. Ein höheres Risiko von Armut bedroht zu sein haben Personen mit schlechtem Gesundheitszustand, Personen mit direktem Migrationshintergrund, in den neuen Bundesländern lebende Personen, Alleinerziehende und Personen in Mehrgenerationen-Haushalten (nur im SOEP) sowie Personen die keiner Vollzeiterwerbstätigkeit nachgehen, hier insbesondere Nichterwerbstätige. Leichte Unterschiede ergeben sich jedoch, mit welcher Irrtumswahrscheinlichkeit ein Effekt signifikant von Null abweicht. Dies ist aber natürlich auch den unterschiedlichen hohen Fallzahlen geschuldet. Insgesamt zeigt sich, dass man bei dieser multivariaten Analyse mit beiden Datensätzen zu sehr vergleichbaren Ergebnissen kommt.

4.6 Permanente Armut und Übergangsraten

Um die spezifischen Vorteile zu nutzen, die sich durch die Paneldatenstruktur der beiden Studien ergeben, wird abschließend noch ein Blick auf das Ausmaß dauerhafter Armut und die Dynamik innerhalb der Armutspopulationen geworfen. Aus einer zeitlichen Perspektive lässt sich zwischen Personen unterscheiden, die über einen längeren Zeitraum nie, vorübergehend oder dauerhaft von Armut betroffen sind. Während bei vorübergehender Armut – auch transitorische Armut genannt – eine zumindest zeitweise Teilhabe am gesellschaftlichen Zusammenleben möglich ist, stellt permanente Armut eine extreme Ausgrenzung der betroffenen Personen dar.

In Tab. 5 sind die beobachteten Jahre in Armut im Zeitraum von 2007 bis 2013 wiedergegeben. Grundlage ist ein balanciertes Panel, d. h. es gehen nur Personen in die Analyse ein, für die in allen sieben Jahren ein realisiertes Interview vorliegt. Der Anteil an Personen, die in den sieben Jahren nie von Armut betroffen sind, liegt im SOEP deutlich über dem im PASS. Die Konfidenzintervalle der beiden Werte überlappen sich nur knapp. Im PASS liegen die Anteile der Personen, die 1 bis 2 Jahre, 3 bis 4 Jahre oder 5 bis 7 Jahre armutsgefährdet sind, höher als im SOEP. Die Gruppen weichen aber nicht stark voneinander ab, d. h. in beiden Erhebungen wird ein vergleichbar hohes Ausmaß an transitorischer als auch permanenter Armut gemessen. Diese Ergebnisse sagen aber noch nicht viel über die Dynamik im Armutsbereich aus. Denn Personen mit mehreren Jahren Armutserfahrungen können entweder längere Armutsepisoden am Stück oder häufige Wechsel in und aus dem Armutsbereich aufweisen.

Tab. 5 Anzahl an Jahren in Armut in den sieben beobachteten Jahren (2007–2013) in PASS und SOEP

Daher wird zusätzlich ein Blick auf die Dynamik im Armutsbereich geworfen. Die Dynamik gibt Auskunft darüber, wie innerhalb einer Gesellschaft die Chancen und Risiken der Einkommensverbesserung bzw. -verschlechterung sind. Die Veränderung von Einkommenspositionen im Zeitverlauf gibt einen Hinweis darauf, ob defizitäre Positionen überwunden werden können und welchem Risiko Haushalte und Personen ausgesetzt sind, in unzureichende Einkommenslagen abzusteigen. Wir konzentrieren uns hier auf eine Analyse der Aufstiege aus bzw. Abstiege in den Armutsrisikobereich. Das PASS, das durch seine spezifische Stichprobenzusammensetzung eine hohe Fallzahl von Haushalten und Personen mit niedrigen Einkommen aufweist, ist unter anderem für solche Analysen konzipiert worden.

Es wird hierfür untersucht, wie hoch der Anteil an Personen ist, die von einem Jahr zum nächsten den Armutsbereich verlassen bzw. in den Armutsbereich gewechselt sind. Tab. 6 zeigt, dass sowohl die Aufstiegsraten als auch die Abstiegsraten in den meisten Jahren im PASS höher liegen. Signifikante Unterschiede liegen aber nur bei den Personen mit einem Abstieg in Armutsrisiko für die Jahre 2008 und 2012 vor.

Tab. 6 Aufstiege aus dem Armutsbereich und Abstiege in den Armutsbereich in PASS und SOEP für die Jahre 2008 bis 2013

5 Fazit

In der Armutsberichterstattung werden zur Beschreibung der aktuellen Lage häufig deskriptive Statistiken herangezogen. Um Aussagen über das Ausmaß und die Veränderung von Armut machen zu können, bedarf es einer validen Datengrundlage. Hierfür eignen sich Informationen zum Einkommen eines Haushaltes, die im Rahmen von Haushaltpanelbefragungen erhoben werden. Allerdings sind solche Informationen immer mit bestimmten Unsicherheiten behaftet und potenziellen Fehlerquellen ausgesetzt. So kann es sein, dass sich die Ergebnisse auf Basis zweier Studien, die mit vergleichbaren Messinstrumenten für eine vergleichbare Grundgesamtheit für einen vergleichbaren Zeitraum Informationen erheben, voneinander abweichen. Dies kann auch für Maße zur Beschreibung von Armut gelten. Um die Aussagekraft von Ergebnissen zu Armut auf Basis dieser Datengrundlagen besser einschätzen zu können, bietet sich ein Vergleich der Ergebnisse auf Basis unterschiedlicher Studien an.

In dem hier untersuchten Fall können Unterschiede in den Einkommensverteilungen und teilweise signifikante Abweichungen zwischen PASS und SOEP in den Armutsmaßen FGT0, FGT1 und FTG2 vor allem im Zeitraum 2007 bis 2009 – den ersten drei Erhebungswellen des PASS – festgestellt werden. Als Gründe hierfür können verschiedene Quellen vermutet werden, die sich nicht alle abschließend überprüfen lassen. So können beim Stichprobenverfahren sowie beim Messverfahren studienspezifischen Unterschiede auftreten. Erklärungen lassen sich teilweise durch spezifische Eigenschaften der Studien finden. So sind auf Grund des Stichprobendesigns im PASS mehr Fälle im unteren Einkommensbereich vorhanden. Im SOEP hingegen stehen insgesamt mehr Fälle zur Verfügung. Das Studiendesign sowie bestimmte Ausfallprozesse werden in der Gewichtung berücksichtigt, wodurch Aussagen über die Gesamtpopulation möglich sein sollen.

Über die Zeit kann eine Annäherung des erfassten Armutsrisikos in den beiden Studien beobachtet werden. Hierfür können zwei Erklärungen dienen. Entweder kann es aufgrund der schlechteren Datenqualität bei den Einkommensangaben in den ersten Erhebungswellen zu einer Verzerrung der Armutsrisikoquote kommen. Dies würde bedeuten, dass die Armutsrisikoquote im PASS im Jahr 2007 weiter vom wahren Wert entfernt liegt und sich mit zunehmenden Erhebungswellen dem wahren Wert nähert. Dies könnte u. a. daran liegen, dass Befragte in einer ersten Welle mit dem Ablauf der Befragung, den befragten Inhalten als auch mit dem Interviewer nicht vertraut sind. Dies führt häufig zu mehr Antwortverweigerungen, mehr gerundeten Angaben oder auch falschen Antworten aufgrund von Verständnisproblemen. In den folgenden Wellen nehmen diese Probleme ab und die Qualität der Antwortangaben steigt, da u. a. Befragte Unterlagen wie Lohnbescheide für die Interviews heranziehen und abgefragte Beträge direkt aus Lohnzetteln übertragen. Hierfür spricht, dass in den Jahren 2007 und 2008 die Armutsmaße im SOEP näher an denen im ebenso bevölkerungsrepräsentativen MZ liegen.

Andererseits kann es auch zu einer Verzerrung der Armutsrisikoquote in Folge der Panelausfälle kommen. Bestimmte Gruppen, die von Armut stärker betroffen sind, nehmen in den Folgebefragungen weniger wahrscheinlich teil. Falls diese Ausfälle mit bestimmten Ereignissen wie Jobverlust oder Veränderungen der Haushaltskonstellation – Ereignisse, die wiederum das Armutsrisiko erhöhen können, – verbunden sind, wird dies durch die Gewichtung eventuell nicht hinreichend korrigiert und die Armutsrisikoquote in der Folge unterschätzt. Dann würde sich die Armutsrisikoquote im PASS aufgrund der Ausfälle in den Wellen nach der Ersterhebung zunehmend vom wahren Wert entfernen.Footnote 31 Für diese Annahme spricht, dass in PASS im Jahr 2011 eine Auffrischung der Stichprobe stattgefunden hat und in diesem Jahr auch ein Wiederanstieg der Armutsrisikoquote zu erkennen ist.

Welche der Erklärungen zutrifft, lässt sich hier nicht abschließend klären. Es lassen sich darüber hinaus jedoch auch viele Ergebnisse finden, die sich zwischen den beiden Studien stark ähneln. So ist die Struktur des Armutsrisikos in großen Teilen vergleichbar, wenn auch die Armutsrisikoquoten im PASS durchschnittlich höher liegen. Bei einem Vergleich der Ergebnisse multivariater Analysen lassen sich große Gemeinsamkeiten zwischen den beiden Panelstudien feststellen. Bei der Dauer und Dynamik von Armut liegen nur wenig signifikante Unterschiede vor, im PASS wird aber eine durchweg höhere Mobilität in Armut und aus Armut heraus beobachtet.

Es muss aber auch festgehalten werden, dass bei einigen Analysen eine recht hohe statistische Unsicherheit vorliegt. Dadurch können auch größere Unterschiede zwischen den Studien nicht als statistisch gesichert eingestuft werden. Dies kann gerade bei Längsschnittanalysen aufgrund sinkender Fallzahlen ein Problem darstellen.

Betrachtet man die Gemeinsamkeiten und Unterschiede in den Ergebnissen, so lässt sich insgesamt ein sehr ähnliches Bild der Armut in Deutschland in den Jahren 2007 bis 2013 gewinnen. Die sozialpolitischen Implikationen zum Thema Armut, die auf Basis der beiden Studien abgeleitet werden, dürften sicherlich sehr vergleichbar ausfallen und die Gefahr, dass konträre Empfehlungen ausgesprochen würden, ist als gering einzustufen.

Für ArmutsforscherInnen, die auf die beiden Datenquellen SOEP und PASS zurückgreifen möchten, kann folgende Empfehlung gegeben werden: Beide Datenquellen sind grundsätzlich geeignet das Ausmaß an Armut(-srisiko) und Armutsmobilität in Deutschland angemessen zu beschreiben. Zu berücksichtigen ist jedoch, dass bei Längsschnittstudien besonders in den ersten Jahren nach Studienbeginn Prozesse stattfinden, die auch die Ergebnisse von Armutsanalysen beeinflussen können. Inwieweit dies allerdings zu verzerrten Ergebnissen führt, ist hier nicht eindeutig zu klären. Zudem können geringe Fallzahlen die Interpretation von zeitlichen Entwicklungen erschweren, da sich diese häufig im Bereich der statistischen Unsicherheit bewegen.

In dieser Untersuchung konnte nicht im Detail auf die einzelnen potenziellen Fehlerquellen im gesamten Prozess der Erhebung und Aufbereitung der Daten eingegangen werden. Es ist sicher sinnvoll, die im Rahmen der Total-Survey-Error-Forschung benannten potenziellen Fehlerquellen auf ihren Einfluss auf die Ergebnisse von Armutsanalysen genauer hin zu untersuchen.

Insgesamt kann aus den Ergebnissen dieser Untersuchung eine hohe Bedeutung für die Verwendung verschiedener Datenquellen für die Analyse von Armut abgeleitet werden. Die Replikation von Forschungsarbeiten ermöglicht zudem, Ergebnisse besser einschätzen zu können und sich die Grenzen der Interpretation bewusst zu machen. Basierend auf den Erkenntnissen dieser Untersuchung empfiehlt es sich, Vergleiche zwischen verschiedenen Studien, die sich zur Analyse von Armut eignen, zu wiederholen, um so ein noch differenziertes Bild des Einflusses studienspezifischer Gegebenheiten zu erhalten. Zudem sollten wiederholt vergleichbare Arbeiten wie diese zur Erfassung der Datenqualität durchgeführt werden, um möglichst frühzeitig potentielle Defizite in den Mikrodatenbasen identifizieren zu können und diese zu korrigieren.