Der Six-Item Screener (SIS) ist ein etwa einminütiger Kognitionstest ohne Materialeinsatz. Auch die geringe Patientenbelastung macht den Test attraktiv für den Einsatz in der stationären Aufnahme geriatrischer Patienten. Die in der Forschungsgruppe Geriatrie Lübeck 2012 entwickelte, kulturell adaptierte Version ist die erste von Callahan autorisierte deutsche Übersetzung. Ziel der vorliegenden Studie ist die Bestimmung der Gütekriterien Reliabilität, Validität und Änderungssensitivität des SIS als Instrument des geriatrischen Assessments zur Erfassung kognitiver Störungen.

Grundlagen

Der SIS wurde von Callahan et al. [6] eingeführt, um in der Rekrutierungsphase von Studien ggf. kognitive Störungen als Ausschlusskriterium zu erfassen. Er ist auch telefonisch durchführbar. Die Auswertung erfolgt mithilfe der Summierung der Anzahl korrekter Antworten. Die Autoren empfehlen die Anpassung des Grenzwerts an die Intention der Testung.

Callahan et al. validierten den SIS an 2 Stichproben: 344 Afroamerikanern aus der Allgemeinbevölkerung (Alter 65 bis 99 Jahre, Mittelwert 74,4 Jahre, 59,4 % Frauen, 4,3 % mit Demenz im Sinne alltagsrelevanter kognitiver Störung) und 651 Patienten eines Alzheimer-Zentrums (Alter 21 bis 92 Jahre, Mittelwert 69,6 Jahre, 57,1 % Frauen, 53,0 % mit Demenz). Mit der klinischen Diagnose als Referenzstandard ergaben sich bei Unterschreiten von 4 Punkten (5 Punkten) für die Diagnose einer Demenz eine Sensitivität von 88,7 % (96,8 %) und eine Spezifität von 88,0 % (68,6 %) in der Allgemeinbevölkerung bzw. von 80,6 % (89,6 %) und 90,9 % (79,4 %) im Alzheimer-Zentrum. In anderen Studien [7, 14, 20] wurden z. T. stark abweichende Ergebnisse gefunden; die Vergleichbarkeit war durch die Wahl anderer Grenzwerte oder Referenztests oder einer differenten Zusammensetzung der Studienpopulation reduziert.

Die von Callahan verwendeten Items wurden in einer „Item-response“-Analyse der bekannteren Mini-Mental State Examination (MMSE, [9, 11]) als die sensitivsten für die Erkennung von Frühsymptomen einer Alzheimer-Demenz ermittelt [8]. Sie schlugen bis zu 4 Jahre vor klinischem Krankheitsbeginn an [2]. Die Inhaltsvalidität ist hierdurch für den SIS belegt. Aufgrund der simplen Durchführung und Auswertung ist der Test für Untersucher leicht erlernbar und eine höhere Objektivität auszunehmen als bei der deutlich untersucherabhängigen MMSE [5, 21].

Studiendesign und Untersuchungsmethoden

Studiendesign

In die monozentrische, diagnostische prospektive Kohortenstudie wurden gemäß positivem Votum der Ethikkommission der Medizinischen Fakultät Dresden (EK 113032015) alle in der Rekrutierungsphase im Krankenhaus Rotes Kreuz Lübeck – Geriatriezentrum konsekutiv stationär aufgenommenen Patienten inkludiert, bei denen keine Ausschlusskriterien (mangelnde Kommunikationsfähigkeit gemäß dem aufnehmenden Arzt, fehlende schriftliche Einwilligung) vorlagen. Als Referenzstandard zur Bestimmung der Sensitivität und der Spezifität diente das klinische Arzturteil.

Für die konvergente Validität wurden die MMSE, der Uhrentest nach Shulman („clock-drawing test“, CDT) [18, 19] und Untertests des Regensburger Wortflüssigkeitstests (RWT, [1]) eingesetzt, für die diskriminante Validität die Montgomery-Åsberg Depression Rating Scale (MADRS, [13]).

Der erste SIS (SIS1) wurde im Rahmen der Aufnahmeuntersuchung vom Arzt durchgeführt, alle weiteren Kognitionstests von einer Doktorandin. An Tag 3 erfolgten SIS2 und RWT1, an Tag 4 MMSE1 und CDT1, an Tag 5 SIS3 und randomisiert an Tag 15 SIS4 und RWT2, an Tag 16 MMSE2 und CDT2 oder in entgegengesetzter Reihenfolge (Abb. 1). Für die Validität wurde SIS1 betrachtet, für die Reliabilität SIS2 mit SIS1 und SIS3 verglichen, für die Änderungssensitivität der Verlauf von MMSE und CDT mit SIS1 und SIS4. Das Ergebnis der MADRS wurde der Patientenakte entnommen.

Für die statistische Auswertung wurde das Signifikanzniveau α ≤ 0,05 gewählt. Die Analysen wurden mithilfe von IBM SPSS Statistics 22 durchgeführt.

Abb. 1
figure 1

Zeitliche Verteilung der Durchführung kognitiver Tests

Referenzstandard Arzturteil

Als Referenzstandard für die Diagnose einer kognitiven Störung wurde das klinische Arzturteil festgelegt. Während der behandelnde Arzt aus ethischen Gründen hinsichtlich des kognitiven Assessments nicht verblindet wurde, blieben die Ergebnisse dem Geriater, der das klinische Gesamturteil festlegte, vorenthalten. Er stützte sein Urteil sowohl auf die Entlassungsdiagnosen als auch die Gesamtheit der weiteren im Arztbrief transportierten Informationen hinsichtlich kognitiver Fähigkeiten: Flüssigkeit und Korrektheit anamnestischer Angaben, Orientierung in allen Qualitäten, subjektive Einschätzung des Gedächtnisses, Hinweise Angehöriger, selbstständige Lebensführung vor Krankenhausaufnahme, Informationen der Mitglieder des therapeutischen Teams zu Mitarbeit und Lernfähigkeit, Notwendigkeit der Hilfestellung bei der Bedienung von Hilfsmitteln und der Medikamenteneinnahme, Störungen des Tag-Nacht-Rhythmus und andere Verhaltensauffälligkeiten.

Es erfolgte eine 3‑stufige Einordnung in „kein Hinweis auf kognitive Störung“, „Verdacht auf/leichte kognitive Störung“ und „alltagsrelevante kognitive Störung“ (z. B. Demenz).

Six-Item Screener

Der SIS (Abb. 2) hängt von verbalem Verständnis, Konzentration, zeitlicher Orientierung und der Fähigkeit zum verzögerten Abruf von 3 Objekten ab. Diese werden genannt (im Original: „apple – table – penny“, entsprechend Apfel – Tisch – Pfennig oder Cent) und sollen sofort wiederholt werden zur Kontrolle, ob Hören und sprachliche Fähigkeiten als Voraussetzung für das erfolgreiche Reproduzieren ausreichen. Dafür sind maximal 3 Lernversuche erlaubt. Es folgen 3 Fragen zur zeitlichen Orientierung, die gleichzeitig der Distraktion dienen. Für die korrekte Nennung von Wochentag, Monat, Jahr und jeden der danach noch erinnerten 3 Begriffe wird je ein Punkt vergeben. Dabei ist die Reihenfolge der Nennung beliebig.

Abb. 2
figure 2

Durchführung des Six-Item Screeners

Da der SIS insgesamt 4‑mal durchgeführt wurde (SIS1–SIS4) und mögliche Lerneffekte von SIS zu SIS und SIS zu MMSE vermieden werden sollten, wurden statt des von uns bereits für alterstraumatologische Patienten eingeführten Worttripletts „Auto – Blume – Ball“ 4 andere aus dem Grundwortschatz der 500 häufigsten Wörter zusammengestellt, die jeweils 2 zweisilbige Objekte (keine abstrakten Begriffe) und ein einsilbiges bezeichnen. Callahan ist mit dieser Anpassung einverstanden. Die Worttripletts wurden für jeden Probanden randomisiert auf die verschiedenen Durchführungszeitpunkte verteilt.

Mini-Mental State Examination

Die Mini-Mental State Examination (MMSE; [9, 11]) berücksichtigt außer den für den SIS genannten Faktoren auch räumliche Orientierung, Merkfähigkeit, Rechnen/Buchstabieren, Lesen, Benennen und Visuokonstruktion. Zu den Schweregraden kognitiver Defizite korrespondierende Grenzwerte sind umstritten. Aktuell wird mehrheitlich ein Unterschreiten von 25 der maximal 30 Punkte als Hinweis auf eine alltagsrelevante kognitive Störung gewertet. Für die Retest-Reliabilität werden Werte von 0,80 bis 0,95 genannt [15].

Uhrentest nach Shulman

Beim CDT [18, 19] müssen in einen vorgegebenen Kreis die Zahlen des Ziffernblatts eingetragen und die Zeiger für die Uhrzeit „10 min nach 11“ eingezeichnet werden. Neben der Fähigkeit, die verbal vermittelte digitale Instruktion in eine analoge zu übersetzen, kommen zeitliches Mengenwissen und visuokonstruktive Fähigkeiten zum Tragen. Bewertet wird das Ergebnis anhand von Beurteilungskriterien mit einem Score zwischen 1 (perfekt) und 6 (keine erkennbare Darstellung einer Uhr); auch Beispielbilder sind verfügbar. Ein Score über 2 wird als Hinweis auf eine Störung der Kognition interpretiert. Shulman nennt eine Interrater-Reliabilität von 0,94.

Regensburger Wortflüssigkeitstest

Der Regensburger Wortflüssigkeitstest (RWT, [1]) testet die semantische und die phonetische Wortflüssigkeit. Die Reliabilität variiert je nach Auswahl aus den 10 Untertests. Vier davon wurden durchgeführt. Die Studienteilnehmer sollten jeweils 1 min lang Wörter mit dem Anfangsbuchstaben „P“ bzw. „M“ oder aus der Kategorie „Tiere“ bzw. „Lebensmittel“ nennen. Die Reihenfolge der Aufgaben erfolgte randomisiert. Für die Auswertung wurden die Ergebnisse mit altersnormierten Prozenträngen verglichen und die Mittelwerte der Untertests angegeben. Wir werteten ein Unterschreiten des 16. Prozentrangs als Hinweis auf eine kognitive Störung.

Datengewinnung

Vom 13.02.2015 bis zum 18.03.2015 wurden 246 Patienten im Krankenhaus Rotes Kreuz Lübeck – Geriatriezentrum stationär aufgenommen. Bei 12 Personen konstatierte der aufnehmende Arzt die fehlende Teilnahmefähigkeit, 51 lehnten die Teilnahme primär oder rückwirkend ab, 8 standen aus anderen Gründen (überwiegend inzwischen verschlechtertem Zustand) nicht für den Studieneinschluss zur Verfügung. Bei 10 Patienten, die teilnahme-, aber selbst nicht einwilligungsfähig waren, konnte im vorgesehenen Zeitfenster keine ihren Willen vertretende Person über die Studie aufgeklärt werden. An der Studie nahmen 165 Patienten (Alter 56 bis 97 Jahre, Mittelwert 80,9 ± 7,5 Jahre, 61,8 % Frauen) teil, davon 9,1 % mit Abitur, 18,8 % mit Realschul- und 67,9 % mit Hauptschulabschluss. Der häufigste Abbruchgrund (18 von 29 Probanden) war die Entlassung. Alle 10 vorgesehenen Tests absolvierten 136 Studienteilnehmer.

Ergebnisse

Es wurden 95 der 165 Studienteilnehmer (57,6 %) gemäß abschließendem Arzturteil als während der stationären Behandlung durchgehend kognitiv unauffällig eingestuft. Bei 44 Patienten (26,7 %) wurde eine leichte Störung der Kognition („mild cognitive impairment“, MCI) diagnostiziert, oder es bestand zumindest zeitweise der Verdacht auf eine kognitive Störung. Bei weiteren 26 Patienten (15,8 %) wurde eine alltagsrelevante Störung der Kognition festgestellt. Somit bestand bei 43 % der Probanden mindestens zeitweise der Verdacht auf eine kognitive Störung. Die Häufigkeitsverteilungen der Messwerte für den SIS bei Aufnahme (SIS1) und der Kognition gemäß dem abschließenden Arzturteil sind Abb. 3 zu entnehmen.

Abb. 3
figure 3

Verteilung der Häufigkeiten der Ergebnisse. a Erster Six-Item Screener (SIS1, bei Aufnahme), b Arzturteil

Die Ergebnisse des SIS1 waren nicht geschlechtsabhängig (p = 0,924). In der univariaten Varianzanalyse mit 4 Altersgruppen entsprechend den Quartilen zeigte sich eine Altersabhängigkeit (p < 0,001). Dies lässt sich mit der altersabhängig ansteigenden Prävalenz demenzieller Erkrankungen erklären. In der Untergruppe der gemäß Arzturteil kognitiv Gesunden bestand keine Altersabhängigkeit (p = 0,238). Die Ergebnisse beim jeweils erstmaligen Einsatz der dort genannten Instrumente über alle Teilnehmer und in Abhängigkeit vom abschließenden klinischen Arzturteil zeigt Tab. 1.

Am Aufnahmetag lagen die Ergebnisse geringfügig, aber signifikant (p = 0,026) niedriger als bei der folgenden Testung. Der T‑Test für verbundene Stichproben ergab keinen signifikanten Unterschied zwischen den Mittelwerten von SIS2, SIS3 und SIS4 (p jeweils >0,7; SIS1 4,43 ± 1,50; SIS2 4,62 ± 1,38; SIS3 4,66 ± 1,48; SIS4 4,56 ± 1,46).

Tab. 1 Ergebnisse der eingesetzten Testverfahren bei der ersten Durchführung in Abhängigkeit von der ärztlichen Einschätzung der Kognition

Die Korrelation zwischen SIS1 durch den Arzt am Aufnahmetag und SIS2 durch die Doktorandin 2 Tage danach betrug 0,705 (p ≤ 0,001), zwischen SIS2 und SIS3 0,696 sowie zwischen SIS3 und SIS4 0,651. Somit lag die Retest-Reliabilität mit und ohne Untersucherwechsel in gleicher Größenordnung, was für hohe Objektivität spricht. Es ergab sich mit 0,821 ein guter Cronbachs-α-Wert (zum Vergleich: Cronbachs α bei der MMSE 0,79 [4]).

Für die Änderungssensitivität wurden die Daten jener 13 Patienten gesondert betrachtet, bei denen sich MMSE (um mindestens 3 Punkte) und CDT im Verlauf gleichsinnig entwickelten. Hierbei fand sich ein partielles η2 von 0,25 als Ausdruck dessen, dass der SIS kognitive Schwankungen, die sich von Tag 3 zu Tag 15/16 sowohl in der MMSE als auch im CDT bemerkbar machten, gut widerspiegeln konnte.

Der SIS korrelierte mit dem Arzturteil (−0,729), gefolgt von der MMSE (0,677), dem CDT (−0,478) und dem RWT (0,445; jeweils erste Durchführung). Diese Korrelationen sind auf dem Niveau von 0,01 signifikant, die konvergente Validität ist damit gegeben. Ein für die divergente Validität herangezogener Test zur Depressionserfassung (MADRS) korrelierte erwartungsgemäß nicht.

Für die diagnostische und prognostische Kriteriumsvalidität wurde zum einen berechnet, wie zuverlässig und bei welchem Grenzwert der SIS schon bei Aufnahme Patienten mit alltagsrelevanter kognitiver Störung gemäß späterem Arzturteil erkennt, zum anderen, ob er mit entsprechend angepasstem Grenzwert bereits leichte kognitive Defizite detektiert.

Die 26 im Arzturteil als alltagsrelevant kognitiv beeinträchtigt klassifizierten Patienten unterschritten sämtlich den Grenzwert von 5 Punkten. Alle 98 Patienten, die im SIS1 5 oder 6 Punkte erreichten, hatten auch laut abschließendem Arzturteil höchstens eine leichte kognitive Störung. Die hervorragende Sensitivität (100 %, negativer prädiktiver Wert [NPW] 1,00) ging mit akzeptabler Spezifität (70,5 %, positiver prädiktiver Wert [PPW] 0,388) einher. Das Integral der „Receiver-operating-characteristic“-Kurve („area under the curve“, AUC) betrug 0,937. Bei Verwendung des von Callahan im Rahmen der Probandenrekrutierung gewählten Grenzwerts für Demenzverdacht bei weniger als 4 Punkten steigt die Spezifität auf 88,5 % unter Reduktion der Sensitivität auf 73,1 % (Abb. 4; Tab. 2).

Abb. 4
figure 4

Vierfeldertafel aus erstem Six-Item Screener (SIS1) mit unterschiedlichen Grenzwerten und erster Mini-Mental State Examination (MMSE1)/Arzturteil

Tab. 2 Validität des Six-Item-Scores (SIS) bei alternativen Grenzwerten und der Mini-Mental State Examination (MMSE) für die Erfassung alltagsrelevanter kognitiver Störung, Korrelation mit dem Arzturteil

Von 70 Patienten, bei denen im klinischen Arzturteil mindestens zeitweise der Verdacht auf eine kognitive Störung bestand, hatten nur 7 im SIS bei Aufnahme die volle Punktzahl erreicht. Bei so streng gewähltem Grenzwert war eine Sensitivität von 90 % für das Erkennen jeglicher im Verlauf auffallender kognitiver Defizite erreicht (einschließlich MCI; NPW 0,84), jedoch ist dann die Spezifität mit 38 % niedrig (PPW 0,52). Probanden mit einem SIS1 von 5 (4) erreichten in der MMSE einen arithmetischen Mittelwert von 24,89 ± 3,32 (23,10 ± 3,67), im CDT 2,52 ± 1,07 (3,48 ± 0,99).

Diskussion

Die logistische Schwierigkeit, rechtzeitig eine schriftliche Einwilligung der Person zu erhalten, die den Patientenwillen vertritt, schlägt sich in der mit 15,8 % relativ niedrigen Quote [17] alltagsrelevant kognitiv beeinträchtigter Studienteilnehmer gemäß klinischem Arzturteil nieder. Es bestätigt sich, dass die Testergebnisse geschlechts- und altersunabhängig interpretiert werden können. Der alterskorrelierte Abfall der erzielten Werte ist über die ansteigende Prävalenz kognitiv gestörter Patienten erklärlich.

Die meisten Probanden zeigten in der stärker stressbelasteten Aufnahmesituation eine signifikant leicht schlechtere Leistung als an den Folgetagen. Da jedoch für den praktischen Nutzen der Anwendung das Ergebnis beim Erstkontakt höhere klinische Relevanz hat, legten wir für unsere Berechnungen zur Validität diesen Wert zugrunde. Auch der große Pool unterschiedlicher Untersucher bei der ersten Erhebung (etwa 20 verschiedene Ärzte) entsprach Alltagsbedingungen.

Bei Einsatz unterschiedlicher Worttripletts wichen die Mittelwerte des SIS an den Tagen 3, 5 und 15/16 nicht signifikant voneinander ab. Somit war auch bei kurzfristiger Wiederholung kein Lerneffekt zu verzeichnen.

In der Geriatrie gehört das Assessment der Kognition zum Standard. Bei einem SIS von 6 Punkten, den in unserer Studie immerhin 26,1 % der Patienten erreichten, ist ohne anamnestische oder klinische Auffälligkeiten kein weiteres kognitives Assessment medizinisch erforderlich. Ansonsten sollte der SIS durch ein weiteres Instrument ergänzt werden. Bei 5 oder 4 Punkten sind hierfür Tests zu bevorzugen, die sich zur Frühdiagnostik einer demenziellen Entwicklung eignen; erst unter 4 Punkten im SIS greift die MMSE mit ausreichender Treffsicherheit.

Die Validierung von Tests erfolgt in der Regel an Probanden, die keine gesundheitlichen Einschränkungen jenseits des Gegenstands der Untersuchung aufweisen, die das Testergebnis beeinflussen können. Ältere Patienten leiden jedoch häufig unter sensorischen und feinmotorischen Defiziten sowie stark reduzierter Belastbarkeit. Dies schränkt die Aussagefähigkeit vieler kognitiver Tests ein. Der in 1 min zu absolvierende, weder Visus noch Handeinsatz benötigende SIS ist dadurch weniger störanfällig als Tests vergleichbarer Aussagekraft, deutlich zeitökonomischer und unterliegt keinem Copyright. Die vorliegende Studie bestätigt ihn in seiner deutschen Version als Kurztest mit guter interner Konsistenz, Kriteriums- und prognostischer Validität sowie zufriedenstellender Reliabilität und Änderungssensitivität bei geriatrischen Krankenhauspatienten.

Untersucher können den SIS leicht erlernen und benötigen kein Material. Die günstige Relation zwischen Aufwand und Aussagekraft machen ihn für den breiten Einsatz auch außerhalb der Geriatrie interessant. So konnte er im Rahmen alterstraumatologischer Kooperation in den zuweisenden Kliniken zur Risikostratifizierung zwecks frühzeitigem Einsatz flankierender Maßnahmen [3] der Delirprävention eingeführt werden. Rundshagen nennt in ihrer Übersichtsarbeit den Kenntnisstand des präoperativen kognitiven Status als Voraussetzung für die Diagnose einer postoperativen kognitiven Dysfunktion (POCD, [16]). Die Erhebung des SIS vor der Intervention und wiederholt im Verlauf hilft bei der Einordnung einer postinterventionell bestehenden kognitiven Störung als vorbestehend, POCD oder Symptom eines Delirs. Auch Notaufnahmen anderer Disziplinen könnten über den SIS alltagsrelevante Störungen der Kognition so sicher erfassen wie mit deutlich aufwendigeren Tests, die dort nicht durchführbar sind, ein kognitiver Einbruch sich somit in der Regel nicht über einen Punktverlust in der MMSE als Hinweis auf ein Delir [10] dokumentieren lässt. Da in der Erfassung und dem Monitoring eines Delirs die Fluktuation kognitiver Störung ein Leitsymptom darstellt [12], ist die engmaschige Wiederholbarkeit des SIS von diagnostischem Wert. Auch einige Hausärzte nutzen den SIS bereits für Verlaufskontrollen des kognitiven Status ihrer Patienten.

Limitationen

Da bei Patienten ohne Verdacht auf demenzielle Entwicklung gemäß Anamnese, klinischen Symptomen oder kognitivem Basis-Assessment keine aufwendigeren Verfahren zur Beurteilung der Kognition eingesetzt wurden, könnten Probanden trotz bereits eingetretener kognitiver Defizite während des Klinikaufenthalts unauffällig geblieben und somit das Arzturteil falsch-negativ ausgefallen sein.

Das Arzturteil als Referenzstandard wurde unter Berücksichtigung des gesamten klinischen Verlaufs gefällt; es konnte daher nicht für die Bestimmung der Änderungssensitivität herangezogen werden. Diese musste sich an weiteren kognitiven Tests orientieren, wobei nur 13 Studienteilnehmer gleichsinnige Veränderungen der Resultate aufwiesen. Die niedrige Fallzahl relativiert die Aussagefähigkeit zur Änderungssensitivität des SIS.

Die Durchführung der verschiedenen kognitiven Tests fand nicht verblindet statt, jedoch wurde der erste SIS, auf den wir uns für die Validität stützten, durch Ärzte durchgeführt, die an der weiteren Datenerhebung nicht beteiligt waren.

Fazit für die Praxis

  • Der SIS ist bei geriatrischen Patienten in etwa 1 min ohne Material durchführbar und ideal geeignet für den Einsatz in der Aufnahmesituation.

  • Er ist unabhängig von Sehstörungen und feinmotorischen Defiziten sowie auch bei reduzierter allgemeiner Belastbarkeit einsetzbar.

  • Er korreliert gleich eng mit dem ärztlichen Gesamturteil wie die MMSE, deren Sensitivität und Spezifität er bei einem Grenzwert von 5 für den SIS und 25 für die MMSE übertrifft; auch die Korrelationen mit dem RWT und dem CDT belegen seine konvergente Validität.

  • Alltagsrelevante kognitive Störungen sind bei Erreichen von weniger als 4 der 6 möglichen Punkte wahrscheinlich. Bei 5 Punkten sind sie mit hoher Wahrscheinlichkeit ausgeschlossen. Leichte kognitive Defizite sind erst bei voller Punktzahl weitgehend ausgeschlossen.

  • Der Test kann bei zufriedenstellender Reliabilität unter Verwendung unterschiedlicher Worttripletts kurzfristig wiederholt werden.