La prédisposition à la douleur repose sur des mécanismes complexes, et fait – par exemple – que pour un geste chirurgical identique, la douleur postopératoire varie d’un patient à l’autre.1,2 Or, il semble important de pouvoir prédire la douleur postopératoire pour anticiper l’analgésie à appliquer. Dans le contexte obstétrical, personnaliser l’analgésie du travail permettrait en sus d’éviter des excès d’analgésie, autre motif d’insatisfaction de la patiente.3 On peut déjà prédire la douleur postopératoire/obstétricale ou les besoins en analgésie par la sensibilité préopératoire à une stimulation nociceptive standardisée,4,5,6,7,8 mais de telles mesures sont difficiles à réaliser en pratique et ajoutent une épreuve douloureuse au patient. Le Pain Sensitivity Questionnaire (PSQ) explore la sensibilité naturelle d’un individu à la douleur au moyen de questions simulant des situations douloureuses plus ou moins intenses de la vie courante.9 Il pourrait être utile en recherche clinique (stratification lors d’essais d’analgésiques, physiopathologie…) mais aussi en clinique courante, intégré à la construction de scores de risque de douleur postopératoire.10 Originellement construit en langue allemande, le PSQ a fait l’objet de traductions validées,11,12,13,14 mais une validation transculturelle en langue française est nécessaire. C’est l’objectif de cette étude, qui veut étudier en deux étapes : (i) la validité de structure interne (degré de corrélation entre les items et au sein de dimensions), la validité convergente (corrélations avec d’autres mesures du même domaine) et la reproductibilité (stabilité des réponses d’un sujet dont l’état est resté stable au cours du temps) chez des patients en situation préopératoire ou des femmes enceintes avant accouchement; (ii) la validité convergente et la validité de structure contre critère externe (corrélations avec des indicateurs objectifs de sensibilité à la douleur) chez des sujets volontaires sains.

Méthode

Le plan est conforme aux recommandations pour la validation transculturelle, comportant une traduction littérale, une adaptation au contexte culturel, aux habitudes de vie et aux idiomes de la population cible, et suivant un processus rigoureux de traduction-contre-traduction.15,16,17 Cette étude a reçu l’autorisation de l’Agence Nationale de Sécurité du Médicament et des produits de santé (autorité compétente) le 10/04/2017, et l’avis favorable du comité d’éthique (CPP-Ile-de-France-I) le 08/04/2017. Elle a été enregistrée sur ClinicalTrials.gov (NCT03113903). Tous les participants ont donné leur consentement éclairé préalable.

La première partie incluait des patients du CHU de Clermont-Ferrand et du Centre Jean-Perrin, âgés de 18 à 65 ans, parlant et lisant le français, à l’occasion de la visite réglementaire pré-anesthésique, qui se déroulait environ deux semaines avant une chirurgie programmée, ou au troisième trimestre de la grossesse. Tous les patients éligibles ont été sollicités de façon consécutive au cours de la période d’étude. Après la collecte des données démographiques et morphologiques, et des antécédents du patient, ce dernier était invité à renseigner à la suite : le PSQ-F, l’échelle de catastrophisme vis-à-vis de la douleur de Sullivan et coll. (Pain Catastrophizing Scale, PCS),18,19 et l’échelle d’anxiété et de dépression en hôpital (Hospital Anxiety & Depression, HADS),20,21 toutes deux validées en langue française. Si possible, les patients étaient revus peu avant l’intervention pour renseigner une seconde fois le PSQ-F afin d’évaluer sa reproductibilité par test-retest, puis contactés entre le deuxième et le troisième jour après l’intervention (ou l’accouchement), pour répondre à la question « D’une façon générale, quelle est votre satisfaction vis-à-vis de la prise en charge de la douleur par rapport à votre opération ou votre accouchement ? » sur une échelle numérique simple allant de 0 (« Pas du tout satisfait ») à 10 (« Totalement satisfait »).

La seconde partie incluait des sujets volontaires sains recrutés par téléphone au Centre de Pharmacologie Clinique à partir de la base de participants du centre. Ils étaient âgés de 18 à 60 ans, ayant un indice de masse corporelle entre 19 et 30 kg·m−2, indemnes de tout traitement dans les sept jours précédant l’étude, parlant et lisant le français. Le recrutement a visé une distribution équilibrée entre les sexes et de part et d’autre d’un âge de 30 ans. Les critères de non-inclusion étaient : grossesse, incompatibilité cognitive avec l’étude, alcoolisme avéré, addiction aux drogues, douleur chronique, tout antécédent médical ou toute pathologie contre-indiquant la réalisation de l’étude (notamment : lésion cutanée dans les régions à explorer, score d’anxiété ou de dépression > 11 au questionnaire HADS, qui de fait était renseigné et interprété avant l’inclusion formelle). Tous les tests ont été réalisés en une fois à l’occasion de la visite au Centre. Un test urinaire de dépistage de substances addictives (NarcoCheck®, Kappa City Biotech SAS, Montluçon, France) a été systématiquement réalisé. Les questionnaires ont été renseignés dans un lieu dédié, confortable et silencieux, sans influence des investigateurs.

Les mesures psychophysiques ont été réalisées en environnement calme, à température fixe de 24°C. Après un court apprentissage, le seuil de sensibilité à la douleur mécanique ponctuelle a été mesuré au moyen du von Frey électronique (Somedic, Hornby, Suède) sur l’avant-bras en distal. Puis, au moyen du dispositif Pathway® (Medoc Ltd, Ramat Yishai, Israël), les seuils de sensibilité et de douleur induite par un stimulus chaud ont été mesurés sur le même avant-bras en proximal. A partir de la mesure du seuil de douleur au chaud, a été ensuite mesuré le seuil supra-liminal « T°/douleur-6 », correspondant à l’obtention d’une douleur équivalente à 6/10 sur une échelle verbale numérique. Enfin, la sensibilité à la douleur au froid a été explorée par une épreuve d’immersion du pied non dominant dans un bain d’eau à 4°C pendant deux minutes (cold pressure test, CPT); les critères de jugement étaient la douleur moyenne ressentie, soit pendant les deux minutes entières, soit pendant les 30 premières secondes. Le seuil de 30 secondes étant la médiane observée pour le sous-groupe des sujets ayant retiré le pied avant la fin de la période de deux minutes, cette mesure intermédiaire est indépendante de la tolérance sur la durée. Le détail du protocole est fourni sous eAnnexe (disponible sous le Matériel électronique supplémentaire).

Afin de tester les propriétés psychométriques du PSQ-F (acceptabilité, validité de structure interne, reproductibilité par test-retest, validité convergente et validité de structure contre critère externe), ont été retenues comme variables dépendantes les items du questionnaire PSQ, et – sous réserve de validité de la structure interne – le score total du PSQ (moyenne des scores hors items n° 5-9-13, qui sont des leurres ne représentant pas la douleur), le sous-score « mineur » du PSQ (moyenne des scores sur items n° 3-6-7-10-11-12-14), et le sous-score « modéré » du PSQ (moyenne des scores sur items n° 1-2-4-8-15-16-17). Les items composant les sous-scores « mineur » et « modéré » correspondent – sur une échelle de 0 à 10 – à des situations génératrices de douleur cotées respectivement inférieure à 4, et entre 4 et 6.9 Les facteurs étudiés dans les études de relation étaient : les scores d’anxiété, de dépression et de catastrophisme ainsi que ses trois sous-scores (amplification, rumination et abandon), les seuils de nociception mécanique ponctuelle et thermique chaud (basal et T°/douleur-6), et le délai de retrait et les moyennes d’intensité de douleur (sur 30 secondes et 120 secondes) au CPT. Le contexte chirurgical a été pris en compte pour analyses en sous-groupes (de préférence au sexe et à l’âge, naturellement imbriqués avec cette variable).

Les données qualitatives ont été présentées en termes d’effectifs et pourcentages, et les données quantitatives en termes de moyenne (écart-type) ou médiane (écart inter-quartile). Les tests statistiques étaient bilatéraux avec un seuil de significativité fixé à 5 %. La mesure de l’acceptabilité a reposé sur le calcul des données manquantes au niveau de chaque item du PSQ. Des taux de remplissage complet du PSQ-F et des taux de réponse à chacun des 17 items supérieurs à 85% étaient considérés comme satisfaisants. La présence d’effet plafond ou plancher a été recherchée. Afin de déterminer si les items du PSQ-F étaient discriminants, le pourcentage de sujets ayant le score le plus élevé (effet plafond) et le pourcentage de sujets ayant le score le plus faible (effet plancher) ont été calculés pour chaque score (total, mineur et modéré). La validité de structure interne a été appréciée par une analyse factorielle avec rotation Varimax. La consistance interne de chacun des facteurs identifiés a été évaluée par le coefficient α de Cronbach. Les corrélations inter-items, items-facteurs et inter-facteurs ont été estimées par des coefficients de corrélation de Pearson ou Spearman au regard de la distribution statistique. La reproductibilité a été appréciée par des coefficients de corrélation intra-classe. La validité convergente a été étudiée en calculant les coefficients de corrélation de Pearson ou Spearman au regard de la distribution statistique, entre les scores du PSQ-F et les scores des échelles HADS et PCS. La validité de structure contre critère externe a été étudiée en calculant les coefficients de corrélation entre les scores du PSQ-F et les scores issus des différentes stimulations nociceptives standardisées. En raison de la nature exploratoire des comparaisons statistiques, aucun ajustement pour comparaison multiple n’a été effectué.22,23 Pour les analyses des effets de facteurs confondants démographiques ou nosologiques, des coefficients de corrélation avec les variables numériques ont été calculés, et des comparaisons entre sous-groupes ont été réalisées par des tests de Student ou de Mann-Whitney.

Pour les patients, nous avons déterminé le nombre minimum de sujets nécessaires à 136 sujets en fonction du nombre d’items du PSQ-F (huit sujets/item, 17 items), pour une validité raisonnable de l’analyse factorielle.24 Ceci permet de détecter des coefficients de corrélation ≥ 0,3 avec α = 5 % et 1–β = 95 %. L’objectif de recrutement était porté à 150 par sécurité. Par ailleurs, 50 patients étaient nécessaires pour étudier la reproductibilité.24 Pour les volontaires sains, nous avons fait l’hypothèse que les corrélations entre les scores du PSQ-F et les variables psychophysiques seraient au moins aussi importantes que celles retrouvées dans l’étude originale (ρ entre 0,29 et 0,59).9 Pour détecter des coefficients de corrélation ≥ 0,3 avec α = 5 % et 1–β = 80 %, 85 sujets étaient nécessaires.

Résultats

Traduction et adaptation transculturelle

Nous sommes partis de la version originale allemande du PSQ,9 qui a été traduite séparément de l’allemand au français par trois bilingues de langue maternelle française. Une traduction à partir de la version anglaise a été aussi réalisée en parallèle. Puis une version synthétique a été rédigée, et rétro-traduite par deux bilingues de langue maternelle allemande natifs ignorants du PSQ original. Ces rétro-traductions ont été comparées à l’original, puis une version pré-finale a été produite et testée auprès d’un échantillon de 40 personnes soignantes en milieu hospitalier. Ces personnes ont estimé le temps qu’elles ont pris pour remplir le questionnaire, évalué la compréhensibilité des consignes de lecture et des questions/mots, et noté le recours éventuel à une aide extérieure; elles ont pu faire des suggestions de correction ou d’ajout d’items. Le temps moyen passé à remplir était de cinq minutes, sans avoir recours à une aide. Suite à ce test, seule une consigne de remplissage a été modifiée (« face à une telle situation » a été remplacée par « face à la situation évoquée »). Aucun item n’a été modifié. Une version finale (PSQ-F) a ainsi été adoptée (Tableau 1).

Tableau 1 Version française du Pain Sensitivity Questionnaire (PSQ-F)

Description des patients et des sujets sains

Le diagramme des flux est détaillé en Figure 1. Les caractéristiques des participants sont au Tableau 2. Chez les patients, l’âge présentait une distribution bimodale avec deux modes à 30 et 60 ans. Les types de chirurgie programmée étaient : abdomen/pelvis 8 (5,5 %), cervical 13 (8,9 %), cœur 20 (13,7 %), obstétrique 38 (26,0 %), orthopédie 11 (7,5 %), sein 36 (24,7 %), thorax 16 (11,0 %), autre 4 (2,7 %). Chez les sujets sains, la distribution était asymétrique du fait d’une différence de variabilité entre les moins et plus de 30 ans; le score global moyen de catastrophisme était de 11,6 (8,3), soit inférieur à celui l’étude originale, égal à 16,5 (9,0) (données non publiées).9

Figure 1
figure 1

Diagramme de flux

Tableau 2 Description de l’échantillon d’étude

Acceptabilité, effets planchers et plafonds

Le taux de remplissage complet du PSQ a été de 100 % pour les deux groupes. Pour les 14 items correspondant à des situations douloureuses, les taux de réponses au niveau le plus bas (0, effet plancher) allaient de 0 à 18,5 % et de 0 à 15,3 %, respectivement pour les patients et les sujets sains. Les taux de réponses au niveau le plus haut (10, effet plafond) allaient de 0 à 6,2 % et de 0 à 2,4 %, respectivement pour les patients et les sujets sains.

Validité de structure interne et reproductibilité

Le Tableau 3 montre les résultats de l’analyse factorielle du PSQ-F. Pour les patients, deux facteurs ont été retenus, représentant respectivement 51,7 et 8,4 % de la variance totale. Le coefficient α de Cronbach estimant la consistance interne (considérée comme acceptable à partir de 0,7) était, respectivement pour les sous-score « mineur » et « modéré » et le score total du PSQ-F : 0,866; 0,886; 0,927. Pour l’analyse de reproductibilité (test/retest), le coefficient de corrélation intra-classe était, respectivement pour les sous-score « mineur » et « modéré » et le score total du PSQ-F : 0,629; 0,629; 0,635. La corrélation intra-classe était significative pour tous les items et scores testés. Pour les sujets sains, deux facteurs ont également été retenus dans l’analyse factorielle, représentant respectivement 46,1 et 11,3 % de la variance totale. Le coefficient α était, respectivement pour les sous-score « mineur » et « modéré » et le score total du PSQ-F : 0,852; 0,871; 0,906.

Tableau 3 Validité de structure interne et reproductibilité

Les composantes des sous-scores du PSQ original étant retrouvées comme attendues dans les dimensions de l’analyse factorielle, et la consistance interne de l’outil étant jugée satisfaisante, il n’a pas été procédé à des modifications du questionnaire ni des méthodes de calcul des scores, pour les analyses suivantes. On peut donc décrire les scores du PSQ-F (Tableau 4). On constate des scores plus élevés chez les sujets sains. Du fait de l’hétérogénéité des types de chirurgie, il n’a pas été réalisé d’analyse sur ces sous-groupes.

Tableau 4 Scores du PSQ-F observés

Validité convergente

Le Tableau 5 montre les relations entre le PSQ-F, et les échelles HADS et PCS. Elles différaient entre les patients (corrélation positive pour tous les facteurs testés) et les sujets sains (aucune corrélation significative, avec des coefficients pour la plupart négatifs et très proches de 0).

Tableau 5 Validité convergente

Validité de structure contre critère externe

Chez 117 patients (80,1 %), un score de satisfaction vis-à-vis de la qualité de l’analgésie a pu être relevé, sa médiane étant de 9/10 (8 - 10); 83,8 % des répondants rapportaient une satisfaction > 7/10. Cette distorsion vers le haut reflétant une analgésie très efficace, il n’a pas été fait d’étude de corrélation avec le PSQ-F.

Le Tableau 6 montre les résultats des stimulations nociceptives chez les sujets sains, et leur relation avec le PSQ-F. On note une corrélation négative entre les trois scores du PSQ-F et le T°/douleur-6, et une corrélation positive entre les scores mineur et total du PSQ-F, et la moyenne des 30 premières secondes de la douleur au CPT.

Tableau 6 Validité de structure contre critère externe

Discussion

Cette étude a donné des résultats satisfaisants en termes de validité interne, de reproductibilité et de validité externe. Toutefois, nous devons discuter des différences observées entre nos résultats et ceux des études antérieures réalisées avec la version originale et des versions traduites.

La consistance interne que nous avons retrouvée chez les patients est très proche de celle observée chez des sujets sains, dans les études originale, coréenne et chinoise.9,12,14 La reproductibilité était en revanche meilleure chez les sujets sains des études originale et chinoise,9,14 que chez nos patients en attente d’une chirurgie ou d’un accouchement. Le contexte clinique a donc pu altérer la reproductibilité, fait également constaté chez des patients atteints de lombarthrose douloureuse.12,13

En termes de validité convergente, l’étude originale sur sujets sains rapporte une corrélation des trois scores du PSQ avec le catastrophisme, ainsi que du score mineur avec l’état anxieux et la dépression.9 L’étude chinoise, dont l’échantillon comportait un taux élevé de personnes jeunes et éduquées, retrouvait une corrélation avec le PCS, quoique plus faible, une corrélation faible et inconstante avec l’anxiété, et pas de corrélation avec la dépression.14 L’absence de relation chez nos sujets sains peut être due à un recrutement qui a évité – à la demande du comité d’éthique – les troubles psychologiques préexistants, d’où des scores psychométriques bas et peu variables. Aussi, le catastrophisme dépendant de l’expérience des douleurs ressenties dans le passé,25 le recrutement de sujets plus âgés a pu altérer la relation avec le PSQ-F. Chez les patients en revanche, où nous retrouvons une corrélation du PSQ-F avec anxiété, dépression et catastrophisme, nos résultats sont cohérents avec les résultats publiés. Pour la validation anglophone chez 136 patients douloureux chroniques avant infiltration lombaire,11 les trois scores du PSQ étaient corrélés au catastrophisme, mais pas à l’anxiété ni à la dépression. Pour la validation coréenne chez 72 patients atteints de lombarthrose douloureuse, la relation avec le catastrophisme était similaire.12 Sinon, une équipe suisse a testé une traduction française du PSQ (sans décrire le contenu ni les étapes de validation interne), chez 198 patientes avant chirurgie du cancer du sein.26 Le PSQ total était corrélé au trait (mais pas à l’état) anxieux, à la dépression, et à l’intensité de douleur attendue. Dans l’ensemble, chez des patients plus exposés à des troubles psychologiques, et plus encore en cas de douleur chronique, la validité convergente du PSQ est meilleure.

En termes de validité externe, nous retrouvons, avec des effets plus faibles et une significativité moins constante, les tendances observées notamment dans l’étude originale qui retrouvait une relation du PSQ avec la douleur induite, mais pas avec les seuils nociceptifs,9 et dans l’étude chinoise, avec la douleur induite et les seuils nociceptifs, mais pas de tolérance.14 Nous n’avons pas testé la validité externe chez les patients, comme fait avant infiltration lombaire ou mammaire, où le PSQ-total est corrélé à la douleur expérimentale.11,26 En situation de douleur chronique, la corrélation a même été retrouvée avec les seuils nociceptifs.27 Enfin, le PSQ-total prédirait la douleur postopératoire après chirurgie mammaire.26 A ce propos, il sera essentiel de réaliser ces études prédictives dans chaque type de chirurgie – au moins par grandes catégories – afin de pouvoir valider l’utilité du PSQ dans ce contexte. N’ayant pas cet objectif, notre étude, en ciblant des types de chirurgie variés, au risque d’avoir des sous-groupes de petite taille, ne permettait pas une telle approche.

Ce PSQ-F est donc valide, et utilisable d’ores et déjà par les cliniciens. On notera toutefois que la relation du PSQ avec les autres dimensions psycho-cliniques tend à augmenter avec l’expérience douloureuse du sujet. De fait, s’il est testé comme prédicteur d’une douleur postopératoire, le modèle prédictif ne serait valide que pour les types de chirurgie testés. De plus, l’utilité respective du score total du PSQ et de ses deux sous-scores reste à déterminer, notamment leur faculté prédictive d’un évènement douloureux pertinent cliniquement. On ajoutera qu’en termes d’utilité pour la recherche, le sous-score mineur a été utilisé comme « version courte » en épidémiologie.28