Scores de gravité en réanimation

P. Girardet, D. Anglade, M. Durand, J. Duret

Unité de réanimation cardiovasculaire et thoracique, département d'anesthésie-réanimation 2,
centre hospitalier universitaire, BP 217 X, 38043 Grenoble cedex 09, France

POINTS ESSENTIELS

· Les scores de gravité (SG) et leurs modules pronostiques sont avant tout des outils épidémiologiques. Ils peuvent être utilisés pour évaluer globalement la gravité des malades et stratifier les malades avant randomisation dans le cadre d'essais cliniques.

· Les scores se répartissent en plusieurs types en fonction de leurs objectifs : les scores généraux couvrant plus qu'une maladie sont l' Indice de Gravité Simplifié (IGS)- Simplified Acute Physiological Score (SAPS), l' Acute Physiological Score (SAPS), l' Acute Physiological Score Chronic Health Evaluation (APACHE II et III) et enfin le Mortality Probability Model (MPM).

· Les scores de charge en soins, destinés à la mesure de l'activité des services de réanimation, donnent aussi un aperçu indirect de la gravité. Le système Therapeutic Intervention Scoring System (TISS) et le système Omega. Le TISS à lui seul peut permettre d'évaluer le besoin en personnel pour une charge en soins donnée.

· Les scores spécialisés concernent soit une maladie particulière comme le Traumascore, l' Injury Severity Score (ISS), le SDRA score, soit un type de patient, comme le Pediatric Risk of Mortality (PRISM), le Burn Index pour les brûlés, le TOXSCORE pour les intoxications aiguës.

· Les scores sont critiqués car ils devraient idéalement aboutir non seulement à l'évaluation de la mortalité, mais aussi de la morbidité (reflétée par la durée de séjour), de la qualité de vie, et enfin du degré de handicap résultant de l'hospitalisation en réanimation.

· Du fait de leur faible sensibilité, les scores ne sont d'aucune utilité à l'échelon individuel d'un patient pour une décision de triage, admission, sortie et encore moins à une décision d'abstention thérapeutique.

Peu de spécialités sont autant impliquées par la prédiction du pronostic que la réanimation. Chaque jour, le médecin réanimateur doit décider quels patients il doit admettre, et jusqu'où il doit prolonger son effort. Toutes ces décisions sont fondées sur une estimation du pronostic final, et sur la nécessité du traitement et son bénéfice potentiel. Le but de la réanimation est d'assurer la survie, mais également de rétablir, à l'issue du traitement, une qualité de vie aussi proche que possible de celle existant antérieurement, malgré la présence d'une ou plusieurs défaillances mettant en jeu le pronostic vital immédiat. Le développement actuel des techniques de réanimation permet d'assurer la survie de patients autrefois condamnés à court terme, au prix toutefois d'un coût économique et humain important. Les malades de réanimation souffrent d'une difficulté à être correctement classifiés par un diagnostic ou une thérapeutique unique, car les pathologies et les traitements sont en général multiples. Dans ce contexte, l'évaluation de ces malades par une échelle de gravité permet une meilleure description et une meilleure catégorisation de cette population.

Un score de gravité est un indice établi à partir de paramètres cliniques et biologiques corrélés statistiquement à l'issue. Différents indices de sévérité généraux ont été développés depuis une vingtaine d'années, avec pour objectifs de prédire moins intuitivement le pronostic de survie individuel, et de comparer a posteriori des malades de gravité identique, de façon à évaluer l'efficacité des différentes thérapeutiques mises en œuvre. En effet, en l'absence de telles informations permettant de créer des groupes homogènes de malades, la mortalité rapportée d'une atteinte comme le choc septique pouvait varier sans que le traitement y soit pour quelque chose.

Le premier de ces objectifs s'est rapidement révélé irréaliste, puisque si les différents systèmes prédictifs restent très spécifiques en termes de prédiction de la mortalité, ils restent insuffisamment sensibles. Par exemple, une probabilité de mortalité de 0,2 signifie que l'on peut s'attendre au décès de 20 personnes sur un groupe de 100, mais dans le même temps il demeure impossible de prédire qui va mourir au sein de ce même groupe. A contrario, le deuxième objectif est parfaitement rempli par l'utilisation des indices de gravité généraux, puisque leur utilisation rend plus pertinente l'évaluation des maladies et de leur traitement, mais aussi des structures de soins et de leur rendement, permettant une estimation des coûts, économiques et humains, du passage en réanimation. Leur utilisation, comme indicateur, devient indispensable dans une perspective d'amélioration continue de la qualité des soins.

D'une manière parallèle, voire parfois antérieure, à cette utilisation des scores de gravité généraux, certaines catégories d'affections aiguës, aux répercussions potentiellement vitales, ont été pourvues de scores de sévérité spécifiques. Il s'agit en particulier de la pancréatite aiguë, scores clinicobiologiques [1] et scores tomodensitométriques [2], de l'infarctus [3], du polytraumatisé [4], des comas traumatiques [5], du SDRA et des états septiques [6] [7].

La coexistence de deux systèmes de cotation de la sévérité pour les mêmes patients a bien sûr conduit à comparer leur efficacité respective. Enfin, la remarquable efficacité des scores généralistes de réanimation a conduit à tester ceux-ci dans différentes pathologies en dehors de la réanimation, c'est-à-dire en dehors des circonstances précises de leur stricte définition comme le transport de malades de réanimation [8], les unités intermédiaires [9] et enfin la chirurgie.

SCORES DE GRAVITÉ GÉNÉRALISTES

Généralités

La définition de ces scores repose sur différents axiomes. Lorsqu'un patient est admis en réanimation, son pronostic dépend à la fois de facteurs présents le premier jour et d'événements survenant ultérieurement. Parmi les facteurs présents à l'entrée, les trois plus importants sont les maladies préexistantes, les réserves physiologiques et les répercussions de la pathologie en cours sur les variables physiologiques [10]. Si ce dernier paramètre est le plus aisément mesurable en termes de déviation par rapport à une norme, les deux premiers sont plus difficiles à définir a priori, et nécessitent le recours à l'analyse statistique dans des bases de données épidémiologiques suffisamment conséquentes. Le score doit permettre une évaluation pronostique indépendante, ou peu influencée par le diagnostic de la pathologie justifiant le passage en réanimation, les patients entrant dans ce cadre pouvant rarement relever d'une seule classe pathologique. L'établissement de scores pronostiques nécessite le choix d'un critère de jugement clair. En l'occurrence, le critère de jugement utilisé pour l'établissement des score de sévérité en réanimation est la mortalité hospitalière, sachant que la mortalité en réanimation diffère peu de la précédente à 30 jours, critère usuel de jugement de la plupart des systèmes pronostiques.

De nombreux scores généralistes ont été développés, mais seul un nombre restreint est utilisé en routine, à savoir les systèmes APACHE, IGS et MPM, à quoi il faut adjoindre les scores de défaillances viscérales, dont l'intérêt réside plus dans le suivi au jour le jour d'un malade que dans la prédiction du pronostic final.

Systèmes APACHE

Pour l' Acute Physiologic and Chronic Health Evaluation, il est historiquement le premier de ces trois systèmes développés [10]. Initialement, la proposition de se baser sur 34 items différents n'a pas été le résultat d'une recherche de corrélation statistique, mais celui d'un choix opéré par un panel d'experts cliniciens. Depuis la méthodologie a retrouvé son rôle dans le choix des variables permettant d'établir le première évolution de ce score, l'APACHE II [11], puis dans l'APACHE III, dernière mise à jour de ce système.

L'APACHE II ne retient plus que 12 variables physiologiques, associées à l'âge et à un certain nombre de maladies préexistantes. Les variables physiologiques prises à part constituent l' Acute Physiologic Score (APS) et sont évaluées à partir des valeurs les plus anormales des variables considérées pendant les 24 premières heures d'évolution en réanimation. L'importance attribuée à chaque paramètre dépend de son écart à la valeur normale et varie de 1 à 4. Elle est, comme dans la première version de l'APACHE, attribuée de manière arbitraire. La présence d'une insuffisance rénale aiguë multiplie par 2 le poids de la variable créatininémie. De même la notion du mode d'entrée en réanimation, en urgence, ou de manière programmée après une intervention chirurgicale, ainsi que la présence d'un certain nombre de maladies entraînant une « dysfonction organique sévère ou une déficience immunitaire » majore le score. Au total cette seconde version du système, malgré une importante simplification par rapport à la version initiale, et des tests de validation effectués sur un panel plus large de malades de réanimation (5 815 malades sur 13 hôpitaux) reste d'emploi difficile, et marquée par l'empirisme.

La dernière version (APACHE III) tente de remédier aux imperfections des versions précédentes et vise à prédire au mieux la probabilité de décès [12]. Le nombre de variables physiologiques prises en compte passe de 12 à 17. Les poids des variables sont cette fois-ci beaucoup plus dispersées (de 1 à 48), et calculées sur la base d'une régression logistique, à partir d'une base de données de plus de 37 668 patients sur 285 unités de réanimation. Dans ces conditions, la mortalité observée (12,35 %) est très proche de la mortalité calculée (12,27 %). Toutefois, la complexité du système s'est notablement accrue et la possibilité de calculer le risque de décès demande une classification au sein de 78 catégories diagnostiques différentes, l'équation permettant le calcul devant être achetée à ses auteurs. Cette méthode a empêché une validation indépendante de ce système.

Indice de Gravité Simplifié - Simplified Acute Physiology Score

L'indice de gravité simplifié (IGS) est un système simplifié d'évaluation de la sévérité, créé par Le Gall et al. à partir d'une appréciation critique du premier système APACHE [13]. Comme pour ce dernier, le choix des paramètres à coter présents dans la première version (IGS I), de même que le poids de ceux-ci, sont fondés sur l'arbitraire. L'IGS I comporte 14 paramètres, dont l'âge et l'état neurologique, avec une stratification de la classification de Glasgow. Le poids de chacun des paramètres peut varier de 0 à 4, leur cotation se faisant à partir des données les plus péjoratives survenant au cours des 24 premières heures passées dans le service de réanimation. La validation initiale de ce score s'est fait sur un panel de 679 malades admis dans huit services de réanimation, et s'est montrée aussi performante que l'APS. La mise à jour de l'IGS (IGS II) s'est cependant faite en utilisant les méthodes statistiques appropriées, permettant de tester la corrélation entre les variables entrant dans le score et la mortalité hospitalière, et de mieux préciser leur stratification et leur poids respectif. Le système final a conservé son approche pragmatique et comporte dorénavant 17 paramètres dont le poids oscille entre 1 et 26. Il prend en compte le type d'entrée : chirurgicale, programmée ou urgente, ou médicale, et retient trois facteurs de gravité préexistants à l'entrée, que sont une maladie hématologique ou le sida, un cancer ou la présence de métastases (tableau Ia et Ib) [13].

La définition des paramètres s'est effectuée sur un panel de 13 152 malades de réanimation, originaires de 12 pays différents, dont les États-Unis, et comprenant 137 unités de réanimation différentes. L'IGS 2 est le score de gravité le plus utilisé en France et en Europe.

Mortality Probality Model

Ce système est différent des autres en ce sens qu'il est explicitement fait pour la prédiction de la mortalité hospitalière, à partir de paramètres présents à l'entrée ou à l'issue des 24 premières heures du séjour en réanimation. Son but est de permettre la comparaison des performances des différentes unités de réanimation entre elles [14]. Il n'entre donc pas en concurrence avec les systèmes APACHE et IGS. C'est le premier modèle pronostique généraliste à avoir été d'emblée défini à l'aide des techniques de régression logistique. La dernière version de ce modèle date de 1993 [15]. Il a été validé sur une cohorte de 19 124 patients de réanimation, dont une partie provient de la même base de données que celle du développement de l'IGS II. Comme pour les scores précédents, la validation du MPM II a été faite en excluant les infarctus du myocarde, les enfants de moins de 18 ans, les brûlés et les patients relevant de la chirurgie cardiaque.

Ce système d'estimation de la mortalité hospitalière comporte deux sous-modèles utilisables à l'entrée : (MPM0) ou bien à la 24e heure (MPM24). Dans le MPM0, 15 variables sont nécessaires pour calculer la probabilité de décès, huit variables relèvent de l'épisode aigu, dont l'âge, trois reflètent une atteinte préalable, la cirrhose éthylique, l'insuffisance rénale chronique, et l'existence d'un cancer métastatique, à quoi viennent s'ajouter l'arrêt cardiorespiratoire et la ventilation mécanique, préalables ou concomitants de l'admission. Dans le MPM24, 13 variables sont nécessaires pour calculer la probabilité de décès, huit variables expriment l'état fonctionnel 24 heures après l'admission, cinq reflètent une atteinte présente lors de l'admission, mais ne recouvrant pas totalement les paramètres déjà intégrés dans le MPM0. Les équations, le mode d'emploi et la définition précise des différents paramètres utilisés dans ces modèles sont clairement publiés dans l'article fondateur, mais leur emploi routinier suppose l'utilisation de l'informatique, ou de calculatrices préprogrammées.

Scores de défaillances viscérales

Les malades admis en réanimation ont une défaillance de fonctionnement d'au moins une des grandes fonctions de l'organisme. C'est la raison pour laquelle il est apparu opportun de vouloir prédire le devenir et la mortalité des patients admis en réanimation à partir du nombre, de la profondeur et de la durée des défaillances d'organes. Le premier de ces scores, proposé par Knaus et al. semblait prometteur car, sur un effectif de 5 677 patients de réanimation avec une mortalité hospitalière globale de 17,5 %, il existait une excellente corrélation entre le nombre et la durée des défaillances d'organes [16]. En effet, sur un nombre total de cinq défaillances possibles (cardiovasculaire, neurologique, rénal, respiratoire, et hématologique), la présence de trois défaillances pendant 72 heures aboutissait à un taux de décès de plus de 93 %. Un grand nombre de scores ont été décrits, et parmi les plus récents systèmes : le MODS ( Multiple Organ Dysfunction System[17], le LOD ( Logistic Organ Dysfunction[18]. Ils décrivent tous le devenir de six organes (cerveau, cœur, poumons, reins, foie, sang). Ils nécessitent un recueil journalier des cotations de 1 à 4 des défaillances identifiées.

Autres scores à visées généralistes

Le degré de sophistication des ressources utilisées pour surveiller et maintenir en vie les patients de réanimation a pu être proposé comme moyen pour prédire la mortalité. Il en est ainsi des scores TISS [19] et OMEGA. Ils reposent sur l'attribution arbitraire d'un certain nombre de points à chacune des interventions possibles sur un patient de réanimation, qu'elles concernent la surveillance ou le traitement. Ces indices sont un fidèle reflet de la charge de travail, en particulier infirmier, induite par les différents types de patients admis en réanimation. Les premières études ont fait ressortir la bonne corrélation qui existe entre la mortalité hospitalière et la valeur des points TISS et OMEGA. Cependant, la charge thérapeutique ne peut suffire à déterminer la gravité et le pronostic des patients, sachant combien elle est dépendante des habitudes thérapeutiques de l'équipe, des ressources matérielles disponibles, du type de patients et des ressources en personnel, en particulier infirmier. Par exemple, une étude effectuée en 1982 comparant les unités de réanimation entre elles, faisait ressortir le fait que 54 % des patients étaient équipés d'une pression artérielle sanglante aux États-Unis, contre 13 % seulement en France [20]. Il n'en reste pas moins que la gravité des patients mesurée par les systèmes IGS et APACHE est bien corrélée aux scores TISS, et OMEGA, particulièrement l'OMEGA I.

Tableau I. a. Score IGS II, d'après [13].

Variable

26

13

12

11

9

7

6

5

4

3

2

0

1

2

3

4

6

7

8

9

10

12

15

16

17

18

Âge (an)

 

 

 

 

 

 

 

 

 

 

 

 40

 

 

 

 

 

40-59

 

 

 

60
69

70
74

75
79

 

> 80

FC (b · min-1)

 

 

 

40

 

 

 

 

 

 

 

 

 

 

 

120-159

 

> 160

 

 

 

 

 

 

 

 

PAS
(mmHg)

 

> 70

 

 

 

 

 

70
99

 

 

 

100
120

 

> 200

 

 

 

 

 

 

 

 

 

 

 

 

T (°C)

 

 

 

 

 

 

 

 

 

 

 

< 39

 

 

> 39

 

 

 

 

 

 

 

 

 

 

 

PaO2/FIO2
Si VA/CPAP

 

 

 

< 100

100-99

 

> 200

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Diurèse
L · j-1

 

 

< 0,5

 

 

 

 

 

0,5-0,99

 

 

  1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Urée
mmol · L-1
g · L-1

 

 

 

 

 

 

 

 

 

 

 

< 10
0,6

 

 

 

 

10-29,9
0,6-1,79

 

 

 

> 30
> 1,8

 

 

 

 

 

Globules blancs
/1 000

 

 

< 1,0

 

 

 

 

 

 

 

 

1,0-19,9

 

 

> 20

 

 

 

 

 

 

 

 

 

 

 

Kaliémie mmol · -1

 

 

 

 

 

 

 

 

 

< 3

 

3,0-4,9

 

 

> 5

 

 

 

 

 

 

 

 

 

 

 

Natrémie mmol · L-1

 

 

 

 

 

 

 

< 125

 

 

 

125-144

145

 

 

 

 

 

 

 

 

 

 

 

 

 

HCO3 mmol · L-1

 

 

 

 

 

 

< 15

 

 

15-19

 

 20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Bilirubine
mmol · L-1
mg · L-1

 

 

 

 

 

 

 

 

 

 

 

< 68,4
< 40

 

 

 

68,4-102

 

 

 

> 102
> 60

 

 

 

 

 

 

Glasgow (points)

< 6

6 à 8

 

 

 

9 à 10

 

 

 

 

 

14-15

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Maladies
chroniques

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Métastasés

Hématologie

 

 

 

sida

 

Type
d'admission

 

 

 

 

 

 

 

 

 

 

 

Chirurgie
programmée

 

 

 

 

Médical

 

Chirurgie
urgente

 

 

 

 

 

 

 

Total

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Tableau I. b. Définition des variables du tableau I.a. (d'après [13]).

Variable IGS II

Définition de la variable

Âge

Au dernier anniversaire

Fréquence cardiaque
(b · min-1)

Noter la valeur la plus anormale pendant les 24 premières heures (bradycardie ou tachycardie)
l'arrêt cardiaque (11 points)
la tachycardie (> 160) (7 points),
exemple Si AC + tachycardie < 160 : compter 11 points

Pression artérielle systolique

Si la PAS varie de 60 à 205 mmHg compter 13 points
(correspondant à une PAS de 60)

Température centrale

Tenir compte de la température la plus élevée

Rapport PaO2/FIO2

Prendre la valeur la plus basse du rapport
Si le malade n'est ni ventilé, ni sous CPA : compter 0

Débit urinaire

Si le malade ne reste pas 24 heures, noter la diurèse totale observée pendant la durée de séjour et extrapoler la diurèse de 24 heures
(exemple : 1 L en 8 heures, 3 L en 24 heures)

Urée sanguine

Prendre la valeur la plus élevée en mmol · L-1 ou g · L-1

Globules blancs

Prendre la valeur la plus anormale (haute ou basse). Diviser les chiffres donnés par 1000
(exemple : 22 000 blancs = 22 et 900 blancs = 0,9)

Kaliémie- Natrémie -HCO3-

Prendre la valeur la plus anormale haute ou basse en mmol · L-1

Bilirubinémie

Prendre la valeur la plus anormale haute ou basse en mmol · L-1

Score de Glasgow

Noter la valeur la plus haute en mg · L-1 ou en mol · L-1

Type d'admission

Prendre la valeur la plus basse des 24 heures, avant sédation
Si le patient est sédaté, prendre le score estimé avant la sédation,
par l'interrogatoire ou les données de l'observation

Sida

Malade chirurgical : malade opéré, dans la semaine qui précède ou suit l'admission
Malade programmé : malade dont l'intervention chirurgicale est prévue au moins 24 heures avant l'opération
Malade non programmé : malade dont l'intervention chirurgicale n'était pas prévue 24 h avant l'opération

Hémopathies malignes

Malade HIV+ avec manifestations cliniques comme pneumocystose, Sarcome de Kaposi, lymphome, tuberculose ou infection à toxoplasme

Cancers métastasés

Lymphome, leucémie aiguë, myélome multiple
Prouvés par chirurgie, scanographie ou autre méthode

SCORES DE GRAVITÉ SPÉCIFIQUES

Des scores spécifiques d'une pathologie ou d'une catégorie de patients ont été proposés et utilisés depuis 50 ans. Leurs performances sont en général inférieures à celles des scores généraux, et ils ne reposent pas sur un nombre de malades aussi important que les scores généralistes, enfin leur construction relève le plus souvent d'une méthode empirique et intuitive. Ils se rapprochent beaucoup des scores pronostiques de risque opératoires.

Scores de cotation du risque opératoire

Les scores de cotation du risque chirurgical ont globalement les mêmes objectifs que les scores précédemment cités, ils répondent à un objectif à plus court terme de triage des patients proposés à la chirurgie.

Classification de l'ASA

Mis au point en 1941 pour évaluer le risque anesthésique, l'ASA Physical Status est probablement le score le plus utilisé dans le monde [21]. Il est bien corrélé à la mortalité et morbidité globale, mais peu à la mortalité anesthésique [22] et il est indépendant de l'acte chirurgical pratiqué. Des problèmes persistent avec la définition exacte des indicateurs du Score ASA, valeurs qui semblent avoir beaucoup fluctué en 60 ans, si bien qu'on trouve encore une grande variabilité, dans l'appréciation d'un même malade par des anesthésistes différents [23] [24].

Physiological and Operative Severity Score
for the enUmeration of Mortality and morbidity

Ce score POSSUM a été développé par des chirurgiens britanniques sur plus de 10 000 opérés entre 1993 et 1995, avec une méthodologie voisine des SGG [25]. La dernière version aurait un très bon ratio mortalité observée/mortalité prédite (MO/MP) [26].

Soins intensifs coronariens et de chirurgie cardiovasculaire

Les patients cardiaques peuvent être stratifiés de différentes façons ; le score NYHA est le plus couramment utilisé et il contribue à de nombreux scores de défaillances viscérales (SDV) [27]. Les scores de risque de survenue de complications cardiaques postopératoires pour la chirurgie non cardiaque ont montré la voie [28] [29]. L'ischémie coronarienne préopératoire est mal prise en compte par ces scores (et les autres !), alors qu'elle grève lourdement le pronostic.

Pour la chirurgie cardiaque, le score de Parsonnet a été le premier utilisé [30]. C'est avant tout un score de prévision préopératoire, indépendant des données per- et postopératoires, à la différence du score Euroscore. Il permet d'identifier une population à très haut risque de mortalité, chez les patients affichant un score supérieur à 20. Certaines imperfections et imprécisions ont conduit à sa révision récente [31]. Il serait plus discriminant que l'APACHE II [32]. Sa validation repose sur un grand nombre d'opérés ; il reste relativement peu utilisé en Europe [33].

Les malades coronariens de soins intensifs et de chirurgie cardiovasculaire ne faisaient pas partie de l'ensemble de construction et de validation des SGG. Ils auraient pu représenter a priori un défi pour les SGG, du fait de la correction rapide des grosses anomalies physiologiques post-CEC (certaines sont d'ailleurs masquées par des « prothèses » ou des inotropes, des pacemakers), parce que les antécédents, particulièrement important sur ce terrain, sont mal valorisés par les scores SG. Pourtant les malades cardiovasculaires ne sont pas très différents des autres patients de réanimation, on en veut pour preuves les bonnes performances de l'APACHE II, qui est capable de prédire les très hauts risques (scores > 30) [34]. L'IGS II, quant à lui s'est révélé aussi performant que le score de Parsonnet pour prédire la morbidité et la mortalité en chirurgie cardiaque [35] [36]. Il est surprenant que les tentatives pour intégrer les facteurs intra-opératoires (durée de circulation extracorporelle, durée de clampage aortique) n'aient pas abouti à une meilleure prédictibilité [37]. Les deux plus grandes bases de données sur ce thème sont celle de la Society of Thoracic Surgery (STS) [38] et celle de la base européenne EUROSCORE, qui a abouti au score de même nom [39].

AUTRES SCORES

Score de Glasgow

Il est le score le plus utilisé pour coter la sévérité initiale d'un traumatisme crânien [5]. Il est moins efficace pour décrire l'évolution de l'état neurologique et pour prédire le pronostic fonctionnel ultérieur [40]. Il peut également être utilisé pour le pronostic des accidents vasculaires cérébraux [41]. Il participe à la constitution de l'IGS, de l'APACHE II, et de beaucoup de scores de défaillance d'organes.

Scores des polytraumatisés

Le Trauma Score consiste en « poids » affectés à sept variables : ouverture des yeux, réponse verbale, réponse motrice, remplissage capillaire, rythme respiratoire et pression artérielle systolique [42]. Il va de 1 à 16, il est bien corrélé avec la mortalité, et a été validé prospectivement pour les traumatismes ouverts ou fermés ; son principal inconvénient est un taux élevé de faux négatifs. Le Revised Trauma Score (RTS) est calculé à partir de la fréquence cardiaque, de la fréquence respiratoire et du score de Glasgow du patient à sa prise en charge. Il évalue la réponse physiologique au traumatisme. La méthode TRISS, à partir de l'ISS, du RTS et de l'âge du patient permet de calculer une probabilité de décès. On ne peut pas transposer intégralement l'application de ces scores développés aux États-Unis, les modalités de prise en charge des polytraumatisés étant très différentes de part et d'autre de l'Atlantique [43].

Insuffisance respiratoire et syndrome de détresse respiratoire aiguë

Le pronostic des défaillances respiratoires est en général difficile à formuler [44]. Prévoir la durée de ventilation n'est pas à la portée de la plupart des scores ni des épreuves fonctionnelles respiratoires préopératoires [45]. La persistance d'une ou de plusieurs défaillances est en général la cause principale de prolongation de la ventilation. Le problème est encore plus ardu avec le syndrome de défaillance respiratoire aiguë (SDRA) de l'adulte ; la construction d'un indice de gravité spécifique a longtemps achoppé sur des problèmes de définition de cette pathologie.

Choc septique

Aucun des nombreux scores proposés dans ce domaine n'emporte l'adhésion [18].

Pancréatites aiguës

L'évaluation initiale rapide de la gravité de la pancréatite aiguë (PA) est déterminante pour orienter les patients dans une structure adaptée et permettre l'optimisation de leur prise en charge. L'IGS I et l'APACHE II [46] ont déjà montré une efficacité équivalente à celle des scores déjà anciens de Ranson [1] et Imrie. Cela a été confirmé récemment et étendu à l'IGS 2 [47]. L'utilisation de scores spécifiques ne semble plus utile dans la PA.

Insuffisance rénale aiguë

Les scores sous-estiment en général le poids de l'insuffisance rénale, en particulier dans le cadre de la chirurgie en urgence [48].

Cancérologie et hématologie

Un score spécifique, fondé sur la régression logistique, a été développé récemment sur un collectif de 1 471 patients d'oncologie admis en réanimation [49].

Toxicologie clinique

Les scores généralistes ne prennent que très peu en compte les conséquences potentielles extrêmement variées des intoxications aiguës. La mise au point d'outils applicables à tous les toxiques n'avait pas suscité beaucoup d'intérêt jusqu'à présent, mais récemment le Poisining Severity Score (PSS) a été mis au point et validé sur neuf toxiques sur les malades de 14 centres anti-poisons [50]. Sa version plus évoluée (TOXSCORE) n'a pas encore été validée.

COMPARAISON DES SCORES

Les différents scores spécifiques et généralistes ont été testés sur presque tous les types de population de malades. Il n'est pas possible de les citer tous, le tableau II et le tableau III tiennent lieu de résumé.

Polytraumatisés

Le score IGS II-SAPS est aussi performant que les scores spécialisés TRISS et ISS pour les polytraumatisés [51]. Les scores de défaillance d'organes ont été testés dans de grandes séries de polytraumatisés : le SDRA survient dans 25 % des cas et est bien souvent la première défaillance [52]. Les scores ISS et SSS (associé au suivi du taux de lactates) supplantent l'APACHE III dans la prédiction de survenue de SDRA ou d'une défaillance polyviscérale [53].

Traumatisés crâniens

Le score de Glasgow reste ici le gold standard, d'autant que beaucoup de SGG l'incorporent d'une façon ou d'une autre. Selon certains, il serait suffisant à lui seul pour prédire le risque global [54]. Le MPM a montré une nette supériorité pronostique sur une cohorte de 400 traumatisés crâniens, ce qui tendrait à montrer que les variables « non score de Glasgow » jouent un rôle non négligeable dans le pronostic [55].

Tableau II. Comparaison de l'efficacité des différents scores en fonction des pathologies.

Type de pathologie

Scores spécifiques

Scores généralistes

Résultat comparaison : avantage

Cirrhose
Hémorragies digestives

Child-Pugh [96] [97]

APACHE II [98]
IGS II [99]

Child-Pugh

Sepsis

[100]

SOFA [18]
[100]

IGS II + SDV
[101]

AVC

Glasgow

APACHE II

Glasgow [41]

Cancer

MPM customisé [49]

TISS [102]
APACHE II [103]

MPM customisé

Infections
nosocomiales

[104]
[57]

APACHE II - TISS
[104]

 

Pneumonie

[56]

 

 

SDRA [sida]

 

[58]

APACHE II

Infarctus

[3] [5] [105] [106]

APACHE II

APACHE II

Œdème pulmonaire
cardiogénique

CPE Index [107]

APACHE II

CPE Index

Insufffisance rénale
aiguë

 

[48] [108] [109]

Les SGG sous-estiment
la gravité

Maladies infectieuses

Dans ce cadre particulier, des systèmes de stratifications du risque ont été élaborées pour décrire aussi bien les infections de cicatrices chirurgicales que les pneumopathies [56], les pneumopathies induites par la ventilation assistée [57], le sida [58] et les péritonites [7] [59].

FORCES ET FAIBLESSES DES SCORES DE GRAVITÉ

Les scores de gravité sont des entités complexes et néanmoins robustes. La méthodologie statistique est bien codifiée : sur un échantillon de taille suffisante, on analyse par des méthodes statistiques simples la relation entre les différents paramètres mesurés et le décès, on définit ainsi un premier ensemble de paramètres qui sont statistiquement liés à la survie. On choisit ensuite un modèle statistique, le plus souvent logistique, de la relation entre probabilité de décès et valeur des paramètres. Ce modèle permet d'une part de définir un second sous-ensemble de paramètres qui sont liés au décès (indépendants les uns des autres), d'autre part de combiner et pondérer ces paramètres de façon à pouvoir estimer la probabilité de décès correspondant à un profil de valeurs des paramètres. Les trois grands scores généralistes récents (IGS II, APACHE III et MPM II) ont tous été validés en externe sur un vaste collectif de malades, et ils remplissent les critères de discrimination (aire sous la courbe ROC [Receiver Operator Curve] > 0,85), ainsi que les critères de calibration (jugée par exemple sur le test de « Goodness of Fit » [60]).

Tableau III. Comparaison de l'efficacité des différents scores en fonction des chirurgies.

Type de chirurgie

Scores spécifiques

Scores généralistes

Résultat comparaison :
avantage

Traumatisme

Trauma Index [93] [110]
Traumascore
TRISS [111]

IGS II [51]
Apache II [112]

IGS II
SDV [53]

Postopératoire
chirurgical

ASA

 

Défauts APACHE II [113]
Insuffisance ASA [115]

Trauma crânien

Glasgow

IGS II
APACHE II et III [114]
MPM

Glasgow [41]
MPM [55]
APACHE III [114]

Chirurgie digestive

ASA [115]
POSSUM [25]

 

 

Pancréatite aiguë

Ranson [1]
Imrie [116]

IGS II [47]
APACHE II [46] [117]
[118]

IGS II, APACHE III [119]

Péritonites
[perforation]

Mannheim peritonitis
Index [MPI] [7] [59]

APACHE II [59] [120]

APACHE II + MPI
APACHE II + SDV

Transplantation
hépatique

 

IGS II [121]
APACHE II et III
MPM II [122]

IGS II- MPM II

Chirurgie de l'aorte
abdominale

Cardiac Risk Index [28] [29]

IGS II [123]

IGS II

Chirurgie cardiaque

Parsonnet [30] [37] [38]
Euroscore [39]

IGS II [35]
APACHE II [34]

 

Chirurgie cancer
pulmonaire

CardioPulmonary Risk Index [124]

APACHE II [125]

APACHE II

Les SGG sont très utilisés dans le monde entier, et sont fortement recommandés par les sociétés savantes ; les SDV ont pour leur part une assise beaucoup plus réduite et sont beaucoup moins utilisés. Les SG peuvent être calibrés spécialement (« customisés ») pour une pathologie spécifique [49] [61] ; c'est plus efficace que la création d'un score spécifique de plus !

Les SGG ont tous été construits principalement à partir de cohortes de malades « médicaux », et il est plausible que le calcul défavorise les malades chirurgicaux [62] (écart de 5 points IGS II en faveur du malade médical par rapport au patient chirurgical « réglé » admis en réanimation).

En dépit d'une mise à jour évolutive et d'une recalibration sur de grandes bases de données de malades de réanimation, les reproches usuels qui leur sont adressés sont toujours pertinents : ils ne sont pas calculables dès l'entrée en réanimation, sauf pour le MPM et ils nécessitent un délai pour être évalués. Les variables qu'ils mesurent sont affectés par le traitement institué - ils doivent être recalibrés pour la population concernée - ils ne permettent pas de prévoir le statut et la qualité de la survie après la sortie de la réanimation.

La détermination de la « plus mauvaise variable » peut dépendre de la fréquence des recueils, et la « plus mauvaise donnée biologique » du score peut là aussi dépendre de la fréquence des prélèvements. La méthode pose problème pour les patients qui restent ou qui décèdent moins de 24 heures après l'admission. La qualité du recueil des données est une des limites importantes de l'utilisation des SGG [63].

Dans les systèmes APACHE et l'IGS, la prédiction de mortalité dépend en fait d'un petit nombre de variables. Il a été prouvé qu'une faible variation due à l'observateur ou à une erreur d'imputation peut avoir des conséquences importantes sur le ratio MO/MP, ce d'autant que le « score physiologique » (APS) contribue pour 50 % à la valeur totale du score. Les six variables les plus influencées par le traitement sont précisément la fréquence cardiaque, la pression artérielle moyenne, le fréquence respiratoire, le pH, les paramètres d'oxygénation et enfin le taux d'hémoglobine. Une variation de notation de deux points modifie le ratio MO/MP de 13 %. Cet inconvénient est moindre pour les scores de défaillances [64].

La différence de durée de séjour introduit un autre biais (lead time bias[65]. La précision pronostique des scores varie beaucoup en fonction du Case-Mix des malades [66]. Elle est meilleure pour les groupes de malades jeunes avec des pathologies opératoires digestives, traumatiques ou neurologiques. Les suites en post-réanimation ou en unités conventionnelles influencent notablement le ratio MO/MP, car une proportion non négligeable de patients décèdent dans les jours qui suivent leur sortie de réanimation.

La prédiction de la durée de séjour en réanimation est loin d'être acquise par tous les scores, il en va de même pour la durée de ventilation qui lui est intimement liée [67]. Le système APACHE III est censé prédire, à partir du diagnostic d'entrée et du score au premier jour, la mortalité et par exemple la durée de ventilation [68]. L'exploration fonctionnelle respiratoire préopératoire est souvent capable d'une telle prévision, par exemple pour la chirurgie cardiaque [69], alors qu'elle est mise en défaut pour la chirurgie de l'aorte abdominale [45].

Limites des scores de défaillances viscérales

Aves les SDV, il est apparu plusieurs problèmes, rendant l'utilisation de ce système de cotation délicate. Tout d'abord, Lemeshow et al. ont pu mettre en évidence un problème d'homogénéité de la cotation de l'atteinte, ensuite les scores proposés mettent sur le même plan toutes les différentes dysfonctions [70], alors qu'une étude réalisée ultérieurement montre bien que la mortalité varie suivant le type de l'organe atteint [71]. L'amélioration du modèle par l'introduction de coefficients de pondération, en y incluant cette fois ci un plus grand nombre de dysfonctions possibles (atteinte hépatique et présence d'un sepsis), s'est traduit par une amélioration de la spécificité de la prédiction du décès. Toutefois les problèmes liés à l'inhomogénéité de la définition des défaillances persistent. Ce problème rémanent ne semble pas encore résolu et limite dans l'immédiat l'intérêt de l'utilisation des score de défaillances viscérales.

Limites des scores de gravité généralistes

Les scores de gravité présentent plusieurs limites, en particulier une inaptitude à prédire l'avenir individuel des patients. Ceci se traduit pour chacun des scores par une impossibilité à classer tous les patients correctement, c'est-à-dire que la capacité à prédire à la fois survie et décès ne dépasse pas 85 %, au détriment de la prédiction du décès. Cela est lié au fait qu'à la fois les moyennes des scores sont proches chez les survivants et chez les décédés et leurs variances étalées, donc que les deux distributions ont des aires de recouvrement trop importantes. Il est cependant probablement peu vraisemblable que l'on puisse mettre au point un système de classification permettant à la fois une haute sensibilité et une haute spécificité, en raison notamment de la variabilité intrinsèque de la mesure. Dans ce cas l'erreur de prédiction du pronostic restera vraisemblablement toujours à un niveau inacceptable pour pouvoir fonder une décision médicale, comme le refus d'admission ou l'arrêt des thérapeutiques [72] [73]. L'avenir sera peut-être au scores « dynamiques » avec suivi quotidien de l'évolution d'un score.

UTILISATION PRATIQUE DES SCORES DE GRAVITÉ

D'une façon générale l'activité de réanimation est très mal valorisée dans les nomenclatures médicales générales telle la CIM 10, les DRG et le PMSI, malgré leurs révisions incessantes [74]. Le Score IGS II est désormais obligatoire en France.

Au prix d'autres manipulations mathématiques, les SGG proposent un pronostic (plus exactement une prédiction de mortalité). La performance du score se jugera alors sur le rapport mortalité prédite (MP) sur mortalité observée (MO) (MP/MO). Certains ont voulu faire de ce quotient le critère d'étalonnage des unités de réanimation.

Aide à la décision des « bailleurs de fonds »

Les gestionnaires de la santé sont persuadés de l'intérêt des informations données par les SG, pour vérifier la bonne utilisation des ressources. L'APACHE III essaie d'ailleurs de répondre à cette attente en proposant un module « Gestion » ; la tentation est grande de comparer l'efficacité et l'efficience des unités de réanimation [75] [76] [77], mais la validité de ces comparaisons a été critiquée [78] même en y associant le score TISS [79]. La comparaison d'unités doit tenir compte également du Case-Mix des patients [66] [80] et enfin de la grande variabilité des pratiques [81].

L'utilisation de l'APACHE a été proposée pour affiner les critères de sortie [82]. La mise en place d'unités intermédiaires entre la réanimation et les unités conventionnelles paraît assez logique, vu le fort contingent de patients à risque faible [83] [84] [85].

Automatisation du recueil des données

Les progrès de l'informatique vont permettre de simplifier et d'alléger l'utilisation en routine des SG. Les données physiologiques cliniques issues des moniteurs, et les données biologiques issues des automates, sont déjà disponibles sous forme digitalisée. Des systèmes de recueil de données informatisées (Clinical information systems), proposent déja le calcul automatique quotidien des différents scores [86]. Les SGG et SDV n'ont pas été conçus au départ pour ce type d'utilisation, si bien que le recueil des données nécessaires influence le résultat du calcul des scores, selon qu'il est manuel ou informatisé (le recueil informatisé entraînant généralement une surévaluation du risque [87]).

Recherches cliniques

Les services de réanimation participent de plus en plus à de grandes bases de données communes, qui sont régionales [88], internationales ou spécialisées : polytraumatisés, péritonites postopératoires ou infections nosocomiales. Sans les SGG, ces bases n'auraient jamais pu voir le jour.

Dans le cadre de l'évaluation et de la qualité

L'amélioration continue de la qualité est au centre des préoccupations de tous les acteurs de santé. La mortalité et la durée de séjour (qui est un reflet global des complications) sont certes les premiers indicateurs, mais ils ne peuvent cependant, à eux seuls, résumer l'efficience et la qualité des soins des unités de réanimation. Il faudrait associer aux SG d'autres indicateurs comme des taux d'incidents et d'accidents, les taux de réadmissions, de réintubations, d'infections nosocomiales. Il faudrait aussi évaluer la qualité de vie après réanimation. Les outils adaptés à cet objectif sont encore rudimentaires [89]. La qualité de vie à six mois ou un an serait plus influencée par l'état de santé antérieur que par le séjour en réanimation à proprement parler [90]. La qualité de vie reste néanmoins médiocre pour les survivants d'un SDRA [91] et pour les rescapés de défaillances polyviscérales dans les suites de chirurgie cardiaque [92]. L'étude répétée, de la sévérité des patients qui s'aggravent, pourrait constituer une preuve indirecte d'une qualité de soins sub-optimale [93]. La durée de séjour en soins intensifs (par catégorie de diagnostic) est une autre facette de la qualité. Il importe de tenir compte également des décès en unités conventionnelles, ainsi que du taux des réadmissions imprévues, grevées souvent d'une mortalité très élevée [94]. Le programme d'assurance qualité pour la chirurgie cardiaque dans l'État de New York, fondé sur une utilisation intensive des scores, pour comparer les équipes entre elles, semble avoir porté ses fruits en quelques années [95].