Transcript

e3Pruebas diagnósticas y toma de decisiones médicas

C. Diana Nicoll, MD, PhD, MPA; Michael Pignone, MD, MPH; Chuanyi Mark Lu, MD, PhD

INTRODUCCIÓNLa principal tarea del médico es tomar decisiones razonadas acerca del cuidado del paciente basadas en la información clínica disponible y los resultados clínicos estimados. Aunque los datos extraídos del interrogatorio y la exploración física pueden bastar para formular un diagnóstico o guiar el tratamiento, suele requerirse más información. A la fecha, los médicos confían cada vez más en las pruebas diagnósticas, y enfrentan retos a la hora de seleccionar qué pruebas deben ordenar, así como en la interpretación de los resultados de éstas. El objetivo del presente capítulo es contribuir a que los médicos comprendan la utilidad y las limitaciones de las pruebas diagnósticas en el diagnóstico y tratamiento clínico.

BENEFICIOS, COSTOS Y RIESGOSCuando se usan de forma apropiada, las pruebas diagnósticas pueden resultar de gran utilidad para el médico. Las pruebas pueden ser de ayuda para la detección, por ejemplo, para identificar factores de riesgo de enfermedad y para detectar alguna enfermedad oculta en personas asintomáticas. La identificación de factores de riesgo da oportunidad para realizar intervenciones tempranas que evitan el surgimiento de una enfermedad, del mismo modo que la detección temprana de alguna enfermedad oculta reduce la morbilidad y mortalidad de una enfermedad al aplicar un tratamiento temprano. La medición de la presión sanguínea se recomienda para el cuidado preventivo de adultos con riesgo bajo asintomático. La detección del cáncer de mama, cuello uterino y colon también se recomienda, en tanto que la detección del cáncer de próstata y del cáncer pulmonar es controversial. Las pruebas de detección óptimas deben satisfacer los criterios que se listan en el cuadro e3-1.

Cuadro e3–1. Criterios de uso de procedimientos de detección

Características de la población

1. Prevalencia suficientemente alta de la enfermedad

2. Es de esperarse su cumplimiento con pruebas y tratamientos subsecuentes

Características de la enfermedad

1. Morbilidad y mortalidad significativas

2. Tratamiento disponible efectivo y aceptable

3. Periodo presintomático detectable

4. Mejor resultado con el tratamiento temprano

Características de la prueba

1. Buena sensibilidad y especificidad

2. Costo y riesgo bajos

3. Prueba confirmatoria disponible y práctica

Copyright © The McGraw-Hill Companies. Derechos reservados.Nota de privacidad. Cualquier uso está sujeto a los Términos de Uso y Aviso.

Las pruebas también pueden ser útiles para el diagnóstico, es decir, para ayudar a establecer o excluir la presencia de enfermedad en personas sintomáticas. Algunas pruebas contribuyen en el diagnóstico temprano después del inicio de los signos y síntomas; otras asisten al desarrollo del diagnóstico diferencial, y otras más ayudan a determinar la etapa o actividad de la enfermedad.

Las pruebas pueden ser de ayuda en el manejo del paciente. Así, son de utilidad para: 1) evaluar la gravedad de la enfermedad; 2) estimar el pronóstico; 3) vigilar el curso de la enfermedad (progresión, estabilidad o resolución); 4) detectar la recurrencia de una enfermedad, y 5) seleccionar fármacos y ajustar el tratamiento.

Cuando se ordenan pruebas diagnósticas, los médicos deben valorar los beneficios potenciales contra los costos y efectos adversos. Algunas pruebas implican riesgos de morbilidad o mortalidad; por ejemplo, un angiograma cerebral condiciona un accidente vascular cerebral en 0.5% de los casos. El malestar potencial que acompaña a pruebas como la colonoscopia puede disuadir a algunos pacientes de completar el proceso diagnóstico. El resultado de una prueba diagnóstica puede indicar la necesidad de efectuar nuevas pruebas o un seguimiento frecuente, y el paciente puede resultar afectado por el costo, riesgo y malestar significativos durante los procedimientos de seguimiento.

Además, una prueba falsa positiva puede inducir un diagnóstico incorrecto o pruebas adicionales innecesarias. La clasificación de un paciente saludable como enfermo basado en una prueba diagnóstica falsa positiva puede provocar sufrimiento psicológico y generar riesgos a raíz de un tratamiento innecesario o inapropiado. Una prueba de detección puede identificar una enfermedad que por otra parte podría pasar desapercibida y no haber afectado al paciente. Por ejemplo, en un hombre mayor de 76 años con insuficiencia cardiaca conocida, un cáncer de próstata inicial detectado mediante la determinación del antígeno prostático específico (PSA) tiene una alta probabilidad de no causarle síntomas durante su vida, y en cambio un tratamiento agresivo puede provocarle un daño real.

Los costos de las pruebas diagnósticas también deben comprenderse y considerarse. Los costos totales pueden ser altos, o la efectividad para el costo resultar desfavorable. Incluso las pruebas de un costo relativamente bajo pueden tener una efectividad reducida para el costo si generan escasos beneficios para la salud.

Los factores que afectan de forma adversa la efectividad para el costo incluyen la solicitud de un panel de pruebas cuando una prueba podría haber bastado, la solicitud de una prueba con más frecuencia que la necesaria, y la solicitud de pruebas con el único objeto de documentar el expediente médico. La pregunta operativa para ordenar una prueba es, “¿Afectará el resultado de la prueba el manejo del paciente?” Si la respuesta es “no”, la prueba no se justifica. Pruebas innecesarias generan trabajo, uso de reactivos y costos de equipo improcedentes, y condicionan gastos de cuidados de la salud más altos. Las pruebas genéticas y moleculares son de fácil acceso, y la tecnología de secuenciación a escala del genoma se aplica cada vez más en el ámbito del diagnóstico clínico. Sin embargo, su efectividad para el costo y beneficios en resultados para la salud necesitan examinarse con todo cuidado. Las pruebas diagnósticas genéticas basadas en síntomas (p. ej., pruebas para determinar X frágil en un niño con retardo mental) difieren de las pruebas genéticas predictivas (p. ej., la evaluación de una persona saludable con antecedentes familiares de enfermedad de Huntington) y de las pruebas genéticas de predisposición, las cuales pueden indicar una susceptibilidad relativa a ciertas afecciones o respuestas a ciertos tratamientos farmacológicos (p. ej., pruebas de BRCA-1 o HER-2 para el cáncer de mama). Los beneficios de los resultados de muchas pruebas farmacogenéticas nuevas todavía no se han establecido mediante estudios clínicos prospectivos, así, hay evidencia insuficiente de que las pruebas genotípicas para la dosificación de la warfarina llevan a resultados superiores a los de los algoritmos de dosificación de uso convencional en términos de reducción de los INR por fuera de los límites aceptados. Otras pruebas (p. ej., pruebas para causas hereditarias de trombofilia, como el factor V de Leiden, mutación del gen de la protrombina, etc.) tienen sólo un valor limitado para pacientes en tratamiento dado que el conocimiento de que un paciente es portador de una trombofilia hereditaria no suele modificar la intensidad o duración del tratamiento de anticoagulación. Las pruebas de portador (p. ej., para fibrosis quística) y las pruebas prenatales fetales (p. ej., para el síndrome de Down) requieren a menudo asesoría a los pacientes, de manera que exista comprensión adecuada del impacto clínico, social, ético, y en ocasiones, legal, de los resultados.

Los médicos ordenan e interpretan grandes números de pruebas de laboratorio cada día, y la complejidad de éstas continúa en aumento. El menú extenso y en constante crecimiento introdujo desafíos a los médicos, como seleccionar la prueba de laboratorio correcta e interpretar con idéntica eficiencia sus resultados. Los errores en la selección de la prueba e interpretación de los resultados de ésta son usuales, pero con frecuencia difíciles de detectar. Si se recurriera al empleo de algoritmos de pruebas basados en la evidencia que proporcionan lineamientos para la selección de las pruebas en trastornos específicos y la interpretación de la misma dirigida por expertos (p. ej., reportes y comentarios interpretativos generados por patólogos clínicos), se podría contribuir a reducir tales errores y mejorar la oportunidad y exactitud del diagnóstico.

Alonso-Cerezo MC et al. Appropriate utilization of clinical laboratory tests. Clin Chem Lab Med 2009;47(12):1461–1465. [PubMed: 19863300]

Carter HB. American Urological Association (AUA) guideline on prostate cancer detection: process and rationale. BJU Int 2013;112(5):543–547. [PubMed: 23924423]

Epner PL et al. When diagnostic testing leads to harm: a new outcomes-based approach for laboratory medicine. BMJ Qual Saf 2013;22(Suppl 2):ii6–10. [PubMed: 23955467]

Fang C et al. Cost-utility analyses of diagnostic laboratory tests: a systematic review. Value Health 2011;14(8):1010–1018. [PubMed: 22152169]

Johnson JA et al. Pharmacogenetics and cardiovascular disease—implications for personalized medicine. Pharmacol Rev 2013;65(3):987–1009. [PubMed: 23686351]

Kimmel SE et al. COAG Investigators. A pharmacogenetic versus a clinical algorithm for warfarin dosing. N Engl J Med 2013 Dec 12;369(24):2283–2293. [PubMed: 24251361]

National Collaborating Centre for Acute Care (UK). Preoperative tests: the use of routine preoperative tests for elective surgery [Internet]. 2003 Jun. http://www.ncbi.nlm.nih.gov/books/NBK48489/ [PubMed: 21089235]

Pirmohamed M et al. EU-PACT Group. A randomized trial of genotype-guided dosing of warfarin. N Engl J Med 2013;369(24):2294–2303. [PubMed: 24251363]

Sijmons RH et al. A clinical perspective on ethical issues in genetic testing. Account Res 2011;18(3):148–162. [PubMed: 21574071]

Smellie WS. Demand management and test request rationalization. Ann Clin Biochem 2012;49(Pt 4):323–336. [PubMed: 22734074]

Smith RA et al. Cancer screening in the United States, 2013: a review of current American Cancer Society guidelines, current issues in cancer screening, and new guidance on cervical cancer screening and lung cancer screening. CA Cancer J Clin 2013;63(2):88–105. [PubMed: 23378235]

REALIZACIÓN DE PRUEBAS DIAGNÓSTICAS

PREPARACIÓN DE LA PRUEBALos factores que afectan al paciente y el espécimen son importantes. El elemento crucial de una prueba de laboratorio conducida de acuerdo con los lineamientos es un espécimen adecuado.

Preparación del pacienteLa preparación del paciente es importante para ciertas pruebas, por ejemplo, el estado de ayuno es necesario para efectuar mediciones óptimas de glucosa y triglicéridos; la postura y la ingesta de sodio han de controlarse en forma estricta cuando se miden los niveles de renina y aldosterona, y el ejercicio extremo debe evitarse antes de tomar muestras para determinaciones de cinasa de creatina, ya que la actividad muscular vigorosa puede conducir a resultados que aparentan ser anormales.

Recolección del espécimenDebe otorgarse una atención cuidadosa a la identificación del paciente y al etiquetamiento del espécimen, por ejemplo, conviene utilizar dos identificadores del paciente (nombre y fecha de nacimiento, o nombre e identificador institucional único). Saber cuándo se recolectó el espécimen puede ser importante. El horario correcto reviste particular importancia en la vigilancia de un fármaco terapéutico. Por ejemplo, es imposible interpretar de manera apropiada los valores de los aminoglucósidos sin conocer si el espécimen se extrajo justo antes (nivel “más bajo”) o después (nivel “pico”) de administrar los fármacos. Los niveles farmacológicos no pueden interpretarse si se extraen durante la fase de distribución del fármaco (p. ej., los valores de digoxina extraídos durante las primeras seis horas siguientes a una dosis oral).

Las sustancias que presentan una variación circadiana (p. ej., el cortisol) sólo pueden interpretarse en el contexto del momento del día en que se extrajo la muestra.

Durante la recolección del espécimen conviene recordar ciertos principios. Han de usarse de los dispositivos y tubos de vacío para la recolección estándar de sangre. Los especímenes no deben extraerse por encima de una venoclisis porque, de hacerlo, la muestra se podría contaminar con líquido y fármacos intravenosos (p. ej., heparina). Un tiempo de torniquete excesivo produce resultados de hemoconcentración y una concentración mayor de sustancias unidas a proteínas, como el calcio. La lisis de células durante la recolección de un espécimen de sangre resulta en incrementos séricos espurios de los niveles de sustancias concentradas dentro de las células (p. ej., deshidrogenasa láctica y potasio). Ciertos especímenes para pruebas pueden requerir una manipulación o almacenamiento especial (p. ej., los especímenes para gases en sangre y crioglobulina sérica). El retraso en el envío de los especímenes al laboratorio puede dar oportunidad

para que se suscite cierto metabolismo celular en curso y, por consiguiente, resultados espurios de algunos estudios (p. ej., glucosa sérica baja).

Bowen RA et al. Impact of blood collection devices on clinical chemistry assays. Clin Biochem 2010;43(1–2):4–25 [PubMed: 19822139]

Lippi G et al. Preanalytical quality improvement: from dream to reality. Clin Chem Lab Med 2011;49(7):1113–1126. [PubMed: 21517699]

CARACTERÍSTICAS DE LA PRUEBAEl cuadro e3-2 lista las características generales de las pruebas diagnósticas útiles. La mayor parte de los principios que se detallan a continuación puede aplicarse no sólo a las pruebas de laboratorio y radiológicas, sino también a elementos del interrogatorio y el examen físico. La comprensión de estas características es de suma utilidad para el médico cuando solicita e interpreta pruebas diagnósticas.

Cuadro e3-2. Propiedades de las pruebas diagnósticas útiles

1. La metodología de la prueba se ha descrito con detalle y puede reproducirse con exactitud y confiabilidad

2. La exactitud y precisión de la prueba han sido determinadas

3. El intervalo de referencia se estableció de forma apropiada

4. La sensibilidad y especificidad se establecieron de manera confiable tras su comparación con un estándar de oro. La evaluación usó un espectro de pacientes, como aquellos que tienen trastornos diferentes que suelen confundirse y aquellos con un espectro de enfermedad leve y grave tratada y sin tratar. El proceso de selección de pacientes cuenta con una descripción adecuada, de modo que los resultados no podrán generalizarse de forma inapropiada

5. La contribución independiente de un panel de pruebas al rendimiento general dispone de confirmación si la prueba se reclama como parte de un panel de pruebas

Copyright © The McGraw-Hill Companies. Derechos reservados.Nota de privacidad. Cualquier uso está sujeto a los Términos de Uso y Aviso.

ExactitudLa exactitud de una prueba de laboratorio consiste en su correspondencia con el valor verdadero. Una prueba se considera inexacta cuando el resultado difiere del valor verdadero, incluso aunque los resultados puedan ser reproducibles (figura e3-1A), y también se denomina error sistemático (o sesgo). Por ejemplo, la creatinina sérica se mide de manera habitual con el método cinético de Jaffe, el cual presenta un error sistemático de 0.23 mg/100 ml (20.33 µmol/L) cuando se compara con el estándar de oro, el método de la cromatografía de gases-espectrometría de masas con dilución del isótopo. En el laboratorio clínico, la exactitud de las pruebas se maximiza al calibrar el equipo del laboratorio con material de referencia estándar y mediante la participación en programas de pruebas de capacidad externos.

BA C

Figura e3–1. Relación entre exactitud y precisión en las pruebas diagnósticas. El centro del blanco de tiro representa el valor real de la sustancia que se someterá a prueba. A, una prueba diagnóstica que es precisa pero inexacta; mediciones repetidas producen resultados muy similares, pero todos los resultados están lejos del valor verdadero. B, una prueba que es imprecisa e inexacta; mediciones repetidas producen resultados muy diferentes, y los resultados están lejos del valor verdadero. C, una prueba ideal porque es precisa y exacta. (Reproducida, con autorización, de Nicoll D et al. Pocket Guide to Diagnostic Tests, 6th ed. McGraw-Hill, 2012.)

Copyright © The McGraw-Hill Companies. Derechos reservados.Nota de privacidad. Cualquier uso está sujeto a los Términos de Uso y Aviso.

Precisión La precisión de una prueba es una medida de la reproducibilidad de la prueba cuando se repite en la misma muestra. Si el mismo espécimen se analiza muchas veces, es de esperarse alguna variación en los resultados (error aleatorio); esta variabilidad se expresa como un coeficiente de variación (CV: la desviación estándar dividida por la media, expresado con frecuencia como un porcentaje). Por ejemplo, cuando el laboratorio informa un CV de 5% para la creatinina sérica y acepta resultados dentro de ± 2 desviaciones estándar, denota que, para una muestra con creatinina sérica de 1.0 mg/100 ml (88.4 µmol/L), el laboratorio puede reportar el resultado como cualquier valor de 0.90 (79.56 µmol/L) a 1.10 mg/100 ml (97.24 µmol/L) en mediciones repetidas de la misma muestra.

Una prueba imprecisa es aquella que produce amplias variaciones de los resultados en mediciones repetidas (figura e3-1B). La precisión de las pruebas diagnósticas, la cual se controla en laboratorios clínicos que emplean material de control de calidad, debe ser lo suficientemente buena como para distinguir cambios de relevancia clínica en el estado de un paciente desde la variabilidad analítica (imprecisión) de la prueba. Por ejemplo, el conteo manual diferencial de los glóbulos blancos en la sangre periférica puede carecer de la precisión suficiente para detectar cambios importantes en la distribución de los tipos celulares porque se calcula mediante una evaluación subjetiva de una muestra pequeña (es decir, 100 células). Las mediciones repetidas de la misma muestra por técnicos de laboratorio diferentes producen resultados con amplias variaciones. Los conteos automatizados diferenciales son más precisos debido a que se obtienen con máquinas que utilizan características físicas objetivas para clasificar una muestra mucho más grande (p. ej., 10 000 células).

Intervalo de referenciaAlgunas pruebas diagnósticas se reportan como positivas o negativas, pero varias se reportan en términos cuantitativos. El uso de intervalos de referencia es una técnica para la interpretación cuantitativa de los resultados. Con frecuencia, los intervalos de referencia son específicos de un método y un laboratorio. En la práctica, suelen representar los resultados de la prueba que se encuentran en 95% de una población pequeña que, además, se supone saludable. Por consiguiente, y por definición, 5% de los pacientes saludables arrojará un resultado de la prueba anormal (figura e3-2). Los resultados ligeramente anormales deben interpretarse desde una perspectiva crítica, ya que pueden ser anormales verdaderos o falsos.

En el terreno estadístico, la probabilidad de que una persona saludable tenga dos resultados de la prueba separados dentro del intervalo de referencia es de 0.95 × 0.95 = 0.9025, o 90.25%; para cinco pruebas separadas, es de 77.4%; para 10 pruebas, 59.9%, y para 20 pruebas, 35.8 por ciento.

Media

Normal(95%)

Anormal(2.5%)

Anormal(2.5%)

Resultados de la prueba(por ciento de la población)

Núm

ero

de in

divi

duos

pro

bado

s

Fuente: McPhee SJ, Papadakis MA: Current Medical Diagnosisand Treatment 2011, 50th Edition: http://www.accessmedicine.com

Copyright © The McGraw-Hill Companies, Inc. All rights reserved.

Figura e3–2. A menudo, el intervalo de referencia se define como dentro de 2 SD de la media del resultado de la prueba (se muestra como –2 y 2) en una población chica de voluntarios saludables. Nótese que en este ejemplo, los resultados de la prueba muestran una distribución normal, pese a ello, muchas sustancias biológicas muestran distribuciones que son sesgadas. (Reproducida, con autorización, de Nicoll D et al. Pocket Guide to Diagnostic Tests, 6th ed. McGraw-Hill, 2012.)

Cuanto más grande sea el número de pruebas solicitadas, mayor es la probabilidad de que uno o más de los resultados de la prueba se situarán fuera del intervalo de referencia (cuadro e3-3). A la inversa, es posible que los valores que se sitúen dentro del intervalo de referencia no descarten la presencia real de enfermedad dado que el intervalo de referencia no establece la distribución de resultados en pacientes con enfermedad. Por ello, los intervalos de referencia deben utilizarse dentro del contexto del conocimiento médico acerca del trastorno en cuestión.

También es importante considerar si los intervalos de referencia publicados se adecuan a determinado paciente sometido a evaluación, ya que algunos intervalos dependen de la edad, sexo, peso, dieta, momento del día, estado de actividad, postura, o incluso de la estación. La variabilidad biológica acontece entre individuos y dentro del mismo sujeto. Por ejemplo, los niveles de estrógeno sérico de una mujer varían día tras día en dependencia con el ciclo menstrual; el cortisol sérico muestra una variación diurna, que se caracteriza por ser más alta en la mañana y disminuir por la tarde, en tanto que la vitamina D muestra una variación estacional, con valores más bajos en el invierno.

El cuadro 3 del apéndice contiene los intervalos de referencia de las pruebas químicas y hematológicas de uso más generalizado. Las características del desempeño de la prueba, como su sensibilidad y especificidad, son necesarias a los fines de interpretar los resultados y se describen después.

Factores de interferencia Factores externos como la ingestión de fármacos e internos, como un estado fisiológico anormal, pueden alterar los resultados de las pruebas diagnósticas. Estos factores contribuyen a la variabilidad biológica y deben considerarse en la interpretación de los resultados de la prueba.

Las interferencias externas pueden afectar los resultados de la prueba in vivo o in vitro. In vivo, el alcohol incrementa la glutamiltranspeptidasa γ y los diuréticos pueden afectar las concentraciones de sodio y potasio. Fumar cigarrillos puede inducir enzimas hepáticas y de esa manera reducir los niveles de sustancias como la teofilina que se metabolizan en el hígado. In vitro, las cefalosporinas pueden provocar niveles espurios de creatinina sérica a causa de la interferencia con un método de análisis de laboratorio común.

Las interferencias internas que se derivan de estados fisiológicos anormales alteran la medición de la prueba. Por ejemplo, pacientes con lipemia obvia pueden presentar niveles falsos de sodio sérico bajo si la metodología de la prueba incluye un paso en el que el suero se diluye antes de medir el sodio, y los pacientes con anticuerpos endógenos (p. ej., anticuerpos humanos antirratón) pueden tener resultados espurios altos o bajos en los inmunoensayos automatizados. Debido a la posibilidad de interferencias en la prueba, los médicos deben mantenerse expectantes sobre los resultados de la prueba e investigar las razones por las que pueden explicarse los resultados anormales que no sean la enfermedad, como los errores de laboratorio preanalíticos y analíticos.

Dalenberg DA et al. Analytical performance specifications: relating laboratory performance to quality required for intended clinical use. Clin Lab Med 2013;33(1):55–73. [PubMed: 23331729]

Ismail AA. Interference from endogenous antibodies in automated immunoassays: what laboratorians need to know. J Clin Pathol 2009;62(8):673–678. [PubMed: 19638536]

Lakos G. Interference in antiphospholipid antibody assays. Semin Thromb Hemost 2012;38(4):353–359. [PubMed: 22618529]

Sturgeon CM et al. Analytical error and interference in immunoassay: minimizing risk. Ann Clin Biochem 2011;48(Pt 5):418–432. [PubMed: 21750113]

Sensibilidad y especificidadLos médicos deben usar mediciones del desempeño de una prueba como la sensibilidad y especificidad para juzgar la calidad de una prueba diagnóstica para una enfermedad específica.

La sensibilidad de la prueba es la capacidad de una prueba para detectar una enfermedad y se expresa como el porcentaje de pacientes con la enfermedad en quienes la prueba es positiva. Así, una prueba que tiene una sensibilidad de 90% da resultados positivos en 90% de los pacientes enfermos y resultados negativos en 10% de los sujetos enfermos (falsos negativos). En general, una prueba con alta sensibilidad es útil para excluir un diagnóstico porque origina pocos resultados falsos negativos. Para excluir la infección por el virus que provoca el sida, por ejemplo, un médico puede elegir una prueba con sensibilidad alta como la del antígeno p24 del VIH y la prueba combinada de anticuerpos contra el VIH.

Cuadro e3–3. Relación entre el número de pruebas y la probabilidad de que una persona saludable tendrá uno o más resultados anormales

Número de pruebas Probabilidad de que uno o más resultados sean anormales

1 5%

6 26%

12 46%

20 64%

Copyright © The McGraw-Hill Companies. Derechos reservados.Nota de privacidad. Cualquier uso está sujeto a los Términos de Uso y Aviso.

La especificidad de una prueba es la capacidad para detectar la ausencia de una enfermedad y se expresa como el porcentaje de pacientes sin la enfermedad en quienes la prueba es negativa. Por consiguiente, una prueba que es 90% específica da resultados negativos en 90% de los pacientes sin una enfermedad y resultados positivos en 10% de los pacientes sin la enfermedad (falsos positivos). Una prueba con alta especificidad es útil para confirmar un diagnóstico porque produce pocos resultados falsos positivos.

Por ejemplo, para realizar el diagnóstico de artritis gotosa, un médico puede seleccionar una prueba muy específica como la presencia de cristales de urato birrefringentes con forma de aguja en la evaluación microscópica del líquido articular. Para determinar la sensibilidad y especificidad de una prueba para una enfermedad determinada, la prueba ha de compararse contra una prueba “estándar de oro” independiente o con criterios diagnósticos estándar establecidos que definen el verdadero estado de enfermedad del paciente. Por ejemplo, la sensibilidad y especificidad de las pruebas rápidas de detección de antígeno en el diagnóstico de una faringitis por estreptococo hemolítico β del grupo A se obtienen al comparar los resultados de las pruebas rápidas de antígeno con la prueba estándar de oro, el cultivo de garganta. La aplicación de la prueba estándar de oro a pacientes con pruebas rápidas de antígeno positivas establece su especificidad. La falta de aplicación de la prueba estándar de oro después de una prueba rápida de antígeno negativa puede resultar en una sobreestimación de la sensibilidad dado que no se identificarán los falsos negativos. Pese a ello, en muchos estados de enfermedad (p. ej., pancreatitis), una prueba estándar de oro independiente no existe o es muy difícil o costosa de aplicar, y en tales casos, la estimación confiable de la sensibilidad y especificidad de la prueba es en ocasiones difícil de conseguir.

La sensibilidad y especificidad también pueden afectarse por la población a partir de la cual se derivan estos valores. Por ejemplo, muchas pruebas diagnósticas se evalúan en primer lugar a través de pacientes que tienen una enfermedad grave y grupos de control que son jóvenes y sanos. Comparado con la población general, este grupo de estudio tendrá más resultados reales positivos (porque los pacientes tienen una enfermedad más avanzada) y más resultados reales negativos (porque el grupo de control es saludable). En consecuencia, la sensibilidad y especificidad de la prueba serán más altos que los que cabría esperar en la población general, donde se encuentra más de un espectro de salud y enfermedad. Los médicos deben estar conscientes de este sesgo espectral cuando generalicen los resultados de las pruebas publicados con los de su propia práctica. Para minimizar el sesgo espectral, el grupo de control ha de incluir individuos que tengan enfermedades relacionadas con la enfermedad en estudio, pero que no padezcan la misma enfermedad. Por ejemplo, para establecer la sensibilidad y especificidad de una prueba con un péptido citrulinado anticíclico para la artritis reumatoide, el grupo de control debe incluir pacientes con enfermedades reumáticas que no sean artritis reumatoide. Otros sesgos, como el de la composición del espectro, reclutamiento de la población, estándar de referencia ausente o inapropiado, y sesgo de verificación, también deben considerarse en ciertas situaciones, en las que puede ser necesaria la evaluación crítica de los artículos publicados.

Es importante tener en cuenta que la sensibilidad y especificidad reportadas de una prueba dependen del nivel del analito usado (umbral) para distinguir un resultado de la prueba normal de uno anormal. Si el umbral se reduce, la sensibilidad se incrementa a expensas de la especificidad disminuida. Si el umbral se eleva, la sensibilidad se reduce al mismo tiempo que la especificidad se incrementa (figura e3-3).

Figura e3–3. Distribución hipotética de los resultados de la prueba para los individuos saludables y enfermos. La posición del “punto de corte” de los resultados de la prueba entre “normal” y “anormal” (o “negativo” y “positivo”) determina su sensibilidad y especificidad. Si el punto A fuera el punto de corte, la prueba tendría 100% de sensibilidad pero baja especificidad. Si el punto C fuera el punto de corte, la prueba tendría 100% de especificidad pero baja sensibilidad. En muchas pruebas, el punto de corte se determina por el intervalo de referencia, es decir, el espectro de los resultados de la prueba que se sitúe dentro de 2 SD de la media de los resultados de la prueba en los individuos saludables (punto B). En algunas situaciones, el corte se modifica para aumentar su sensibilidad o especificidad.(Reproducida, con autorización, de Nicoll D et al. Pocket Guide to Diagnostic Tests, 6th ed. McGraw-Hill, 2012.)

EnfermosSin

enfermedad

Resultados de la pruebaA B C

Núm

ero

de s

ujet

os p

roba

dos

Fuente: McPhee SJ, Papadakis MA: Current Medical Diagnosisand Treatment 2011, 50th Edition: http://www.accessmedicine.com

Copyright © The McGraw-Hill Companies, Inc. All rights reserved.

La figura e3-4 muestra de qué manera pueden calcularse la sensibilidad y especificidad de los resultados de la prueba a partir de pacientes previamente clasificados por el estándar de oro de la prueba como enfermo o no enfermo.

Enfermedad

Ausente

FP

TNFN

TPPositiva

Presente

TP = (Sensibilidad) (Probabilidad previa a la prueba)FP = (Especificidad de –1) (Probabilidad previa a la prueba de –1)FN = (Sensibilidad de –1) (Probabilidad previa a la prueba)TN = (Especificidad) (Probabilidad previa a la prueba de –1)

Negativa

Prueb

a

=

=

=

=

(Sensibilidad)(Probabilidad previa a la prueba) +(Especificidad de –1)(Probabilidad previa a la prueba de –1)

(Sensibilidad)(Probabilidad previa a la prueba)

SensibilidadNúmero de pacientes enfermos con la prueba positiva

Número de pacientes enfermos

EspecificidadNúmero de pacientes sin la enfermedad con la prueba negativa

Número de pacientes sin la enfermedad

Probabilidad posteriora la prueba despuésde la prueba positiva

Probabilidad de enfermedad si la prueba es positiva

=

=

=

TN

TN + FP

TP

TP + FN

TP

TP + FP

Fuente: McPhee SJ, Papadakis MA: Current Medical Diagnosisand Treatment 2011, 50th Edition: http://www.accessmedicine.com

Copyright © The McGraw-Hill Companies, Inc. All rights reserved.

Figura e3–4. Cálculo de la sensibilidad, especificidad y probabilidad de enfermedad después de una prueba positiva (probabilidad posterior a la prueba). TP, positivo verdadero; FP, falso positivo; FN, falso negativo; TN, negativo verdadero. (Reproducida, con autorización, de Nicoll D et al. Pocket Guide to Diagnostic Tests, 6th ed. McGraw-Hill, 2012.)

El desempeño de dos pruebas diferentes puede compararse mediante el trazado de las curvas con las características del operador receptor (ROC) en varios intervalos de referencia de los valores de corte. La curva resultante de cada prueba, obtenida mediante el trazado de la sensibilidad contra la (especificidad –1), muestra con frecuencia cuál prueba es mejor. Una prueba inobjetablemente superior tendrá una curva ROC que siempre se ubicará por encima y a la izquierda de la curva de la prueba inferior, y, en general, la mejor prueba tendrá un área más grande bajo la curva ROC. Por ejemplo, la figura e3-5 muestra las curvas ROC del PSA y de la fosfatasa ácida prostática en el diagnóstico del cáncer de próstata. El PSA es una prueba superior porque tiene una sensibilidad y especificidad más alta para todos los valores de corte.

Nótese que, para una prueba determinada, la curva ROC también permite identificar el valor de corte que minimiza los resultados falsos positivos y falsos negativos, el cual se localiza en el punto más cercano al ángulo superior izquierdo de la curva. El valor de corte clínico óptimo, sin embargo, depende de la afección que se detecte y de la importancia relativa de los resultados falsos positivos contra los falsos negativos.Bossuyt X. Clinical performance characteristics of a laboratory test. A practical approach in the autoimmune laboratory. Autoimmun Rev 2009;8(7):543–548. [PubMed: 19200856]Irwin RJ et al. A principled approach to setting optimal diagnostic thresholds: where ROC and indifference curves meet. Eur J Intern Med 2011;22(3):230–234. [PubMed: 21570638]Wacker C et al. Procalcitonin as a diagnostic marker for sepsis: a systematic review and meta-analysis. Lancet Infect Dis 2013;13(5):426–435. [PubMed: 23375419]

Figura e3–5. Curvas características del operador receptor (ROC) del antígeno prostático específico (PSA) y de la fosfatasa ácida prostática (PAP) en el diagnóstico de cáncer de próstata. En todos los valores de corte, el PSA tiene sensibilidad y especificidad más altas, por consiguiente, es una mejor prueba basados en estas características de rendimiento. (Modificada y reproducida, con autorización, de Nicoll D et al. Routine acid phosphatase testing for screening and monitoring prostate cancer no longer justified. Clin Chem 1993;39(12):2540-2541.)

1

.9

.8

.7

.6

.5

.4

.3

.2

.2 .3 .4 .5 .6 .7 .8.1

.10

Sen

sibi

lidad

1 Especificidad

PSA μg/L

PAP U/L

20

10

6

4 21

1.20.8

0.6

0.4

0.3

0.2

Fuente: McPhee SJ, Papadakis MA: Current Medical Diagnosisand Treatment 2011, 50th Edition: http://www.accessmedicine.com

Copyright © The McGraw-Hill Companies, Inc. All rights reserved.

USO DE PRUEBAS EN EL DIAGNÓSTICO Y TRATAMIENTOEn una situación clínica particular, la utilidad de una prueba depende no sólo de las características de la prueba (es decir, sensibilidad y especificidad) sino también de la probabilidad de que el paciente tenga la enfermedad antes de que el resultado de la prueba se conozca (probabilidad previa a la prueba). Los resultados de una prueba útil modifican de manera sustancial la probabilidad de que el paciente tenga la enfermedad (probabilidad posterior a la prueba). La figura e3-4 muestra cómo puede calcularse la probabilidad posterior a la prueba a partir de la sensibilidad y especificidad conocidas de la prueba y de la probabilidad de enfermedad (o prevalencia de la enfermedad) estimada antes de la prueba, basados en el teorema de Bayes.

La probabilidad de enfermedad previa a la prueba, o prevalencia, ejerce un efecto profundo en la probabilidad de enfermedad posterior a la prueba. Como se demuestra en el cuadro e3-4, cuando se usa una prueba con 90% de sensibilidad y especificidad, la probabilidad posterior a la prueba puede variar de 8 a 99% de acuerdo con la probabilidad de enfermedad previa a la prueba. Más todavía, a medida que la probabilidad de enfermedad previa a la prueba disminuye, es más probable que un resultado positivo de la prueba represente un falso positivo.

Cuadro e3–4. Influencia de la probabilidad previa a la prueba sobre la probabilidad de enfermedad posterior a la prueba cuando se usa una prueba con 90% de sensibilidad y 90% de especificidad

Probabilidad previa a la prueba Probabilidad posterior a la prueba

0.01 0.08

0.50 0.90

0.99 0.999

A manera de ejemplo, supóngase que el médico desea calcular la probabilidad de cáncer de próstata posterior a la prueba mediante la prueba de PSA y un valor de corte de 4 ng/ml (4 µg/L). Con los datos que se muestran en la figura e3-5, la sensibilidad es de 90% y la especificidad de 60%. El médico estima la probabilidad de enfermedad previa a la prueba con base en toda la evidencia disponible y después calcula la probabilidad posterior a la prueba con el método que se muestra en la figura e3-4. La probabilidad previa a la prueba de que un hombre saludable de 50 años tenga cáncer de próstata es equiparable a la de la

prevalencia del cáncer de próstata en dicho grupo de edad (probabilidad = 10%) y la probabilidad posterior a la prueba después de una prueba positiva es sólo de 20%. Incluso aunque la prueba sea positiva, todavía existe una posibilidad de 80% de que el paciente no tenga cáncer de próstata (figura e3-6A). Si el médico reconoce un nódulo prostático en el examen rectal, la probabilidad de cáncer de próstata previa a la prueba se eleva a 50% y la probabilidad posterior a la prueba mediante la misma prueba es de 69% (figura e3-6B). Por último, si el médico estima que la probabilidad previa a la prueba es de 98% basado en un nódulo prostático, dolor óseo y lesiones líticas en las radiografías raquídeas, la probabilidad posterior a la prueba, si se usa PSA, es de 99% (figura e3-6C). Este ejemplo ilustra que la probabilidad previa a la prueba ejerce un efecto profundo en la probabilidad posterior a la prueba y que las pruebas proveen más información cuando el diagnóstico es propiamente dudoso (probabilidad previa a la prueba cercana a 50%) que cuando el diagnóstico es improbable o próximo a la certeza.

Probabilidad posteriora la prueba

Probabilidad posteriora la prueba

Pruebapositiva

Probabilidad de enfermedad0 .5 1

Pruebapositiva

Probabilidad de enfermedad

Probabilidad de enfermedad

0 .5 1

0 .5 1

B

C

.1 .2

.98.99

.69

Probabilidad previaa la prueba

Probabilidad posteriora la prueba

Probabilidad previaa la prueba

A

Fuente: McPhee SJ, Papadakis MA: Current Medical Diagnosisand Treatment 2011, 50th Edition: http://www.accessmedicine.com

Copyright © The McGraw-Hill Companies, Inc. All rights reserved.

Probabilidad previaa la prueba

Figura e3–6. Efecto de la probabilidad previa a la prueba y de la sensibilidad y especificidad de la prueba en la probabilidad de enfermedad posterior a la prueba. (Véase el texto para la explicación.) (Reproducida, con autorización, de Nicoll D et al. Pocket Guide to Diagnostic Tests, 6th ed. McGraw-Hill, 2012.)

Gota GF et al. HIV testing strategies: test performance is important, but not sufficient. Expert Rev Anti Infect Ther 2011;9(2):207–214. [PubMed: 21342068]

Ouellette DW et al. Pulmonary embolism. Emerg Med Clin North Am 2012;30(2):329–375. [PubMed: 22487110]

Scott IA et al. Cautionary tales in the clinical interpretation of studies of diagnostic tests. Intern Med J 2008;38(2):120–129. [PubMed: 17645501]

COCIENTES DE POSIBILIDAD-PROBABILIDADOtra forma de calcular la probabilidad de enfermedad posterior a la prueba es usar el método de posibilidad-probabilidad (o posibilidades-probabilidades). La sensibilidad y especificidad se combinan dentro de una entidad que se denomina cociente de probabilidad (LR):

LR = Probabilidad del resultado en las personas enfermas

Probabilidad del resultado en las personas no enfermas

Cuando los resultados de la prueba se dicotomizan, cada prueba tiene dos cocientes de probabilidad, uno correspondiente a una prueba positiva (LR+) y otro correspondiente a una prueba negativa (LR–):

LR+ = Probabilidad de que la prueba sea positiva en las personas enfermas

Probabilidad de que la prueba sea positiva en las personas no enfermas

=Sensibilidad

1 – Especificidad

En las mediciones continuas, puede definirse que los cocientes de probabilidades múltiples corresponden a espectros o intervalos de resultados de la prueba. (Véase cuadro e3-5 para un ejemplo.)

Cuadro e3–5. Cocientes de probabilidad de la ferritina sérica en el diagnóstico de anemia por deficiencia de hierro

Ferritina sérica (pmol/L)Cocientes de probabilidad de la anemia por deficiencia de hierro

≥ 100 µg/L (≥222) 0.08

45-99 µg/L (101-222) 0.54

35-44 µg/L (78-99) 1.83

25-34 µg/L (56-76) 2.54

15-24 µg/L (33-53) 8.83

≤ 15 µg/L (≤33) 51.85

Datos modificados de Guyatt G et al. Laboratory diagnosis of iron deficiency anemia. J Gen Intern Med 1992;7(2):145–153.Copyright © The McGraw-Hill Companies. Derechos reservados.Nota de privacidad. Cualquier uso está sujeto a los Términos de Uso y Aviso.

Los cocientes de probabilidad pueden calcularse mediante las fórmulas previas. También pueden encontrarse en algunos libros de texto, artículos de revistas y programas en línea (véase el cuadro e3-6 de valores de la muestra). Los cocientes de probabilidad proporcionan una estimación de si habrá un cambio significativo de una enfermedad desde la probabilidad previa a la posterior a la prueba con base en el resultado de una prueba, y si por consiguiente puede utilizarse para realizar estimaciones rápidas de la utilidad de las pruebas diagnósticas contempladas para situaciones determinadas. Un cociente de probabilidad de 1 implica que no habrá diferencia entre las probabilidades previa a la prueba y posterior a la prueba. Los cocientes de probabilidad > 10 o < 0.1 indican con frecuencia grandes diferencias con significancia clínica. Los cocientes de probabilidad entre 1 y 2 y entre 0.5 y 1 indican pequeñas diferencias (rara vez de significancia clínica).

Cuadro e3–6. Ejemplos de cocientes de probabilidad (LR)

Enfermedad objetivo Prueba LR+ LR–

Absceso Rastreo abdominal por CT 9.5 0.06

Enfermedad coronaria Electrocardiograma en ejercicio (depresión de 1 mm) 3.5 0.45

Cáncer pulmonar Radiografía de tórax 15 0.42

Hipertrofia ventricular izquierda Ecocardiografía 18.4 0.08

Infarto del miocardio Troponina I 24 0.01

Cáncer de próstata Examen rectal digital 21.3 0.37

Copyright © The McGraw-Hill Companies. Derechos reservados.Nota de privacidad. Cualquier uso está sujeto a los Términos de Uso y Aviso.

El método más simple para calcular la probabilidad posterior a la prueba a partir de la probabilidad previa a la prueba y de los cocientes de probabilidad es usar un nomograma (figura e3-7). El médico coloca una regla a través de los puntos que representan la probabilidad previa a la prueba y el cociente de probabilidad y luego lee la probabilidad posterior a la prueba donde la regla cruza la línea de probabilidad posterior a la prueba.

.1

.2

.5

1

2

5

10

20

30

40

%

99

95

90

80

70

60

50

40

30

20

.2

12

51020

50100200

5001 000

%

10

5

2

1

.5

.2

.1

.001

.002

.005.01.02

.05.1

.5

50

60

70

80

90

95

99Cociente deprobabilidad

Probabilidadposterior a la prueba

Probabilidadprevia a la prueba

Fuente: McPhee SJ, Papadakis MA: Current Medical Diagnosisand Treatment 2011, 50th Edition: http://www.accessmedicine.com

Copyright © The McGraw-Hill Companies, Inc. All rights reserved.

Figura e3–7. Nomograma para determinar la probabilidad posterior a la prueba a partir de la probabilidad previa a la prueba y de los cocientes de probabilidad. Para conocer la probabilidad posterior a la prueba, colóquese una regla entre la probabilidad previa a la prueba y el cociente de probabilidad de cada prueba. La probabilidad posterior a la prueba se situará donde la regla cruce la línea de la probabilidad posterior a la prueba. (Adaptada y reproducida, con autorización, de Fagan TJ. Nomogram for Bayes theorem. [Letter.] N Engl J Med 1975;293(5):257.)

Una manera más formal de calcular las probabilidades posteriores a la prueba usa el cociente de probabilidad como sigue:

Disparidad previa a la prueba × cociente de probabilidad = disparidad posterior a la prueba

Para usar esta fórmula, las probabilidades deben convertirse en posibilidades, donde las posibilidades de tener una enfermedad se expresan como la posibilidad de tener la enfermedad dividida por la posibilidad de no tener la enfermedad. Por ejemplo, una probabilidad de 0.75 es lo mismo que 3:1 posibilidades (figura e3-8).

Posibilidades =Probabilidad

1 – Probabilidad

Ejemplo, si la probabilidad = 0.75, entonces

Posibilidades =0.75

1 – 0.75= = = 3:1

0.75

0.25

3

1

Probabilidad =Posibilidades

Posibilidades + 1

Ejemplo, si las posibilidades = 3:1, entonces

Probabilidad = 3/1

(3/1) + 1=

3

3 + 1= 0.75

Fuente: McPhee SJ, Papadakis MA: Current Medical Diagnosisand Treatment 2011, 50th Edition: http://www.accessmedicine.com

Copyright © The McGraw-Hill Companies, Inc. All rights reserved.

Figura e3–8. Fórmulas de conversión entre probabilidades y posibilidades. (Reproducida, con autorización, de Nicoll D et al. Pocket Guide to Diagnostic Tests, 6th ed. McGraw-Hill, 2012.)

Para estimar el beneficio potencial de una prueba diagnóstica, el médico estima en primer lugar las posibilidades de enfermedad previas a la prueba con base en toda la información clínica disponible y luego multiplica las posibilidades previas a la prueba por los cocientes de probabilidad positivos y negativos. Los resultados representan las posibilidades posteriores a la prueba, o las posibilidades de que el paciente sufra la enfermedad si la prueba es positiva o negativa. Para obtener la probabilidad posterior a la prueba, las posibilidades se convierten en probabilidad (figura e3-8).

Por ejemplo, si el médico cree que el paciente tiene una probabilidad de 60% de sufrir un infarto del miocardio (posibilidades previas a la prueba de 3:2) y la prueba de la troponina I es positiva (LR = 24), las posibilidades de sufrir un infarto del miocardio posteriores a la prueba son:

32

× 24 = 722

o 36:1 posibilidades

36/1(36/1) + 1

= 3637

= probabilidad de 97%

Si la prueba de la troponina I es negativa (LR = 0.01), las posibilidades de sufrir un infarto del miocardio posteriores a la prueba son:

32

× 0.01 = 0.03

2 posibilidades

0.03/2(0.03/2) + 1

= 0.015

0.015 + 1 = probabilidad de 1.5%

Pruebas secuenciales Por lo que se refiere a este asunto, ya se explicó el impacto de una sola prueba en la probabilidad de enfermedad, mientras que durante la mayor parte de los estudios diagnósticos los médicos obtienen la información clínica en una forma secuencial. Para calcular las posibilidades posteriores a la prueba después de tres pruebas, por ejemplo, el médico puede estimar las posibilidades previas a la prueba y usar el cociente de probabilidad apropiado para cada prueba:

Posibilidades previas a la prueba × LR1 × LR2 × LR3 = posibilidades posteriores a la prueba

No obstante, cuando usa este método, el médico debe tener presente una premisa principal: las pruebas o herramientas elegidas deben ser condicionalmente independientes. Por ejemplo, ante el daño de la célula hepática, las enzimas aminotransferasa de aspartato (AST) y aminotransferasa de alanina (ALT) pueden ser liberadas por el mismo proceso y, por tanto, no ser condicionalmente independientes. Si en este método secuencial se emplean pruebas condicionalmente dependientes, resultará una probabilidad posterior a la prueba inexacta.

Linnet K et al. Quantifying the accuracy of a diagnostic test or marker. Clin Chem 2012;58(9):1292–1301.[PubMed: 22829313]

Yo CH et al. Comparison of the test characteristics of procalcitonin to C-reactive protein and leukocytosis for the detection of serious bacterial infections in children presenting with fever without source: a systematic review and meta-analysis. Ann Emerg Med 2012;60(5):591–600. [PubMed: 22921165]

Método del umbral para la toma de decisionesUn aspecto clave de la toma de decisiones médicas se refiere a la selección de un umbral de tratamiento, es decir, la probabilidad de enfermedad a la cual se indica tratamiento. El umbral de tratamiento se determina por las consecuencias relativas de diferentes acciones: realizar tratamiento cuando la enfermedad está presente; no efectuar tratamiento cuando la enfermedad está ausente; tratar cuando la enfermedad está realmente ausente, o no tratar cuando la enfermedad en realidad está presente. La figura e3-9 muestra una forma posible de identificar un umbral de tratamiento al considerar el valor (utilidad) de estos cuatro resultados posibles.

No tratar Tratar

Probabilidad de enfermedad (%)

Umbral detratamiento

0010

A

B

D

C

Util

idad

Fuente: McPhee SJ, Papadakis MA: Current Medical Diagnosisand Treatment 2011, 50th Edition: http://www.accessmedicine.com

Copyright © The McGraw-Hill Companies, Inc. All rights reserved.

Figura e3–9. Umbral de “tratar/no tratar”. A, el paciente no está enfermo y no recibe tratamiento (utilidad más alta). B, el paciente no está enfermo y recibe tratamiento (menor utilidad que A). C, el paciente está enfermo y recibe tratamiento (menor utilidad que A). D, el paciente está enfermo y no recibe tratamiento (menor utilidad que C). (Reproducida, con autorización, de Nicoll D et al. Pocket Guide to Diagnostic Tests, 6th ed. McGraw-Hill, 2012.)

El uso de una prueba diagnóstica se justifica cuando su resultado encierra la posibilidad de cambiar la probabilidad de enfermedad a través del umbral de tratamiento. Por ejemplo, en un paciente con dolor de garganta, un médico puede tomar la decisión de iniciar un tratamiento con antibióticos si la probabilidad de una faringitis estreptocócica es superior a 25% (figura e3-10A).

Si después de revisar la evidencia del interrogatorio y de la exploración física el médico estima que la probabilidad previa a la prueba de que exista una infección estreptocócica de la garganta es de 15%, una prueba diagnóstica como un cultivo faríngeo (LR = 7) sólo sería útil si un resultado positivo de la prueba pudiera modificar la probabilidad posterior a la prueba por encima de 25%. El uso del nomograma que se muestra en la figura e3-7 indica que la probabilidad posterior a la prueba debería ser de 55% (figura e3-10B); por consiguiente, la solicitud de la prueba estaría justificada, ya que afectaría el manejo del paciente. Por otro lado, si el interrogatorio y la exploración física sugieren que la probabilidad previa a la prueba de una infección estreptocócica de la garganta ronda el 60%, el cultivo faríngeo (LR = 0.33) debería indicarse sólo si una prueba negativa haría reducir la probabilidad posterior a la prueba por abajo de 25%. Mediante el mismo nomograma, la probabilidad posterior a la prueba después de una prueba negativa sería de 33% (figura e3-10C). Por consiguiente, la solicitud de un cultivo faríngeo no se justificaría debido a que no modificaría el manejo del paciente.

Este método para la toma de decisiones ya se aplica en la bibliografía clínica.

Análisis de decisión Hasta este momento, la discusión de las pruebas diagnósticas se enfocó en las características de la prueba y los métodos para usar esas características para calcular la probabilidad de enfermedad en diferentes situaciones clínicas. Aunque útiles, estos métodos son limitados porque no incorporan la mayoría de los resultados que se pueden producir en la medicina clínica o los valores que pacientes y médicos proyectan en tales resultados. Para incorporar resultados y valores con características de pruebas, pueden utilizarse los análisis de decisión.

Un análisis de decisión es una evaluación cuantitativa de los resultados que se originan de un conjunto de elecciones en una situación clínica específica. Aunque se usa poco en la práctica clínica de rutina, el enfoque del análisis de decisión puede ser de ayuda para realizar preguntas relacionadas con decisiones clínicas que no pueden responderse con facilidad por medio de los ensayos clínicos.

La idea básica del análisis de decisión es moldear las opciones de una decisión médica, asignar probabilidades a las acciones alternativas, asignar valores (utilidades) (p. ej., tasas de sobrevida, años de vida ajustados a la calidad, o costos) a los diversos resultados, y después calcular qué decisión otorgarle al máximo valor esperado (utilidad esperada). Para completar un análisis de decisión, el médico procedería en la siguiente

Umbral de tratar/no tratar

Probabilidad de enfermedad

.50 1

TratarNo tratar

Probabilidad previaa la prueba

Probabilidad previaa la prueba

Probabilidad posteriora la prueba

Probabilidad posteriora la prueba

Probabilidad de enfermedad

.50 1

TratarNo tratar

Pruebapositiva

Probabilidad de enfermedad

.50 1

TratarNo tratar

Pruebanegativa

A

B

C

Fuente: McPhee SJ, Papadakis MA: Current Medical Diagnosisand Treatment 2011, 50th Edition: http://www.accessmedicine.com

Copyright © The McGraw-Hill Companies, Inc. All rights reserved.

Figura e3–10. Método: umbral aplicado a la solicitud de una prueba. Si la prueba contemplada no modificará el manejo del paciente, no debe solicitarse. (Véase el texto para la explicación.) (Reproducida, con autorización, de Nicoll D et al. Pocket Guide to Diagnostic Tests, 6th ed. McGraw-Hill, 2012.)

forma: 1) delinear un árbol de decisión que exhiba los elementos de la decisión médica; 2) asignarle probabilidades a diferentes ramas; 3) asignarle valores (utilidades) a los resultados; 4) determinar el valor esperado (utilidad esperada) (el producto de la probabilidad y valor [utilidad]) de cada rama; 5) seleccionar la decisión con el valor esperado más alto (utilidad esperada). Los resultados que se obtienen de un análisis de decisión dependen de la exactitud de los datos que se usen para estimar las probabilidades y valores de los resultados.

La figura e3-11 muestra un árbol de decisión en el que la decisión a tomar pasa por tratar sin pruebas, efectuar una prueba y a continuación tratar basado en el resultado de la prueba, o no realizar pruebas ni administrar tratamiento. El médico comienza el análisis con la construcción del árbol de decisión, en el que destaca los elementos importantes de ésta. Después de construir el árbol, el médico asigna probabilidades a todas las ramas. En este caso, todas la probabilidades de las ramas pueden calcularse a partir de: 1) la probabilidad de enfermedad antes de la prueba (probabilidad previa a la prueba); 2) la posibilidad de resultado positivo de la prueba si la enfermedad está presente (sensibilidad), y 3) la posibilidad de resultado negativo de la prueba si la enfermedad está ausente (especificidad). A continuación, el médico asigna valores (utilidad) a cada uno de los resultados.

Tratar

No tratar

Prueba

Enfermedad

Enfermedad

Sin enfermedad

Enfermedad

Sin enfermedad

Prueba +

Prueba –

Prueba –

Prueba +

Sin enfermedad

Resultados

Tratar, enfermedad +, No se hizo prueba

Tratar, enfermedad –, No se hizo prueba

Tratar, enfermedad +, prueba realizada

No tratar, enfermedad +, prueba realizada

Tratar, enfermedad –, prueba realizada

No tratar, enfermedad –, prueba realizada

No tratar, enfermedad +, No se hizo prueba

No tratar, enfermedad –, prueba no realizada

Fuente: McPhee SJ, Papadakis MA: Current Medical Diagnosisand Treatment 2011, 50th Edition: http://www.accessmedicine.com

Copyright © The McGraw-Hill Companies, Inc. All rights reserved.

Figura e3–11. Árbol genérico para una decisión clínica donde las elecciones son: 1) tratar al paciente de forma empírica; 2) realizar la prueba y comenzar el tratamiento sólo en caso de que el resultado de la prueba sea positivo, o 3) abstenerse de efectuar tratamiento. El nudo cuadrado se llama nudo de decisión y los nudos circulares se llaman nudos de posibilidades. p, probabilidad de enfermedad previa a la prueba; Sens, sensibilidad; Spec, especificidad. (Reproducida, con autorización, de Nicoll D et al. Pocket Guide to Diagnostic Tests, 6th ed. McGraw-Hill, 2012.)

Después de calcular el valor esperado (utilidad esperada) de cada rama del árbol de decisión mediante la multiplicación del valor del resultado (utilidad) por la probabilidad del resultado, el médico puede identificar la alternativa con el valor esperado más alto (utilidad esperada). Cuando se incluyen los costos, es posible determinar el costo por unidad de salud lograda de cada método comparado con el de una alternativa (análisis de costo-efectividad). Esta información puede contribuir a evaluar la eficiencia de diferentes pruebas o estrategias de tratamiento.

Aunque insumen tiempo, los análisis de decisión pueden ayudar a estructurar problemas clínicos complejos y contribuir en la toma de decisiones clínicas difíciles.

Aleem IS et al. Clinical decision analysis: incorporating the evidence with patient preferences. Patient Prefer Adherence 2009;3:21–24. [PubMed: 19936141]

Bossuyt PM et al. Beyond diagnostic accuracy: the clinical utility of diagnostic tests. Clin Chem 2012;58(12):1636–1643. [PubMed: 22730450]

Peyrade F et al. Treatment decisions for elderly patients with haematological malignancies: a dilemma. Lancet Oncol 2012;13(8):e344–352. [PubMed: 22846839]

Pletcher MJ et al. Evaluating the clinical utility of a biomarker: a review of methods for estimating health impact. Circulation 2011;123(10):1116–1124. [PubMed: 21403122]

Medicina basada en evidencias En pruebas diagnósticas se gastan vastos recursos. Todo el tiempo se desarrollan y comercializan nuevas pruebas diagnósticas. Los médicos necesitan saber cómo evaluar los estudios publicados sobre nuevas pruebas diagnósticas (p. ej., características de su desempeño) y cómo determinar si una nueva prueba es superior a la(s) prueba(s) existente(s) en términos de utilidad clínica y efectividad para el costo. En este sentido, el examen cuidadoso de la mejor evidencia disponible es esencial.

La medicina basada en evidencias consiste en el cuidado de los pacientes mediante la mejor evidencia disponible para orientar la toma de decisiones clínicas. Confía en la identificación de la evidencia más sólida desde el punto de vista metodológico, la evaluación crítica de los estudios de investigación con validez interna (libre de sesgo) y externa (aplicabilidad y generalización), y en la distribución de resúmenes de evidencia exacta y útil para respaldar la toma de decisiones clínicas. Las revisiones sistemáticas pueden usarse para resumir la evidencia de los resúmenes de distribución, así como sinopsis basadas en la evidencia de la investigación actual. A menudo, las revisiones sistemáticas usan metaanálisis: técnicas estadísticas que combinan la evidencia de diferentes estudios para producir una estimación más precisa del efecto de una intervención o la exactitud de una prueba. El concepto de medicina basada en la evidencia puede aplicarse con facilidad a las pruebas diagnósticas, ya que el uso adecuado de una prueba diagnóstica es parte del proceso de toma de decisiones.

La campaña Choosing Wisely (“elegir con sabiduría”), lanzada por el American Board of Internal Medicine en 2012, alienta a los médicos y sus pacientes a examinar la utilidad de ciertas pruebas de laboratorio y procedimientos médicos, y promueve la elección del cuidado que es necesario, basado en la evidencia, y que no perjudica. Más de 50 sociedades de especialidades se sumaron a la campaña e identificaron pruebas y procedimientos que se emplean de manera habitual en sus campos específicos que se consideran innecesarios o que deben cuestionarse. Tales pruebas y procedimientos innecesarios están disponibles en línea en el sitio web Choosing Wisely (www.choosingwisely.org).

Las guías de práctica clínica han desarrollado de manera sistemática declaraciones cuya intención es apoyar a los practicantes en la toma de decisiones relativas al cuidado de la salud. Las guías de algoritmos y práctica clínica son ahora ubicuas en medicina, desarrolladas por diversas sociedades profesionales o paneles de expertos independientes. Las pruebas diagnósticas son una parte integral de esos algoritmos y guías. Su utilidad y validez dependen de la calidad de la evidencia que conforman las recomendaciones, de su acatamiento actual, y de su aceptación y aplicación apropiadas por los médicos. Aunque algunos médicos están preocupados acerca del efecto de las guías en la autonomía profesional y en la toma de decisión individual, varias organizaciones están tratando de usar el cumplimiento de las guías prácticas como una medida de la calidad del cuidado. Es importante destacar que, pese a todo, estas guías basadas en la evidencia son para usar como complemento, no para reemplazar, del juicio clínico adaptado a pacientes individuales. Más aún, el tratamiento personalizado (es decir, utilizando el diagnóstico avanzado o herramientas pronósticas y la incorporación de las preferencias del paciente para guiar el tratamiento de cada paciente) se incrementa cada vez más como parte de las guías de práctica clínica.

La tecnología de la información computarizada suministra a los médicos información de laboratorio, imágenes, sistemas de vigilancia fisiológica, y de muchas otras fuentes. Los sistemas de apoyo computarizados para la toma de decisiones clínicas, junto con sistemas de comunicación para ordenar pruebas, se usan de manera creciente para desarrollar, implementar y refinar protocolos computarizados para procesos específicos de cuidado derivados de guías de la práctica clínica basadas en la evidencia. Es importante que los médicos usen la tecnología de la información moderna para ofrecer un cuidado médico estándar en su práctica profesional.

Bright TJ et al. Effect of clinical decision-support systems: a systematic review. Ann Intern Med 2012;157(1):29–43. [PubMed: 22751758]

Fiks AG. Designing computerized decision support that works for clinicians and families. Curr Probl Pediatr Adolesc Health Care 2011;41(3):60–88. [PubMed: 21315295]

Newman TB et al. Evidence-based diagnosis. Cambridge University Press, 2009.

Moons KG et al. Quantifying the added value of a diagnostic test or marker. Clin Chem 2012;58(10):1408–1417. [PubMed: 22952348]

Sacks DB et al. Guidelines and recommendations for laboratory analysis in the diagnosis and management of diabetes mellitus. Diabetes Care 2011;34(6):e61–99. [PubMed: 21617108]

Wood DE et al. Choosing wisely: cardiothoracic surgeons partnering with patients to make good health care decisions. Ann Thorac Surg 2013;95(3):1130–1135. [PubMed: 23434251]