Esta es una charla que se dio para Consilium Scientific el 18 de mayo de 2023 por invitación de Leeza Osipenko. Consilium está haciendo más que nadie para plantear preguntas sobre la calidad de la evidencia que tenemos en medicina, en particular en torno a los ensayos Controlados Aleatorizados (ECAs). En los últimos meses han realizado contribuciones fabulosas, que pueden consultarse en su sitio web. Mi conferencia vino acompañada de una sesión de preguntas y respuestas que tuvo su momento de suspense.
Como es habitual en estas conferencias, Bill James y yo también grabamos «If God Doesn’t Play Dice, Should Doctors» en una versión que creo que funciona muy bien.
La charla apela a ideas que pueden encontrarse mejor en el trabajo de Sander Greenland que tiene la memorable frase:
Primero, no hacer daño al conocimiento.
Adaptada por nosotros sería:
No saques veneno de lo bueno.
Einstein
Einstein dijo que Dios no juega a los dados con el universo. En Francia, en 1654, el juego con dados dio origen a la teoría de la probabilidad, que desembocó en lo que hoy llamamos estadística médica. Hace 75 años, los médicos recurrieron a la estadística médica en forma de ECAs para tener confianza a la hora de tirar los dados sobre los fármacos que nos administran.
¿Hasta qué punto debemos confiar?
Cincuenta años después del primer ECA, a Don Schell, un duro petrolero de Wyoming, se le prescribió Paroxetina por un problema menor de sueño. Cuarenta y ocho horas más tarde disparó a su mujer, a su hija y a su nieta, y luego a sí mismo. El yerno que le sobrevivió interpuso una demanda contra GlaxoSmithKline (GSK): Tobin contra SmithKline.
En el caso Tobin, se preguntó a Ian Hudson, Director de Seguridad de GSK, si los ISRS pueden causar suicidio. Hudson respondió que GSK confía en la Medicina Basada en la Evidencia, lo que significa que basan sus opiniones en los resultados de los ECAs: utilizan la probabilidad para encontrar la verdad.
Un jurado de 12 personas, sin experiencia en atención sanitaria, desestimó la MBE de Hudson en favor de la Medicina Basada en lo Evidente. Su resolución fue que era obvio que la paroxetina había causado el comportamiento de Tobin y GSK fue culpable de negligencia.
Sin embargo, la opinión de Hudson sigue dominando el organismo británico regulador de los medicamentos, del que más tarde fue director general, así como el de la FDA, la EMA y otras agencias.
Las opiniones de Ian Hudson y el marco de actuación de todas las agencias reguladoras tienen su origen 70 años antes gracias a la obra de un hombre extraño: Ronnie Fisher. Aquí se ve a Fisher fumando en pipa. Fisher descartaría, más tarde, la posible relación entre el tabaquismo y el cáncer de pulmón. Las pruebas no eran el punto fuerte de Fisher.
Fisher no era médico y nunca realizó un ECA. Los ensayos controlados y la aleatorización ya existían antes que él, pero su libro «Diseño de Experimentos» (1935) les dio un gran impulso.
Fisher intentaba caracterizar el conocimiento experto. Los expertos conocen la respuesta correcta, como el funcionamiento de los paracaídas. Si creáramos dos grupos, uno con paracaídas y otro sin él, esperaríamos que los que llevaran paracaídas vivieran y los que no murieran.
En realidad, lo único que podía impedir que el experto acertara era el azar: tal vez un fuerte viento hiciera caer a una persona en un árbol cubierto de nieve. Al azar se le podía asignar un valor estadístico. Si 1 de cada 20 personas sin paracaídas viviera, no diríamos que el experto no sabía de lo que hablaba.
Podría haber otras cosas triviales que alteraran los resultados -alguien con pies palmeados podría comportarse de manera diferente al caer- pero la aleatorización puede controlar cualquier factor de confusión oculto como éste. De algún modo, el libro de Fisher transformó la aleatoriedad en algo semi-místico que nos ayudaría a superar la ignorancia. Pero lo cierto es que la aleatoriedad no puede controlar la ignorancia.
El experto de Fisher es una especie de Robin Hood que 19 de cada 20 veces puede partir por en medio una flecha previamente clavada en la diana. La pericia es precisa, exacta y del mundo real.
Sin embargo, los ECA realizados para autorizar fármacos, especialmente pasa con los antidepresivos, se parecen más a la imagen arriba que a Robin Hood. Un desajuste de esta escala indica que no estamos ante expertos.
El bioestadístico británico Tony Hill dirigió el primer ECA médico en 1947 en el que se testó la estreptomicina para la tuberculosis. Hill también demostraría más tarde, en contra de la opinión de Fisher, que fumar causaba cáncer de pulmón. Pero Hill, no tenía tiempo para Fisher. Sabía que los médicos no eran expertos. Su ensayo no fue una demostración de pericia. Bradford Hill utilizó la aleatorización como un método adecuado para la asignación de pacientes y no para gestionar factores de confusión místicos.
El ECA de Hill, no obstante, descubriría menos sobre la estreptomicina que un ensayo previo no aleatorizado de la Clínica Mayo que demostró que el fármaco puede causar sordera y que el bacilo de la TBC desarrolla resistencia rápidamente.
En una conferencia de 1965, Hill hizo balance de los ECAs. Menciona que es interesante que quienes más promueven los ECAs sean las empresas farmacéuticas.
No creía que los ensayos tuvieran que ser aleatorios. Además pensaba que el doble ciego podía entorpecer la evaluación de un fármaco por parte de los médicos. Parecía confiar más en la Medicina Basada en lo Evidente que en la Medicina Basada en la Evidencia.
Hill decía que en 1950 necesitábamos ECAs para saber si algo funcionaba. Pero en 1960 ya teníamos muchos fármacos que funcionaban, ninguno descubierto mediante ECA, y la verdadera necesidad era averiguar qué fármaco funcionaba mejor en cada paciente. Esto no es algo que puedan hacer los ECAs: no existe el llamado mejor fármaco.
También dijo que los ECA informan de efectos medios que no sirven de mucho para decirle a un médico qué hacer con el paciente que tiene delante.
Los ECAs pueden ayudar a evaluar algo que produzca un medicamento, explica Hill, pero no son una buena manera de evaluar un tratamiento en general:
«Frecuentemente con los nuevos descubrimientos .. el péndulo va demasiado lejos al principio… Teniendo la adecuada actitud mental, hay más de una manera de poder estudiar la eficacia de un medicamento. Cualquier creencia sobre que los ECAs son el único modo para hacerlo implica, no que el péndulo haya ido demasiado lejos, sino que se ha salido de su gancho»
Todos los ECAs generan ignorancia pero podemos sacar algo bueno del daño si recordamos esto. Hill nunca consideró que los ECA pudieran sustituir al juicio clínico.
En 1960 Louis Lasagna dirigió un ECA con talidomida y corroboraría el argumento de Hill. La talidomida tiene eficacia terapéutica como somnífero pero este ensayo clínico no detectó la disfunción sexual, el suicidio, la agitación, las náuseas y la neuropatía periférica que provocaba.
Dos años más tarde, Lasagna fue el responsable de incorporar los ECAs a la Ley de la FDA de 1962, con el fin de minimizar la posibilidad de que se produjera «otra talidomida». Al hacer esto, se convirtió en la persona que más ha contribuido en la historia a que, hoy en día, el ECA sea hegemónico. El mecanismo que puso en marcha para evitar que la «talidomida» se repitiera la superó con éxito.
Las normativas regulatorias en otros sectores se centran en la seguridad, ya sea en los aviones, los coches, los alimentos o las inversiones. Las reglas introducidas en 1962 por la FDA hacían hincapié en la eficacia y, al proponerlo, comprometieron gravemente la seguridad.
Los años 50 nos dieron los mejores antihipertensivos, hipoglucemiantes, antibióticos y psicofármacos que hemos tenido nunca, todos, sin la aportación de los ECAs.
La imipramina, el primer antidepresivo, es mucho más potente que los ISRS. Puede tratar la melancolía y los ISRS no. La melancolía conlleva un riesgo de suicidio 80 veces mayor que en la población general.
En un ECA de imipramina frente a placebo para la melancolía esperaríamos que los puntos rojos, en la gráfica arriba, que muestran intentos de suicidio, fueran menores con la imipramina, aunque pueda haber casos de suicidio en el brazo del fármaco ya que estamos hablando de una afección de alto riesgo. Este ECA sería una prueba de que la imipramina no puede causar suicidio.
La imipramina se lanzó en 1958. En una reunión celebrada en 1959, los expertos señalaron que, aunque era un tratamiento maravilloso, provocaba suicidio en algunas personas. Si se suspendía el fármaco, desaparecía la tendencia al suicidio. Si se reintroducía, volvía el suicidio. Esto era Medicina Basada en lo Evidente.
En los ECAs realizados con enfermos que padecían depresión leve, que fueron los que introdujeron los ISRS en el mercado, observamos un aumento de los episodios suicidas en comparación con el placebo en personas con poco o ningún riesgo de suicidio a priori.
Utilizada como comparador, en estos ensayos con depresión moderada, la imipramina también causaba más suicidios.
Los resultados diametralmente opuestos de los ECA con imipramina se deben al hecho de que se trata de ensayos para evaluar tratamientos (Treatment Trials) no el efecto de los fármacos (Drug Trials). Si la enfermedad y el medicamento producen efectos similares, los ECA pueden confundirnos. Esto es cierto para la mayoría de las enfermedades y sus tratamientos.
Si quiere ver lo que hace un fármaco debe realizar un ensayo clínico pero con personas sanas.
Este es el aspecto de un ensayo farmacológico. En los estudios realizados con voluntarios sanos en la década de 1980, las empresas descubrieron que los ISRS provocaban suicidio, dependencia y disfunción sexual en los voluntarios. Estos ensayos con fármacos permitieron a las empresas diseñar ECAs de tratamiento de enfermedades que les permitieran ocultar estos problemas.
En los ECAs hay más cadáveres con los ISRS que con el placebo y, sin embargo, los ECAs muestran que los fármacos funcionan. Esto se debe a que la eficacia se mide con una variable subrogada. En el caso de los antidepresivos, se trata de la Escala de Hamilton para la Depresión. Quince años después de su creación, Max Hamilton comentó que esta escala estandariza las entrevistas clínicas, lo que puede ser bueno y malo.
En los ECAs, la escala de Hamilton tiene ítems de suicidio, apetito, sueño, ansiedad y sexo, en todos los cuales tanto la enfermedad como el fármaco pueden producir efectos.
Si Leeza está en un ECA y le pregunto si ha tenido tendencias suicidas en la última semana, si me dice que sí que ha intentado suicidarse, le pondría un 4; pero si me imagino que la causa es el fármaco, le pondría un cero.
Pero las pruebas eliminan el juicio. Si se re-introduce el juicio uno sabe lo que significan los resultados. Las evidencias se han convertido en lo contrario de lo que Tony Hill pretendía.
Además de la aleatorización, Fisher puso la significación estadística en el mapa. En 1980, todos los estadísticos médicos importantes decían que debíamos deshacernos de la significación estadística en favor de los intervalos de confianza.
Esta imagen es del telescopio James Webb. Los intervalos de confianza fueron introducidos por Gauss en 1810 para resolver un problema de telescopios. Debido a los errores de medición, los telescopios a menudo fallaban a la hora de establecer si había una o dos estrellas en un lugar. Como los errores de medición deberían distribuirse normalmente, los intervalos de confianza podían ayudar a distinguir estrellas individuales.
Los intervalos de confianza irrumpieron en la terapéutica a mediados de los ochenta. Destacados estadísticos médicos argumentaron que eran más apropiados que las pruebas de significación. Son más apropiados para el error de medición, efectivamente, pero ¿es esto lo que nos ocurre en los ensayos terapéuticos?
Los intervalos de confianza nos permiten estimar el tamaño de un efecto y la precisión con la que se conoce. Los datos sobre la probabilidad de letalidad del Fármaco Rojo son más precisos que los del Fármaco Amarillo. Sin embargo, con la mejor estimación, la letalidad del Fármaco Amarillo es menor. La opinión generalizada es que si aumentamos el tamaño del ensayo con el Fármaco Amarillo tendremos mayor precisión y sabremos mejor cuáles son los riesgos. Esto es erróneo, como se verá.
Si a usted le obligan a tomar uno de estos fármacos, tal y como están las cosas ahora, Ian Hudson y la FDA le dirán que el único fármaco peligroso aquí es el Rojo. Esto se debe a que más del 95% de los datos, más de 19 de cada 20 puntos de datos, se encuentran a la derecha de la línea del 1,0. Esto es exactamente lo que los estadísticos médicos dicen que está mal.
Yo tomaría el fármaco Rojo, porque estos intervalos de confianza no están midiendo el error de medida y no sabemos lo que significan cuando no están representando el error de medida.
En 1991, frente a las reclamaciones de que el Prozac causaba suicidios, Lilly analizó sus ECAs y presentó los intervalos de confianza como prueba de que el Prozac no causaba suicidios. Este es el pensamiento de Ian Hudson y las agencias reguladoras: no hay problema porque nada es estadísticamente significativo.
Sander Greenland y destacados estadísticos médicos dicen que hay que ver esto como intervalos de compatibilidad más que como intervalos de confianza. Todas estas curvas muestran una compatibilidad con que Prozac causa suicidio y el exceso de eventos suicidas en todos los grupos apunta consistentemente a que tenemos un problema.
El punto más importante es que tenemos que aceptar lo que durante 100 años los estadísticos nos han estado diciendo: no podemos asumir que los datos estadísticos tengan alguna relación con el mundo real.
Aquí se muestra una representación de los casos de suicidio en los ensayos de comercialización de Prozac, Seroxat y Zoloft alrededor de 1990. Obsérvense los actos suicidas durante el periodo de lavado tras el cribado. En el periodo de lavado, 2 semanas antes de que comience el ensayo, se retiran todos los fármacos que las personas seleccionadas estaban tomando anteriormente antes de asignarlas al azar. Esta fase del ensayo es peligrosa ya que las personas sufren síndrome de abstinencia y pueden tener tendencias suicidas.
Al presentar los datos a la FDA, las empresas movieron los eventos suicidas como se ve en la gráfica arriba, argumentando que los pacientes que estaban en la fase de lavado no llevaban tratamiento y que, por tanto, era equivalente a estar con placebo. Hubo otras maniobras al final de los ensayos como puede verse.
Incluso con estas maniobras, hubo un exceso de eventos suicidas con los ISRS, pero el intervalo de confianza del 95% ya no estaba a la derecha de 1,0. ¿Por qué hacer esto? Porque los reguladores y las empresas necesitan un mecanismo Stop-Go y la significación estadística lo proporciona. Pero los médicos no necesitan un mecanismo Stop-Go externo que sustituya su juicio clínico, así que ¿por qué aceptamos esto como evidencia?
Nadie se percató de estas maniobras en 1990, pero 10 años más tarde, durante la crisis en la que los niños se volvían suicidas cuando tomaban ISRS se plantearon preguntas. GSK y Pfizer respondieron:
«GSK no presentó intencionadamente ninguna información errónea o engañosa a la FDA. Los datos sobre suicidios presentados a la FDA identificaban explícitamente cuándo se producían los acontecimientos durante el periodo de experimentación con placebo. La FDA disponía de toda esta información desde el principio».
«El informe de Pfizer de 1990 a la FDA muestra claramente… que 3 intentos de suicidio ocurrieron durante la fase de enmascaramiento simple con placebo… La FDA no ha criticado estos datos o el informe como inapropiados, ni ha requerido análisis adicionales».
Estas maniobras violan las regulaciones de la FDA y así fue señalado por el personal de la FDA. Sin embargo, los altos cargos de la FDA hicieron caso omiso e incluso pusieron su nombre en artículos que defendían estas cifras ilegítimas para argumentar que los ECAs controlados con placebo no eran poco éticos ya que los que tomaban placebo no corrían ningún riesgo mayor que los que recibían tratamiento.
La FDA y las empresas farmacéuticas colaboraron estrechamente en la crisis de los suicidios de 1990. ¿De forma criminal? Quizás. Prefiero llamarlo «ignorancia estratégica».
Estamos ante una crisis en la producción del conocimiento. Y no podemos esperar que la FDA tome la iniciativa: son burócratas. Los médicos deberían ser los generadores del conocimiento médico pero desaparecieron en combate alrededor de 1990, dejando a las farmacéuticas la capacidad de crear esta apariencia de conocimiento.
Tras la crisis de los suicidio en niños la FDA quería los datos de los ensayos con adultos y que las empresas no hicieran las mismas maniobras que antes. GSK presentó estos datos que, como se ve, apuntan a un problema con la paroxetina
El mantra sagrado de los ECAs es que la aleatorización controla todos los posibles factores de confusión en todos los universos posibles. La capacidad de la aleatorización para introducir factores de confusión en los ensayos clínicos está a punto de venir al rescate de GSK.
GSK también hizo 2 ensayos en pacientes con Trastorno Depresivo Breve Intermitente (TDBI) que tienen intentos regulares de suicidio. A la paroxetina no le fue bien; uno de los ensayos se interrumpió por lo mal que iba. ¿Por qué hacer estos ensayos?
Cuando se suman estas cifras, de repente la paroxetina protege contra el suicidio. Primero hay que saber que los pacientes con TDBI podrían no ser admitidos en ensayos de Depresión Mayor ya que no tenemos forma de distinguirlos. Algunos pacientes se convierten en IBDD en virtud de una mala respuesta a un ISRS. Lo que ocurre si los pacientes con TSBI están en un ensayo de Depresión Mayor es lo mismo que si se suman grupos de ensayos diferentes.
Este escenario ocurre cada vez que una afección médica es heterogénea, como lo son la diabetes, la demencia, la enfermedad de Parkinson, el cáncer de mama, el dolor de espalda, la hipertensión y la mayoría de las afecciones. En estos casos, la aleatorización ocultará los efectos buenos y malos y nos permitirá utilizar los problemas que causa un fármaco para ocultar los problema que causa un fármaco.
Gráficamente, el fármaco rojo aquí es la curva para la Depresión Mayor sola: más del 95% de los datos están a la derecha de la línea 1.0. La sabiduría tradicional es que añadir algunos eventos más a los ensayos del fármaco rojo debería darnos una versión más precisa de la misma estimación.
Añadiendo menos de un 3% más en este caso, hemos desplazado la curva hacia el lado opuesto de la línea 1,0. Es un intervalo de confianza más preciso, pero esta precisión habla de nuestra ignorancia más que de un mejor conocimiento. Los libros de estadística médica no insinúan esta posibilidad.
Podemos añadir hasta 40 sucesos suicidas al brazo de la paroxetina utilizada para la TDBI antes de que GSK tenga que admitir que la paroxetina causa un problema basándose en que los resultados son ahora estadísticamente significativos.
Los intervalos de confianza no nos ayudan a averiguar qué está pasando aquí. No ayudan cuando las respuestas a los fármacos son heterogéneas. Si clonamos a un David sedado por un fármaco rojo y a un Ian Hudson estimulado por éste, la mejor estimación del efecto del fármaco rojo se situará en la línea de 1,0, lo que aparentemente demuestra que este fármaco no tiene ningún efecto sobre el sueño. Un método utilizado originalmente para distinguir si hay una o dos estrellas no puede dar como respuesta que no hay estrellas. Los juicios algorítmicos no pueden sustituir al juicio humano.
He aquí otra imagen del telescopio James Webb. Los intervalos de confianza fueron un paso en el camino para revelar la individualidad de las estrellas. De la genética a la astronomía, la ciencia revela la individualidad, salvo en medicina, donde los enfoques estadísticos aplicados operan en contra de la individualidad.
Estamos legítimamente obligados a ser lo más objetivos que podamos. Debido a nuestro fetichismo con los números, pensamos que utilizar el Azar para controlar el Sesgo nos hará objetivos y permitimos que algoritmos sin sentido sustituyan nuestro juicio clínico. Sin embargo, la medicina clínica, al igual que el derecho y los primeros 300 años de ciencia, han utilizado el Sesgo para controlar el Azar.
A principios de los años ochenta, se extendió la idea de que los ECAs eran la forma más científica y sofisticada de demostrar los efectos adversos, como puede verse en la cita arriba:
«La comunicación espontánea es la «metodología menos sofisticada y científicamente rigurosa para detectar nuevas reacciones adversas a los medicamentos» (Rossi et al.)
Lasagna, el hombre responsable de que hagamos tantos ECAs, se opuso y dijo que esto sólo es cierto si por sofisticado se entiende adulterado (sofisticar el vino significa adulterarlo):
«Esto puede ser cierto si por sofisticado entendemos adulterado. Defiendo que la sencilla comunicación espontánea es una forma más inteligente, informativa, sutil e intelectualmente atractiva para hacerlo que los grandiosos y caros ECAs» (Lasagna, 1983)
La Medicina Basada en lo Evidente es la forma de establecer los efectos adversos y un gran ejemplo apareció unos años más tarde.
En 1990 Martin Teicher y 2 colegas describieron como la fluoxetina provocó ideación suicida en 6 personas. Siguiendo los enfoques clínicos tradicionales para determinar la causalidad, exposición al fármaco, retirada y reintroducción o la escucha del paciente, este artículo establecía fuera de toda duda que la fluoxetina convertía a algunas personas en suicidas.
Aproximadamente otros veinte grupos informaron de hallazgos similares durante el año siguiente, incluyéndome a mí. Se trataba de Medicina Basada en lo Evidente y demostraba que el Prozac podía causar suicidio.
Lilly respondió con este artículo en el BMJ afirmando que un análisis de sus ECAs no mostraba pruebas de que el Prozac provocara suicidios. Dijeron que los casos registrados eran tristes pero anecdóticos y que el plural de anécdota no es dato. La depresión era el problema, no la fluoxetina. Los ensayos clínicos son la ciencia de la causa y el efecto. La pregunta era si íbamos a creer en la ciencia o en las anécdotas.
Este fue un momento fundamental en lo que es hoy en día la generación del conocimiento que probablemente tuvo aportaciones de todas las compañías y quizás de la FDA. Este artículo fundó el movimiento de la Medicina Basada en la Evidencia y, al igual que con los ECAs 30 años antes, quienes hoy exhortan con más énfasis a los médicos para practicar la MBE son principalmente las compañías farmacéuticas.
De hecho, la frase original es «el plural de anécdotas es datos», de lo contrario Google no funcionaría.
La idea de que la enfermedad es responsable de los intentos de suicidio y de suicidios en voluntarios sanos es difícil de creer, pero las empresas pueden sacar a expertos para decir exactamente eso.
Mi punto clave es que la Medicina Basada en lo Evidente es la ciencia y que los datos de Lilly son un artefacto. Mi pregunta para usted es: A quién va a creer ¿a la ciencia o al artefacto?
Lilly afirmó que el Prozac no causaba suicidio, aunque el exceso de casos de suicidio en este estudio era compatible con el hecho de que sí lo causaba.
Todas las compañías «cocinaron» los datos. Sin cocinar, este exceso es estadísticamente significativo.
Pero ese no es el verdadero problema. La incompatibilidad entre una Medicina Basada en lo Evidente y la Medicina Basada en la Evidencia puede ayudarnos a hacer avanzar la ciencia. Si el Prozac fuera tan eficaz como la Imipramina lidiar con la incompatibilidad esbozada anteriormente habría aumentado nuestra experiencia.
Sin embargo, Lilly no estaba por la labor de aceptar las discrepancias. Su argumento era religioso, dogmático. Exigían que ignoráramos lo Evidente.
El movimiento de la Medicina Basada en la Evidencia se ha negado a denunciar la escritura fantasma generalizada en la literatura y la falta de acceso a los datos de los ECAs patrocinados. Es más, no se han opuesto a esta atroz violación de la metodología científica.
La terapéutica implica sacar algo bueno del uso de un veneno. Prestarnos como voluntarios para los ensayos clínicos es un acto peligrosos de generosidad que asumíamos para poder beneficiar a nuestra familia, amigos y compatriotas. Las empresas han estado sacando veneno de este compromiso.
La historia convencionalmente fija que la ciencia comienza con la fundación de la Royal Society en 1660 cuando se afirmó que la ciencia se ocuparía de aquellas cuestiones que pudieran resolverse con datos. Los participantes podían ser cristianos, hindúes, judíos, musulmanes o ateos pero se les pedía que dejaran esas insignias en la puerta y llegaran a un consenso sobre la mejor manera de explicar el resultado experimental que tenían delante.
La historia de la ciencia hacen hincapié en la palabra «Dato». «Establecido» es una palabra más importante. La estadística no jugaba ningún papel en esta ciencia. Los experimentos eran acontecimientos que no necesitaban descripciones estadísticas. La ciencia no sustituía los juicios de valor por un artefacto estadístico; esto sólo empezó hace 33 años.
Esta historia pasa por alto un acontecimiento ocurrido en 1618, cuando Walter Raleigh fue ejecutado por acercarse demasiado a franceses y españoles. Raleigh fue condenado sobre la base de acusaciones dichas contra él por personas que no acudieron al tribunal para ser interrogadas.
El sistema legal reconoció posteriormente la injusticia e introdujo las Reglas de la Prueba. Los rumores no podían utilizarse como pruebas. Los miembros del jurado -un grupo de 12 personas, cristianos, hindúes, musulmanes, ateos y judíos- sólo podían basar su veredicto en el material que se les presentaba y que podía ser examinado y re-preguntado. El proceso de obligar a 12 personas con prejuicios muy diferentes a llegar a un veredicto sobre lo que tienen delante es la esencia de la ciencia.
Los veredictos y diagnósticos son provisionales. Esto, podría parecer, contrasta con la objetividad de la ciencia. Sin embargo, las opiniones científicas son igualmente provisionales. Los científicos intentan anular los veredictos con nuevos datos.
Supongamos que le prescribí fluoxetina a Leeza hace 33 años y que se volvió suicida. Podría examinarla e interrogarla, hacer análisis y escáneres, aumentar la dosis, suspender el fármaco, añadir un antídoto, celebrar una conferencia sobre el caso con todos ustedes, capaces de hacer preguntas para ver si podemos explicarlo de otra manera. Ella es el dato, el laboratorio en el que el experimento está teniendo lugar.
Si Leeza, yo y usted llegamos a la conclusión de que la fluoxetina la hizo suicida e informamos de ello a la agencia británica MHRA o a la norteamericana FDA, lo primero que hará la FDA será eliminar su nombre. Ahora nadie puede examinarla o interrogarla y llegar desde un punto de vista científico si existe una relación o no. Su daño se ha convertido en un testimonio, es decir, en información sesgada.
Si más tarde sufres el mismo tipo de daño y ves decenas de miles de informes de suicidio con ISRS en el sistema de notificación de efectos adversos de la FDA, no puedes llevar esto ante un tribunal porque «Nadie» no puede ser llevado ante un tribunal. Son testimonios, no pruebas.
Los ECAs de las empresas son igualmente testimonios y no deberían ser llevados a los tribunales como pruebas. Acceder a los datos significa acceder a las personas -como Leeza o como yo- pero no podemos hacerlo con los sujetos de los ensayos patrocinados porque, a menudo, no existen. Los artículos de las empresas están escritos por autores fantasmas, que no han visto a ninguno de los pacientes, y que tampoco podrían hablar de lo ocurrido.
En cambio, si Leeza y yo publicamos su caso en una revista médica como informe de un caso, con nuestros nombres, se trata de una prueba y ambos podemos comparecer ante un tribunal.
En 1997, Lasagna se hace eco de lo que Tony Hill dijo 30 años antes:
«En contraste con mi papel en la década de 1950, que era tratar de convencer a la gente de hacer ensayos controlados, ahora me encuentro diciéndole a la gente que no es el único camino a la verdad.
La Medicina Basada en la Evidencia se ha convertido en sinónimo de ECA, a pesar de que estos ensayos invariablemente no le dicen al médico lo que quiere saber, es decir, qué fármaco es mejor para el Sr. Jones o la Sra. Smith, no lo que le ocurre a una persona media inexistente»
Los ECAs han creado un escenario en el que los fármacos tienen solo beneficios y no problemas. Esto está llevando a la polifarmacia que se señaló como un problema en torno al año 2000.
En 2016, más del 40% de las personas mayores de 45 años en EE. UU. tomaban tres o más medicamentos todos los días del año. Más del 40% de los mayores de 65 años tomaban 5 o más medicamentos cada día de la semana. La esperanza de vida en EE.UU. ha descendido drásticamente, todo ello antes de la llegada de Covid.
Reducir la carga de medicación puede aumentar la esperanza de vida, reducir las hospitalizaciones y mejorar la calidad de vida.
Pero reducir la carga de medicación no es fácil, como ilustra esta imagen de la película The Hurt Locker. Muchos de estos fármacos explotan al intentar retirarlos. La deprescripción es la principal tarea médica de nuestra era. Ningún ECA será de ayuda. La mejor evidencia es la experiencia clínica en situaciones similares. Ser capaz de hablar con colegas clínicos ayudará, pero el socio científico clave es el paciente, que aporta pistas de las dosis perdidas de algunos de estos fármacos, y un sentido de lo que los fármacos están haciendo al que sólo se puede acceder a través de ellos. El paciente es el laboratorio en el que se desarrolla el experimento y cada paciente y su respuesta a los fármacos son únicos.
Empezamos con Einstein. Ein Stein significa una piedra – una forma. Hasta ahora no disponíamos de matemáticas que pudieran contrarrestar el promedio que obtenemos de las estadísticas médicas mal aplicadas. Ahora ya la tenemos.
Las matemáticas tratan más de formas que de números, y a principios de este año se descubrió una Nueva Forma, la primera forma aperiódica o verdaderamente individual, lo que significa que no puede incorporarse a otras formas o promedios. Esto puede ofrecernos un marco para unas nuevas matemáticas sólidamente individuales y quizá un marco mejor para la práctica clínica que lo que ha sido tirar los dados -o debería decir el juego amañado- que hemos tenido hasta ahora.
David Healy es Profesor de Psiquiatría.
Fundador y Director Científico de Data Based Medicine
Autor de El naufragio de lo singular
Traducción: Abel Novoa
Trackbacks/Pingbacks