[Lectura crítica] Finerenone with Empagliflozin in Chronic Kidney Disease and Type 2 Diabetes

Escrito el 08/08/2025
Tau-Relaped Group

Análisis del artículo: CONFIDENCE Trial 

1. Metodología del estudio

El ensayo clínico CONFIDENCE fue un estudio multicéntrico, doble ciego, aleatorizado y controlado activamente, que evaluó la eficacia y seguridad de la terapia combinada con finerenona y empagliflozina en pacientes con enfermedad renal crónica (ERC) y diabetes tipo 2. Se asignaron aleatoriamente 800 participantes en una proporción 1:1:1 a uno de tres grupos: finerenona sola, empagliflozina sola o la combinación de ambos fármacos.

Criterios de inclusión:

  • Diagnóstico de diabetes tipo 2 con HbA1c <11%

  • eGFR entre 30 y 90 ml/min/1.73 m²

  • Albuminuria: relación albúmina/creatinina urinaria (UACR) entre 100 y 5000 mg/g

  • Tratamiento con IECA o ARA II en dosis máxima tolerada

Criterios de exclusión:

  • Insuficiencia cardíaca con fracción de eyección reducida

  • Hiperkalemia >4.8 mmol/L

  • Eventos cardiovasculares recientes (IAM, ACV, hospitalización por IC)

  • Uso reciente de SGLT2i o agentes quelantes de potasio

Desenlace primario: cambio relativo en el logaritmo de la media geométrica de la UACR desde el basal hasta el día 180.

Desenlaces secundarios:

  • Cambios en la UACR al día 210 (30 días después de suspender tratamiento)

  • Cambios en función renal (eGFR), potasio sérico, presión arterial y eventos adversos

Aspectos estadísticos:

  • Análisis de medidas repetidas con modelo mixto

  • Corrección por multiplicidad: método de Holm–Bonferroni

  • Análisis por intención a tratar (ITT) con imputación múltiple de datos faltantes

2. Resultados principales

Participantes:

  • N=800 en análisis de eficacia (269 combinación, 264 finerenona, 267 empagliflozina)

  • Población diversa, representativa de pacientes con ERC y DM2

Desenlace primario:

  • A los 180 días, la combinación redujo la UACR un 29% más que finerenona sola (RR=0.71; IC95%: 0.61–0.82; p<0.001)

  • Y un 32% más que empagliflozina sola (RR=0.68; IC95%: 0.59–0.79; p<0.001)

  • La reducción absoluta de la UACR fue del 52% con combinación, 32% con finerenona y 29% con empagliflozina

Cambios tras suspender tratamiento:

  • La UACR aumentó tras dejar el tratamiento, pero se mantuvo por debajo de los valores basales

Seguridad:

  • Hiperkalemia >5.5 mmol/L: 15.3% (combinación), 18.6% (finerenona), 9.7% (empagliflozina)

  • Discontinuación por eventos adversos: <5% en todos los grupos

  • Insuficiencia renal aguda: rara (<2%)

  • Hipotensión sintomática: poco frecuente (1.1%)

3. Análisis crítico

Fortalezas del estudio:

  • Diseño metodológicamente robusto: aleatorización estratificada, doble ciego, control activo

  • Uso de desenlace validado (UACR) como biomarcador sustitutivo

  • Participación global con diversidad étnica y geográfica

  • Adherencia alta al tratamiento y bajo nivel de pérdidas

Limitaciones:

  • Desenlace primario basado en un marcador subrogado (UACR) sin seguimiento suficiente para eventos clínicos duros como ESKD, muerte cardiovascular o duplicación de creatinina

  • Seguimiento limitado a 180 días + 30 días post-tratamiento: no permite evaluar efectos sostenidos

  • Financiado por la industria farmacéutica (Bayer), aunque el diseño y análisis fueron supervisados por un comité independiente

Implicancia clínica:

  • La combinación de finerenona y empagliflozina mostró efectos aditivos en la reducción de albuminuria, lo que sugiere un potencial impacto en la progresión de la ERC si se confirma en estudios a largo plazo

  • La seguridad fue aceptable, sin incremento significativo de hiperkalemia o eventos graves

  • Este ensayo apoya la estrategia de iniciar simultáneamente ambos fármacos en pacientes seleccionados, en lugar de la titulación secuencial.

    ➤ ¿Qué tipo de diseño se empleó?

    El ensayo CONFIDENCE utilizó un diseño longitudinal con medidas repetidas: se recolectaron datos sobre la UACR (relación albúmina/creatinina urinaria) en múltiples momentos a lo largo del tiempo (hasta 8 visitas entre el día 0 y el día 180, más una visita de seguimiento en el día 210).

    ➤ ¿Cuál es el propósito de usar medidas repetidas?

    Este tipo de diseño permite observar la evolución del efecto del tratamiento a través del tiempo dentro del mismo sujeto, lo que mejora la precisión del análisis, ya que cada sujeto actúa como su propio control.

    ➤ ¿Qué se busca estimar?

    El objetivo primario fue comparar el cambio relativo en UACR (en escala logarítmica) desde el inicio hasta el día 180 entre los tres grupos (finerenona, empagliflozina y la combinación). Este cambio se considera un biomarcador sustitutivo de progresión renal.


    ➤ ¿Qué es un modelo mixto?

    El modelo lineal mixto para medidas repetidas (MMRM) es un modelo estadístico que se usa para analizar datos longitudinales, incorporando:

    • Efectos fijos: efectos generales atribuibles al tratamiento, al tiempo y a otras covariables (por ejemplo, grupo de tratamiento, tiempo, interacción tratamiento*tiempo).

    • Efectos aleatorios: capturan la variación específica de cada individuo (por ejemplo, su valor basal diferente al promedio).

    Se denomina “mixto” porque mezcla ambos tipos de efectos.

    ➤ ¿Cómo se modeló?

    En el estudio se usó como variable dependiente el logaritmo del UACR, por la naturaleza asimétrica de los datos de albuminuria. El modelo puede expresarse así:

    Donde:

    • i es el paciente

    • j es el tiempo (días 0, 14, 30, …, 180)

    • biN(0,σb2): efecto aleatorio del sujeto

    • εijN(0,σ2): error residual

    • β3 captura la interacción entre grupo y tiempo (diferencia de evolución entre tratamientos)

    Este modelo permite:

    • Comparar cambios dentro de un mismo paciente (longitudinal)

    • Comparar cambios promedio entre grupos (efectos fijos)

    • Ajustar por correlación intra-sujeto (efectos aleatorios)

    ➤ ¿Qué técnica de estimación se usó?

    Se utilizó el método de Máxima Verosimilitud Restringida (REML), recomendado para modelos mixtos, ya que mejora la estimación de la varianza de los efectos aleatorios en presencia de efectos fijos.

    ➤ ¿Cómo se manejaron los datos faltantes?

    Usaron imputación múltiple, bajo el supuesto de datos faltantes al azar (MAR). Esto asegura que se aproveche al máximo la información disponible sin introducir sesgos significativos si la ausencia de datos depende de variables observadas.

    También realizaron un análisis de sensibilidad tipo “tipping point” para explorar si los resultados cambiaban al suponer que los datos faltantes no eran aleatorios.


    🔎 Interpretación estadística del resultado principal

    El artículo reporta la “least-squares mean ratio” (razón de medias cuadráticas estimadas), que surge del modelo mixto. Por ejemplo:

    • Comparación combinación vs finerenona: RR = 0.71 (IC95%: 0.61–0.82)→ Esto significa que el cambio en UACR con la combinación fue un 29% mayor en reducción que con finerenona sola.

    • Comparación combinación vs empagliflozina: RR = 0.68 (IC95%: 0.59–0.79)→ Una reducción adicional del 32%.

    Estas razones derivan directamente de la interacción entre tiempo y tratamiento en el modelo mixto.


    🧠 ¿Por qué no usar ANOVA o t-test?

    Porque:

    • Las medidas están correlacionadas dentro de cada paciente.

    • No todos los pacientes tienen la misma cantidad de mediciones.

    • El modelo mixto modela la estructura de la correlación y permite una estimación más precisa y realista de los efectos en estudios longitudinales clínicos.

      📐 ¿Por qué se necesita un ajuste por comparaciones múltiples?

      Cuando un estudio realiza más de una comparación estadística, como es el caso en este ensayo (combinación vs finerenona y combinación vs empagliflozina), el riesgo de obtener un resultado estadísticamente significativo por azaraumenta.

      Ejemplo:

      Si haces 2 pruebas con un nivel de significancia de 0.05, la probabilidad de cometer al menos un error tipo I (rechazar una hipótesis nula que es verdadera) ya no es 5%, sino mayor.

      Por ello, se deben aplicar métodos para controlar el error de tipo I familiar (Family-Wise Error Rate, FWER). El Holm-Bonferroni es uno de ellos.


      📊 ¿Qué es el método de Holm–Bonferroni?

      Es una técnica secuencial de ajuste para comparaciones múltiples que es menos conservadora (y más poderosa) que el Bonferroni clásico, pero mantiene el control del error tipo I global.

      🔢 Pasos del método (simplificado):

      Supón que tienes dos hipótesis (como en este estudio):

      • H1: combinación vs finerenona

      • H2: combinación vs empagliflozina

      Y obtienes los valores-p correspondientes:

      • p₁ = 0.0002

      • p₂ = 0.001

      1. Ordenas los valores-p de menor a mayor:  p₁ = 0.0002 → H1  p₂ = 0.001 → H2

      2. Comienzas comparando el menor valor-p con α/k (α = 0.05, k = número de hipótesis)  → 0.0002 < 0.05/2 = 0.025 → ❗️Rechazas H1

      3. Luego comparas el siguiente valor-p con α/(k – 1):  → 0.001 < 0.05 → ❗️Rechazas H2

      ✅ Así, ambas comparaciones son estadísticamente significativas ajustando por multiplicidad, pero de forma más eficiente que el Bonferroni clásico.


      📌 ¿Cómo se aplicó en el estudio CONFIDENCE?

      El estudio tenía dos hipótesis principales:

      1. ¿La combinación es mejor que finerenona sola?

      2. ¿La combinación es mejor que empagliflozina sola?

      Ambas pruebas eran importantes y se quería mantener el nivel de significancia general del estudio en α = 0.05.

      Usando el método Holm–Bonferroni:

      • Primero se comparó el valor-p más pequeño con 0.025.

      • Si ese era significativo, se validaba el segundo con 0.05.

      Este método evita el error tipo I inflado y permite al mismo tiempo declarar resultados significativos con mayor flexibilidad que el Bonferroni tradicional.

      🔬 Análisis por Intención a Tratar (ITT): Fundamento Metodológico

      1. Marco conceptual: por qué se necesita ITT

      En un ensayo clínico aleatorizado (RCT), la aleatorización tiene como objetivo principal balancear los factores pronósticos conocidos y desconocidos entre los grupos de intervención y control. Es decir, gracias a la asignación aleatoria, se espera que:

      • La distribución de covariables basales (edad, comorbilidades, severidad de enfermedad) sea equivalente entre los grupos.

      • Cualquier diferencia observada en el desenlace pueda atribuirse al tratamiento, y no a confusión.

      👉 La validez interna de un ensayo clínico depende de que se mantenga esta aleatorización en el análisis.


      2. Definición metodológica de ITT

      El análisis por intención a tratar consiste en analizar a cada participante en el grupo al que fue asignado por aleatorizaciónindependientemente de lo que ocurra posteriormente: falta de adherencia, discontinuación del tratamiento, pérdida parcial de seguimiento, cruce a otro grupo, etc.

      2.1. ¿Qué protege?

      ✔️ Preserva la integridad del diseño experimental.✔️ Mantiene el balance basal logrado por la aleatorización.✔️ Reduce el sesgo por selección post-aleatorización, especialmente importante si el abandono del tratamiento está relacionado con la evolución clínica del paciente.


      3. Fundamentos metodológicos en términos causales

      Desde el marco de la inferencia causal (e.g., Rubin Causal Model):

      • El ITT estima el efecto del tratamiento asignado (As-Treated Policy), no el efecto de recibir el tratamiento.

      • Es un estimador del efecto de la política de tratamiento ("treat all assigned") más que del efecto biológico purodel fármaco.

      • Por tanto, el ITT responde a la pregunta:

        ¿Cuál es el efecto de asignar este tratamiento a esta población, independientemente de la adherencia?

      Este estimador puede subestimar el efecto verdadero en caso de no adherencia, pero no introduce sesgo, a diferencia del PP.


      4. Comparación con Per-Protocol (PP)

      4.1. ¿Qué es el PP?

      El análisis per-protocol considera solo aquellos participantes que cumplieron rigurosamente con el protocolo del estudio:

      • Recibieron la intervención asignada,

      • No cruzaron de grupo,

      • No abandonaron el estudio de forma prematura.

      4.2. ¿Qué estima?

      • Estima el efecto del tratamiento bajo adherencia perfecta.

      • Responde a la pregunta:

        ¿Cuál es el efecto del tratamiento en quienes efectivamente lo recibieron y completaron?

      🔴 El PP es sensible al sesgo de selección post-asignación:

      • Quienes abandonan o no cumplen el protocolo no son aleatorios.

      • Su exclusión puede distorsionar la estimación, especialmente si la razón del abandono está relacionada con el desenlace (ej. falta de eficacia, efectos adversos).


      5. Modified Intention to Treat (mITT)

      El mITT es una versión adaptada del ITT que introduce criterios de exclusión posaleatorización, pero antes del análisis.

      5.1. ¿Cuándo se usa?

      En situaciones donde:

      • El paciente fue aleatorizado, pero nunca recibió ninguna dosis del tratamiento asignado.

      • Hay violaciones graves al protocolo o a las Buenas Prácticas Clínicas (GCP), como falsificación de datos, errores de aleatorización, consentimiento inválido, etc.

      5.2. Consideración crítica:

      Si se aplica de forma justificada, preespecificada y transparente, es aceptable. Pero si se utiliza post hoc y sin criterios claros, puede conducir a sesgos por exclusión selectiva.


      6. Aplicación en el ensayo CONFIDENCE

      En el estudio:

      • 818 participantes fueron aleatorizados.

      • Se excluyeron:

        • 4 pacientes que fueron aleatorizados por error y no recibieron tratamiento.

        • 14 pacientes con violaciones críticas del protocolo (violaciones a GCP, no relacionadas con la conducta del estudio).

      Esto representa un enfoque mITT riguroso:

      • La exclusión se hizo antes del análisis,

      • No estuvo basada en el desenlace,

      • Fue reportada de forma transparente,

      • Preservó la integridad de la aleatorización para 800 participantes incluidos en el análisis de eficacia.


      7. Relación con manejo de datos faltantes y sensibilidad

      Incluso con ITT (o mITT), es frecuente que haya pérdida de seguimiento o ausencia de datos en ciertos puntos.

      En esos casos, para mantener la población ITT:

      • Se utiliza imputación múltiple de datos faltantes, bajo el supuesto de missing at random (MAR).

      • Y se realiza un análisis de sensibilidad (tipping point) para probar la robustez.

      Esto complementa el enfoque ITT, ya que permite estimar el efecto del tratamiento asignado sin eliminar participantes con datos incompletos.