Czy nowa era immunoterapii zmienia standard leczenia?
Rzeczywista skuteczność i bezpieczeństwo atezolizumabu z bewacyzumabem w nieoperacyjnym HCC – wyniki meta-analizy
Wprowadzenie atezolizumabu w połączeniu z bewacyzumabem (A+B) jako pierwszej linii leczenia nieoperacyjnego raka wątrobowokomórkowego (uHCC) stanowiło przełom w terapii tego trudnego w leczeniu nowotworu. Badanie IMbrave150 z 2019 roku zapoczątkowało erę immunoterapii w uHCC, wykazując wyższość tej kombinacji w porównaniu z sorafenibem w zakresie poprawy przeżycia całkowitego (OS) i przeżycia wolnego od progresji (PFS). Obecnie dostępne są również inne opcje pierwszej linii, takie jak durwalumab z tremelimumabem (D+T), których wyższość nad sorafenibem wykazano w badaniu HIMALAYA, oraz monoterapia durwalumabem, która wykazała nie gorszą skuteczność w porównaniu z sorafenibem.
Choć badania kliniczne z randomizacją (RCT) są niezbędne do rejestracji nowych leków przeciwnowotworowych, często kwestionuje się ich reprezentatywność dla szerszej populacji pacjentów. “Dane z rzeczywistej praktyki klinicznej dostarczają bezcennego wglądu w skuteczność nowych terapii u pacjentów, którzy nie muszą spełniać rygorystycznych kryteriów kwalifikacji do badań klinicznych” – podkreślają autorzy meta-analizy opublikowanej w Journal of Hepatology.
Szczególnie w przypadku uHCC, gdzie heterogeniczność w zakresie stadium zaawansowania, etiologii choroby wątroby i terapii po progresji znacząco wpływa na oszacowanie OS, dane z rzeczywistej praktyki klinicznej (RWE) są niezwykle cenne. Aby ocenić, czy wyniki uzyskane w warunkach rzeczywistych odzwierciedlają te z badań klinicznych, zespół badaczy przeprowadził meta-analizę danych indywidualnych pacjentów leczonych kombinacją A+B.
Metodologia badania opierała się na systematycznym przeglądzie i meta-analizie z danymi indywidualnymi pacjentów (IPD). Początkowo planowano skupić się na dwóch kombinacjach immunoterapii pierwszej linii zalecanych na podstawie aktualizacji klasyfikacji Barcelona Clinic Liver Cancer (BCLC) z 2022 roku – A+B oraz D+T, jednak z powodu braku dostępności danych porejestracjnych dotyczących D+T, analiza skupiła się wyłącznie na A+B. Do analizy włączono badania obserwacyjne oceniające zastosowanie A+B jako pierwszej linii leczenia systemowego uHCC, w których raportowano co najmniej dwa z następujących punktów końcowych: OS, PFS, całkowity odsetek odpowiedzi (ORR), odsetek kontroli choroby (DCR) lub częstość występowania zdarzeń niepożądanych związanych z leczeniem (trAEs) ocenianych według kryteriów CTCAE wersja 4 lub 5.
Przegląd literatury obejmował bazę MEDLINE, Cochrane i Embase, uwzględniając publikacje od stycznia 2019 do września 2023 roku oraz abstrakty konferencyjne z najważniejszych towarzystw hepatoonkologicznych, w tym American Society of Clinical Oncology (ASCO), European Society of Medical Oncology (ESMO), EASL i AASLD. Protokół meta-analizy został zarejestrowany w PROSPERO (CRD42023483657), a każde badanie zostało ocenione pod względem jakości zgodnie ze skalą Newcastle-Ottawa dla badań kohortowych.
Po dokładnym przeglądzie literatury zidentyfikowano 1399 raportów dotyczących kombinacji A+B w docelowej populacji pacjentów. Do meta-analizy zakwalifikowano łącznie 12 badań obejmujących 2179 pacjentów. Wszyscy otrzymywali A+B jako pierwszą linię terapii systemowej w dawkach zgodnych ze schematem z badania IMbrave150, z wyjątkiem badania Su i wsp. Mediana czasu obserwacji w analizowanej kohorcie wynosiła 12,9 miesiąca (95% CI: 12,4-13,1). Co istotne, w przeciwieństwie do ściśle wyselekcjonowanej populacji z badania rejestracyjnego, w badaniach rzeczywistej praktyki klinicznej uczestniczyli również pacjenci z upośledzoną funkcją wątroby (klasa Child-Pugh B i C).
- Wskaźnik 6-miesięcznego przeżycia całkowitego: 82%
- Wskaźnik 12-miesięcznego przeżycia całkowitego: 65%
- Mediana przeżycia całkowitego u pacjentów Child-Pugh A: 20,9 miesiąca
- Długoterminowe przeżycie 24-miesięczne: 39% pacjentów
- Całkowity odsetek odpowiedzi (RECIST v1.1): 30%
- Odsetek kontroli choroby: 78%
Jak oceniamy efektywność i długoterminowe wyniki leczenia?
Analiza przeżycia całkowitego (OS) została przeprowadzona na podstawie rekonstrukcji danych indywidualnych pacjentów z 11 z 12 kwalifikujących się badań (n = 2135 pacjentów). Jedno badanie nie dostarczyło krzywej OS Kaplana-Meiera i zostało wykluczone. Wskaźnik 6-miesięcznego OS wynosił 82% (95% CI: 76-86; I² = 80%). Biorąc pod uwagę heterogeniczność w raportowaniu wyników Child-Pugh w różnych badaniach, porównano wskaźniki 6-miesięcznego OS u pacjentów, którzy w oryginalnych badaniach jednoznacznie spełniali kryteria marskości Child-Pugh A (Grupa 1, n = 385) z drugą grupą (Grupa 2, n = 1746), której wynik przeżycia nie był stratyfikowany według klasy CP w oryginalnych badaniach.
Grupa 2 obejmowała pacjentów z szerszym zakresem dysfunkcji wątroby, w tym 1395 CP-A, 136 CP-B, 12 CP-C, 43 pacjentów z wynikiem CP ≥7 i 161 pacjentów bez klasyfikacji CP. Zbiorczy wskaźnik 6-miesięcznego OS wynosił 83% (95% CI: 78-86; I² = 0%) dla Grupy 1 i 80% (95% CI: 70-87; I² = 87%) dla Grupy 2, bez statystycznie istotnej różnicy między grupami (χ² = 0,31, p = 0,57). Zbiorczy 12-miesięczny OS całej analizowanej kohorty wynosił 65% (95% CI: 60-70; I² = 70%). Wskaźnik 12-miesięcznego OS wynosił 67% w Grupie 1 i 64% w Grupie 2, bez różnicy między grupami (χ² = 0,14, p = 0,71).
Wykorzystując dane IPD z zaktualizowanej analizy badania IMbrave150, oceniono różnice w medianie OS między pacjentami otrzymującymi A+B w badaniu (n = 336) a pacjentami z kohort obserwacyjnych w Grupie 1 (tj. CP-A, n = 385). Nie stwierdzono istotnej różnicy między medianą OS kohorty IMbrave150 (19,2 miesiąca, 95% CI: 17,0-23,7) a medianą OS pacjentów z rzeczywistej praktyki klinicznej sklasyfikowanych jako CP-A (20,9 miesiąca, 95% CI: 15,7-20,9; p = 0,58).
Przeprowadzono również eksploracyjną analizę w celu oceny zbiorczych szacunków przeżycia po 18 i 24 miesiącach, wykorzystując dane z sześciu i czterech badań, obejmujących odpowiednio 1783 i 1556 pacjentów. Zbiorcze wskaźniki 18- i 24-miesięcznego OS wynosiły odpowiednio 52% (95% CI: 46-58; I² = 90%) i 39% (95% CI: 31-49; I² = 90%). Są to niezwykle ważne informacje, ponieważ dotychczas brakowało danych dotyczących długoterminowej skuteczności A+B.
W zakresie przeżycia wolnego od progresji (PFS), dane dotyczące wskaźników PFS można było zrekonstruować z 11 z 12 badań (n = 1353 pacjentów). Zbiorczy PFS po 6 miesiącach oszacowano na 57% (95% CI: 53-61; I² = 49%). Przeprowadzono analizę podgrup, aby porównać zbiorcze wskaźniki 6-miesięcznego PFS w zależności od wyjściowej funkcji wątroby. Porównano wskaźniki 6-miesięcznego PFS u pacjentów, którzy w oryginalnych badaniach jednoznacznie spełniali kryteria marskości CP-A (Grupa 3, n = 391), z drugą grupą pacjentów (Grupa 4, n = 962), których PFS nie był stratyfikowany według klasy CP w oryginalnych badaniach.
Grupa 4 obejmowała pacjentów z szerszym zakresem dysfunkcji wątroby, w tym 660 sklasyfikowanych jako CP-A, 125 pacjentów sklasyfikowanych jako CP-B, 12 sklasyfikowanych jako CP-C i 165 pacjentów bez stopnia CP. Zbiorczy wskaźnik 6-miesięcznego PFS wynosił 56% (95% CI: 51-61; I² = 23%) dla Grupy 3, w porównaniu z 57% (95% CI: 52-62; I² = 56%) dla Grupy 4. Nie zaobserwowano istotnej różnicy między dwiema grupami (χ² = 0,06, p = 0,81). Zbiorczy 12-miesięczny PFS wynosił 35% (95% CI: 31-39; I² = 60%), bez istotnej różnicy między Grupami 3 i 4 (χ² = 0,16, p = 0,69).
Porównując z danymi IPD z zaktualizowanej analizy badania IMbrave150, oceniono różnice w medianie PFS między pacjentami otrzymującymi A+B w ramach badania rejestracyjnego (n = 336) a pacjentami z Grupy 3 (tj. CP-A, n = 391). Stwierdzono statystycznie istotną różnicę między medianą PFS u pacjentów leczonych poza badaniami klinicznymi (11,8 miesiąca, 95% CI: 10,5-18,1) w porównaniu z medianą PFS w badaniu IMbrave150 (6,9 miesiąca, 95% CI: 5,7-8,6; p <0,0001). Autorzy wyjaśniają, że różnica ta może wynikać z odmiennego podejścia do oceny progresji w warunkach rzeczywistych, gdzie często brakuje ścisłych harmonogramów badań obrazowych i niezależnej weryfikacji zdarzeń progresji.
W praktyce klinicznej PFS często odzwierciedla raczej “czas trwania leczenia”, co może prowadzić do zawyżenia tego parametru. W przeciwieństwie do badań klinicznych, gdzie progresja wymaga rygorystycznej dokumentacji według z góry określonych kryteriów i stanowi silne wskazanie do przerwania leczenia, PFS w badaniach rzeczywistych jest często miarą “czasu trwania leczenia”, co odzwierciedla zmienność wśród lekarzy prowadzących w definiowaniu progresji na podstawie kryteriów klinicznych i tendencję do kontynuowania leczenia po początkowej progresji.
Eksploracyjne analizy wskaźników 18- i 24-miesięcznego PFS były możliwe dla sześciu i trzech badań (odpowiednio 959 i 732 pacjentów). Zbiorcze wskaźniki 18- i 24-miesięcznego PFS wynosiły odpowiednio 26% (95% CI: 17-37; I² = 91%) i 25% (95% CI: 12-45; I² = 95%).
- Zdarzenia niepożądane dowolnego stopnia: 73% pacjentów
- Zdarzenia niepożądane stopnia ≥3: 26% pacjentów
- Przerwanie leczenia z powodu toksyczności: 12% pacjentów
- Najczęstsze działania niepożądane: zmęczenie, biegunka, niedoczynność tarczycy
- Hepatotoksyczność dowolnego stopnia: 17% pacjentów
- Hepatotoksyczność stopnia ≥3: 4% pacjentów
Jak interpretować ryzyko i korzyści immunoterapii?
Odpowiedź radiologiczna na leczenie A+B w rzeczywistej praktyce klinicznej była zgodna z wynikami z badań klinicznych. Dane dotyczące ORR i DCR zrekonstruowano ze wszystkich kwalifikujących się badań: w czterech badaniach odpowiedź oceniano zgodnie z kryteriami Response Evaluation Criteria in Solid Tumors (RECIST) v1.1, podczas gdy w kolejnych czterech badaniach oceniano ją według zmodyfikowanych kryteriów (m)RECIST. W pozostałych czterech badaniach, trzy porównywały odpowiedzi według kryteriów RECIST v1.1 i mRECIST, natomiast w czwartym badaniu odpowiedź oceniano za pomocą RECIST v1.1 lub mRECIST.
Dane dotyczące odpowiedzi radiologicznej były raportowane w poszczególnych badaniach na podstawie oceny lekarza prowadzącego. Dane dotyczące odpowiedzi nie podlegały zaślepionej ocenie ani niezależnej weryfikacji. Uwzględniając pacjentów sklasyfikowanych w badaniach według kryteriów RECIST v1.1 (n = 1009), oszacowano zbiorczy ORR na 30% (95% CI: 28-33, I² = 0%) i zbiorczy DCR na 78% (95% CI: 75-81, I² = 25%). Uwzględniając pacjentów sklasyfikowanych według kryteriów mRECIST (n = 1337), co doprowadziło do zbiorczego ORR wynoszącego 36% (95% CI: 31-42, I² = 71%) i zbiorczego DCR wynoszącego 77% (95% CI: 71-82, I² = 67%).
Profil bezpieczeństwa A+B w warunkach rzeczywistych również był porównywalny z tym obserwowanym w badaniach klinicznych. Występowanie i klasyfikacja trAEs zostały zgłoszone w dziewięciu badaniach. Łącznie zarejestrowano 60 różnych wpisów trAEs. Siedem badań raportowało częstość występowania trAE dowolnego stopnia, co doprowadziło do zbiorczego wskaźnika trAE dowolnego stopnia wynoszącego 73% (95% CI: 68-77, I² = 65%). Osiem badań dokumentowało trAEs stopnia ≥3, co doprowadziło do zbiorczego wskaźnika trAE stopnia ≥3 wynoszącego 26% (95% CI: 18-36, I² = 83%). Zbiorczy wskaźnik przerwania leczenia z powodu toksyczności zrekonstruowany z siedmiu kwalifikujących się badań wynosił 12% (95% CI 8-18, I² = 66%). W 12 badaniach zgłoszono siedem zgonów w wyniku leczenia.
Wśród trAEs związanych z atezolizumabem najczęściej zgłaszane były zmęczenie (dziewięć badań), biegunka (siedem badań) i niedoczynność tarczycy (sześć badań). Zmiany w testach funkcji wątroby były różnie opisywane w poszczególnych badaniach. Trzy badania raportowały oddzielnie wzrost aminotransferazy asparaginianowej i alaninowej, podczas gdy trzy inne badania raportowały łącznie zmiany transaminaz. Jedno badanie raportowało zarówno wzrost fosfatazy alkalicznej, jak i bilirubiny, a cztery badania raportowały tylko wzrost bilirubiny.
Trzy badania raportowały częstość występowania hepatotoksyczności związanej z leczeniem, ze zbiorczym wskaźnikiem hepatotoksyczności dowolnego stopnia wynoszącym 17% (95% CI: 8-35, I² = 81%) i zbiorczym wskaźnikiem hepatotoksyczności stopnia ≥3 wynoszącym 4% (95% CI: 3-7, I² = 0%).
Wśród trAEs związanych z bewacyzumabem, nadciśnienie (dziewięć badań), białkomocz (osiem badań), krwawienie i krwawienie z przewodu pokarmowego (siedem badań) oraz incydenty zakrzepowo-zatorowe (pięć badań) były najczęściej raportowane. Krwawienie z żylaków zostało zgłoszone w trzech badaniach, ze zbiorczym wskaźnikiem wynoszącym 9% (95% CI: 2-37, I² = 92%). Ogółem w pięciu badaniach zarejestrowano 17 przypadków incydentów zakrzepowo-zatorowych.
Warto zauważyć, że nierównomierne i uznaniowe wykorzystanie ezofagogastroduodenoskopii bezpośrednio przed lub w ciągu 6 miesięcy od rozpoczęcia leczenia A+B, co było wymagane w badaniu IMbrave150, mogło wpłynąć na zgłaszaną zbiorczą częstość występowania niektórych trAEs, w tym krwawienia z przewodu pokarmowego, którego częstość była liczbowo wyższa w porównaniu z prospektywnymi badaniami klinicznymi, prawdopodobnie w wyniku szerszych kryteriów włączenia, obejmujących pacjentów z dysfunkcją wątroby poza CP-A, mniej rygorystycznie badanych pod kątem obecności żylaków.
Czy te wyniki powinny zmienić nasze podejście do leczenia pacjentów z uHCC? Zdaniem autorów meta-analizy, przedstawione dane potwierdzają, że skuteczność i bezpieczeństwo A+B obserwowane w badaniach klinicznych przekładają się na rzeczywistą praktykę kliniczną. “Nasze wyniki sugerują zarówno wiarygodność, jak i powtarzalność wyników dotyczących bezpieczeństwa i skuteczności stosowania A+B w pierwszej linii leczenia poza badaniami klinicznymi” – piszą badacze.
Jak zauważają autorzy: “Jedna trzecia pacjentów, którzy rozpoczynają leczenie A+B, pozostaje przy życiu po 24 miesiącach, co daje ważne wskazówki dotyczące potencjału immunoterapii prowadzącej do długoterminowych korzyści u nawet 39% pacjentów”. Te wyniki są szczególnie istotne w kontekście planowania leczenia i rozmów z pacjentami o potencjalnych korzyściach z immunoterapii.
Warto jednak pamiętać o kilku ograniczeniach tej meta-analizy. Po pierwsze, mimo zastosowania rygorystycznych kryteriów kwalifikacji, nie można wykluczyć, że ci sami pacjenci byli uwzględnieni w różnych badaniach. Po drugie, wyniki przeżycia można było ocenić tylko w 11 badaniach ze względu na niejednolite raportowanie szacunków Kaplana-Meiera. Ograniczona dostępność dokładnych informacji na poziomie pacjenta dotyczących kluczowych czynników prognostycznych, w tym stadium BCLC, klasy Child-Pugh, etiologii przewlekłej choroby wątroby i innych czynników przedleczniczych, które mogą wpływać na wynik, powinna skłaniać do ostrożnej interpretacji porównawczej wyników skuteczności między uczestnikami badań obserwacyjnych a uczestnikami badania IMbrave150.
Ponadto, zbiorcza analiza trAEs opiera się heterogenicznie zarówno na populacjach niesparowanych, jak i sparowanych metodą propensity score, w zależności od źródła. Taka heterogeniczność, w połączeniu z ryzykiem negatywnego błędu stwierdzenia i niespójnego przypisywania niepożądanych reakcji do leczenia, powinna skłaniać do ostrożności w szczegółowej interpretacji danych trAE, które mogą być niedoraportowane, zwłaszcza w przypadku zdarzeń, które nie są objawowe, ciężkie lub rzadkie w występowaniu.
Meta-analiza uwypukla również znaczące luki w dostępności danych. Ameryka Południowa, Australia i Afryka nie mają reprezentacji w RWE, co jest istotne przy ustalaniu skuteczności i stosowania nowych standardów opieki w skali globalnej. Ponadto, stosunkowo krótki średni czas obserwacji, który jest istotnym ograniczeniem zbiorczych danych z rzeczywistej praktyki klinicznej ze względu na brak spójnego czasu obserwacji, ograniczył możliwość oceny trwałości odpowiedzi lub dokonania szacunków przeżycia poza medianą. Wreszcie, niewiele informacji jest raportowanych na temat wskaźników dekompensacji wątroby, scenariusza klinicznego związanego ze złym OS niezależnie od skuteczności leczenia.
Jakie są praktyczne implikacje dla lekarzy? Przede wszystkim, meta-analiza potwierdza, że A+B powinno być rozważane jako standard pierwszej linii leczenia u pacjentów z uHCC i zachowaną funkcją wątroby. U pacjentów z umiarkowanym upośledzeniem funkcji wątroby (Child-Pugh B) decyzja powinna być podejmowana indywidualnie, biorąc pod uwagę potencjalne korzyści i ryzyko. Jak zauważają autorzy, podczas gdy pacjenci z marskością CP-C charakteryzują się złym przeżyciem i powinni być lepiej leczeni najlepszą opieką wspomagającą, chyba że spełniają kryteria przeszczepu wątroby, klasa CP-B obejmuje wysoce heterogeniczną grupę pacjentów. Niektórzy mogą tolerować TKI i terapię ICI, potencjalnie uzyskując korzyści w porównaniu z najlepszą opieką wspomagającą. Trwają badania prospektywne oceniające bezpieczeństwo i skuteczność immunoterapii u pacjentów z chorobą CP-B.
Podsumowując, meta-analiza dostarcza przekonujących dowodów na skuteczność i bezpieczeństwo kombinacji atezolizumabu z bewacyzumabem w leczeniu nieoperacyjnego raka wątrobowokomórkowego w warunkach rzeczywistej praktyki klinicznej. Jedna trzecia pacjentów rozpoczynających leczenie A+B pozostaje przy życiu po 24 miesiącach, co wskazuje na potencjał immunoterapii do zapewnienia długoterminowych korzyści. Wyniki te wspierają A+B jako współczesny standard opieki w uHCC.
Podsumowanie
Meta-analiza obejmująca 12 badań i 2179 pacjentów potwierdziła skuteczność i bezpieczeństwo kombinacji atezolizumabu z bewacyzumabem (A+B) w leczeniu nieoperacyjnego raka wątrobowokomórkowego (uHCC) w warunkach rzeczywistej praktyki klinicznej. Wskaźnik 6-miesięcznego przeżycia całkowitego wyniósł 82%, a 12-miesięcznego 65%. Mediana przeżycia całkowitego u pacjentów z zachowaną funkcją wątroby (Child-Pugh A) wyniosła 20,9 miesiąca, co jest porównywalne z wynikami badania rejestracyjnego IMbrave150. Całkowity odsetek odpowiedzi według kryteriów RECIST v1.1 wyniósł 30%, a odsetek kontroli choroby 78%. Profil bezpieczeństwa był akceptowalny, ze zbiorczym wskaźnikiem zdarzeń niepożądanych stopnia ≥3 wynoszącym 26% i wskaźnikiem przerwania leczenia z powodu toksyczności na poziomie 12%. Szczególnie istotne jest to, że 39% pacjentów pozostaje przy życiu po 24 miesiącach leczenia, co potwierdza długoterminowe korzyści z immunoterapii w tej grupie chorych.