Jakie wyzwania stoją przed leczeniem mUC?
Rak urotelialny (UC) stanowi szósty najczęściej występujący typ nowotworu układu moczowego, a jego częstość stale rośnie. W 2020 roku na świecie odnotowano około 500 000 nowych przypadków i 200 000 zgonów (31,7%). Około 15% pacjentów jest diagnozowanych z przerzutowym rakiem urotelialnym (mUC), który charakteryzuje się zaledwie 5% wskaźnikiem przeżycia pięcioletniego. Przez dziesięciolecia standardową terapią pierwszego rzutu dla pacjentów z mUC była chemioterapia oparta na związkach platyny. Mimo poprawy wyników klinicznych, jej toksyczność stanowi poważny problem. Ponad 60% pacjentów z mUC nie kwalifikuje się do tego leczenia ze względu na zły stan funkcjonalny oceniany według skali ECOG lub inne choroby współistniejące (np. podeszły wiek, zaburzenia czynności nerek, utrata słuchu i niewydolność serca).
Aby sprostać tej potrzebie klinicznej, immunoterapia pojawiła się jako obiecująca alternatywa dla pacjentów z mUC, u których nastąpiła progresja choroby lub którzy nie kwalifikują się do chemioterapii opartej na związkach platyny. Amerykańska Agencja ds. Żywności i Leków (FDA) zatwierdziła trzy różne kategorie inhibitorów punktów kontrolnych układu immunologicznego (ICI): inhibitory PD-1 (Niwolumab, Pembrolizumab i Cemiplimab), inhibitory PDL-1 (Atezolizumab, Durwalumab i Awelumab) oraz inhibitory CTLA-4 (Ipilimumab). Atezolizumab jest monoklonalnym przeciwciałem immunoglobulinowym G1 (IgG), które wiąże się z PD-L1 na powierzchni komórek nowotworowych i innych komórek z ekspresją PD-L1, takich jak niektóre komórki immunologiczne naciekające guz (TICs), np. komórki dendrytyczne. To wiązanie blokuje interakcję PD-L1 z receptorami PD-1, które są głównie ekspresjonowane na limfocytach T, przywracając tym samym aktywność przeciwnowotworową zależną od limfocytów T.
Chociaż atezolizumab znacznie poprawił wyniki leczenia pacjentów z różnymi typami nowotworów, w tym mUC, większość pacjentów nie odpowiada na leczenie, doświadcza toksyczności immunologicznej przy znacznych kosztach, a brakuje solidnych biomarkerów. W badaniu klinicznym II fazy IMvigor210, bezpieczeństwo i skuteczność atezolizumabu w mUC po raz pierwszy oceniono u pacjentów, u których nastąpiła progresja podczas lub po chemioterapii opartej na związkach platyny. Obiektywny wskaźnik odpowiedzi (ORR) tych pacjentów, zdefiniowany jako odsetek pacjentów, którzy osiągnęli całkowitą lub częściową odpowiedź na leczenie, wynosił zaledwie 23% (95% CI: 16-31), przy czym tylko 9% wykazywało całkowitą odpowiedź. Ponadto wystąpiły zdarzenia niepożądane związane z leczeniem, prowadzące do przerwania terapii. Dlatego istnieje pilna potrzeba znalezienia markerów predykcyjnych, które mogłyby przewidzieć, którzy pacjenci z mUC odniosą największe korzyści z terapii ICI.
- Model uczenia maszynowego oparty na ekspresji 29 genów znacznie dokładniej przewiduje odpowiedź na atezolizumab niż pojedyncze biomarkery
- Gen CXCL9 zidentyfikowano jako najważniejszy predyktor odpowiedzi na leczenie
- Model CART-OMC osiągnął najwyższą skuteczność predykcyjną poprzez nieliniowe połączenie genów
- Łączenie danych klinicznych z profilami ekspresji genów nie poprawiło znacząco skuteczności predykcji
- Zidentyfikowano 32 ścieżki biologiczne istotnie związane z odpowiedzią na immunoterapię
Czy modele ML rewolucjonizują prognozowanie odpowiedzi?
Większość badań nad odpowiedzią na ICI ograniczała się do pojedynczych markerów. Pozytywna ekspresja PD-L1, wysokie obciążenie mutacjami nowotworowymi (TMB) i wysokie obciążenie neoantygenami nowotworowymi (TNB) zostały zaproponowane jako biomarkery, które potencjalnie mogłyby przewidzieć odpowiedź na ICI w wielu typach nowotworów. Jednak punkty odcięcia dla ekspresji PD-L1 różnią się w obrębie typów nowotworów i między nimi, a brakuje standardowego testu wykrywającego PD-L1. Chociaż pomiar TMB i TNB jest trudny, kosztowny i czasochłonny, brakuje również konsensusu co do metodologii stosowanych do spójnego ilościowego określania TMB i TNB na różnych platformach sekwencjonowania i w różnych laboratoriach. Co więcej, brak solidnych punktów odcięcia do identyfikacji wysokiego obciążenia różni się w zależności od typu nowotworu. Stanowi to znaczące ograniczenie dla stosowania PD-L1, TMB i TNB jako jednowymiarowych markerów w praktyce klinicznej.
Ostatnie postępy technologiczne w sekwencjonowaniu o wysokiej przepustowości i badaniach wrażliwości na leki wygenerowały obfitość danych, które nie zostały jeszcze wykorzystane, napędzając eksplorację metod statystycznych lub uczenia maszynowego (ML) do przewidywania odpowiedzi na leki w liniach komórkowych, ksenograftach pochodzących od pacjentów (PDX), a nawet u pacjentów z nowotworami. Model oparty na ML może identyfikować predykcyjne kombinacje cech w danych o wysokim wymiarze, takich jak dane genomiczne, transkryptomiczne i obrazowe, w przeciwieństwie do tradycyjnych podejść statystycznych (np. regresji Coxa), które oceniają małą liczbę predyktorów.
Niewiele badań wykazało korzyści z wykorzystania modeli opartych na ML do przewidywania odpowiedzi ICI u pacjentów z rakiem. Nassar i wsp. opisali wielowymiarowy model regresji logistycznej, który łączył cechy kliniczne i genomiczne do przewidywania odpowiedzi na terapię anty-PD1/anty-PD-L1 wśród 62 pacjentów z mUC. Jednak wyniki wymagają dalszej walidacji ze względu na ograniczoną wielkość próby i brak niezależnej kohorty walidacyjnej. Mimo że ICI wykazują znaczącą aktywność przeciwnowotworową, odpowiedź pacjentów na ICI może być pod wpływem różnych czynników biologicznych, w tym złożonych interakcji w mikrośrodowisku guza (TME). Lapuente-Santana i wsp. opracowali EaSIeR (estimate systems immune response), podejście ML wykorzystujące wielozadaniowe ML oparte na sygnaturach mikrośrodowiska guza, do przewidywania odpowiedzi anty-PD1/anty-PD-L1. Chociaż EaSIeR jest cennym postępem, zgłosił obszar pod krzywą charakterystyki operacyjnej odbiornika (ROC-AUC) wynoszący zaledwie 0,65 podczas testowania na kohorcie mUC, co pokazuje potrzebę bardziej predykcyjnych modeli.
„Nasze badanie demonstruje, że złożone interakcje w mikrośrodowisku guza i ścieżkach odpowiedzi immunologicznej mogą być lepiej uchwycone przez modele uczenia maszynowego niż przez pojedyncze biomarkery” – piszą autorzy badania.
Wykorzystując profile ekspresji genów i dane kliniczne od 298 pacjentów z mUC leczonych atezolizumabem w zbiorze odkrywczym IMvigor210, badacze opracowali modele OMC (Optimal Model Complexity) z ośmioma algorytmami regresji do przewidywania odpowiedzi na atezolizumab. Najlepsze modele OMC zostały następnie zwalidowane na 22 pacjentach z mUC leczonych atezolizumabem z walidacyjnego zbioru danych Snydera i wsp.
Ocena metryczna na zbiorze walidacyjnym pokazała, że cztery modele wykorzystujące profile ekspresji genów (GEP) odróżniają pacjentów odpowiadających od nieodpowiadających na leczenie z medianą MCC (Matthews Correlation Coefficient) powyżej 0,2: CART-OMC (mMCC 0,328), XGB-OMC (mMCC 0,319), SVM (Linear)-OMC (mMCC 0,319) i LGBM-OMC (mMCC 0,297). CART-OMC osiągnął najwyższy mMCC przez nieliniowe połączenie 29 genów spośród 19 441 genów (0,15%) jako predykcyjnych cech do przewidywania odpowiedzi pacjentów z mUC leczonych atezolizumabem.
Badacze sprawdzili również, czy łączenie profili ekspresji genów z danymi klinicznymi poprawia przewidywanie odpowiedzi na atezolizumab u pacjentów z mUC. Cechy kliniczne obejmowały płeć, stan wydolności ECOG, status ekspresji białka PD-L1 na TICs, TMB na megabazę, TNB na megabazę, wcześniejsze otrzymanie dopęcherzowej immunoterapii BCG, status chemioterapii opartej na związkach platyny i status pobrania próbki przed podaniem platyny. Jednak predykcja oparta na połączonych profilach kliniczno-ekspresyjnych genów, GEP + TMB + TNB (LR-OMC) z mMCC 0,316, oraz tylko na podstawowych cechach klinicznych, clinical (LR-OMC) z mMCC 0,316, była gorsza niż przy użyciu tylko profili ekspresji genów, GEP(CART-OMC) z mMCC 0,328. „Dlatego nie ma korzyści z integrowania danych klinicznych pacjentów z profilami ekspresji genów w przewidywaniu odpowiedzi na atezolizumab u pacjentów z mUC” – konkludują autorzy.
Jakie są molekularne fundamenty predykcji leczenia?
Wcześniejsze badania wskazywały, że TMB i TNB są związane z przewidywaniem odpowiedzi na immunoterapię w kilku typach nowotworów, w tym mUC, przy czym wysokie TMB i częstość TMB są związane z wrażliwością na leki. Dodatkowo, białko PD-L1 ekspresjonowane na powierzchni nowotworów lub TICs jest celem atezolizumabu ze względu na mechanizm interakcji między PD1 i PD-L1 i pojawia się jako wczesny biomarker do testowania w badaniach klinicznych immunoterapii. Aby porównać wydajność predykcyjną w tym zadaniu, wytrenowano LR na znormalizowanym TMB na megabazę, TNB na megabazę i statusie ekspresji białka PD-L1 na TICs.
Wyniki pokazują, że CART-OMC, nieliniowo łączący 29 genów (najwyższy MCC 0,437), przewyższał predykcję LR wykorzystującą tylko TMB (MCC 0,000), TNB (MCC 0,316) i ekspresję białka PD-L1 na TICs (MCC 0,000). Wyniki sugerują, że predykcja oparta na 29 genach predykcyjnych przewyższa pojedynczy biomarker immunoterapii w przewidywaniu odpowiedzi na atezolizumab.
Następnie badacze zbadali znaczenie 29 genów predykcyjnych z najlepszego modelu, GEP (CART-OMC), aby oszacować wkład każdego genu w dokładność predykcyjną modelu. W przypadku CART-OMC jest to obliczane jako redukcja nieczystości Giniego każdej cechy w drzewie decyzyjnym. Wykres ważności cech ujawnił, że CXCL9 jest najważniejszym predyktorem odpowiedzi na atezolizumab, który pojawia się we wspólnych cechach między 29 genami z analiz walidacyjnych GEP a 49 genami z połączonych analiz GEP. GPR12 był drugim najważniejszym genem, wykazującym poziom ważności podobny do FOXN14, podczas gdy niektóre inne geny miały prawie zerowe znaczenie. Te geny wniosły mniejszy wkład do modelu predykcyjnego CART-OMC, ale najwyraźniej mogą nadal zawierać cenne informacje w połączeniu z innymi cechami. Na przykład IFNG indukuje produkcję CXCL9 i CXCL10.
Jednak wykres ważności cech nie wskazuje, czy gen ma pozytywny czy negatywny wpływ na predykcje. Aby zbadać to pytanie, badacze użyli wartości SHAP (Shapley additive explanations), które odnoszą poziomy ekspresji genów do ich wpływu na predykcję modelu. Geny zostały uszeregowane według średnich bezwzględnych wartości SHAP we wszystkich pacjentach, przy czym wartości dodatnie zwiększają prawdopodobieństwo braku odpowiedzi, a wartości ujemne wskazują na wyższą szansę odpowiedzi. CXCL9 pozostał najważniejszą cechą, z najwyższymi średnimi bezwzględnymi wartościami SHAP wynoszącymi 0,245, a wyższa ekspresja korelowała z przewidywanymi responderami. Większość genów wykazywała wyższą ekspresję u przewidywanych responderów, co jest zgodne ze wzorcami ekspresji różnicowej. W zbiorze odkrywczym 27 genów miało znacząco wyższą ekspresję u responderów (z wyjątkiem MMP10 i SH3TC1). Podobny trend w kierunku wysokiej ekspresji u responderów można było zaobserwować w zbiorze walidacyjnym.
Badacze przeanalizowali następnie fizyczne i funkcjonalne powiązania między 29 genami predykcyjnymi a genem CD274, który koduje PD-L1 i stąd może wpływać na odpowiedź na atezolizumab u pacjentów z mUC. Przeprowadzili analizę PPI (interakcji białko-białko) przy użyciu bazy danych STRING (Search Tool for Retrieval of Interacting Genes/Proteins) wersja 11.5. Sieć wynikowa z 30 węzłami (geny kodujące białka) i 54 krawędziami (interakcje) wykazała znaczące wzbogacenie PPI (wartość p < 0,0001). Wskazuje to, że białka w zestawie wejściowym mają więcej interakcji między sobą, niż można by oczekiwać dla losowo wybranego zestawu białek o tej samej wielkości i rozkładzie stopni z genomu. Znane i przewidywane interakcje zaobserwowano wśród 15 genów, podczas gdy pozostałe geny były odłączonymi węzłami w sieci. Co ciekawe, osiem genów (CXCL13, CXCL10, CXCL9, IFNG, NCR1, GNLY, LAG3 i ITGAE) było bezpośrednio połączonych z CD274, sugerując, że ich role w aktywacji komórek odpornościowych i migracji, prowadzące do supresji guza, są pod wpływem sygnalizacji CD274 po związaniu PD-L1 przez atezolizumab. Ponadto IFNG oddziaływał z kilkoma innymi genami, w tym CD274, wspierając dobrze ustaloną rolę IFNG jako kluczowego gracza w zapalnych odpowiedziach immunologicznych.
Analiza ścieżek przeprowadzona na 29 genach predykcyjnych ujawniła, że podzbiór był znacząco wzbogacony (FDR ≤ 0,05) w 32 ścieżkach biologicznych związanych z mechanizmami odpowiedzi na nowotwory i immunoterapię. Szczególnie trzy geny związane z mikrośrodowiskiem guza (IFNG, CXCL9 i CXCL10) były znacząco wzbogacone w ścieżce sygnalizacyjnej interferonu typu II (IFNG), która jest związana z mechanizmem działania atezolizumabu. Te geny kodują cytokinę IFNG, chemokiny CXCL9 i CXCL10 produkowane przez limfocyty T, komórki NK i makrofagi, aby przyłączać i aktywować komórki odpornościowe do eliminowania komórek nowotworowych, gdy interakcja PD1/PD-L1 jest blokowana przez atezolizumab. Dlatego zwiększona wewnątrzguzowa produkcja IFNG, CXCL9 i CXCL10 bezpośrednio hamuje proliferację komórek nowotworowych i zwiększa prezentację antygenu, prowadząc do lepszego rozpoznawania i eliminacji komórek nowotworowych.
IFNG jest uważany za kluczowy marker w przewidywaniu odpowiedzi na immunoterapię. Ayers i wsp. przeanalizowali profile ekspresji genów próbek tkanek nowotworowych i odkryli, że pacjenci z przerzutowym czerniakiem, rakiem płaskonabłonkowym głowy i szyi oraz rakiem żołądka, którzy odpowiedzieli na terapię anty-PD1, wykazywali wyższe wyniki ekspresji dla genów związanych z IFNG w porównaniu do nieodpowiadających. Autorzy zasugerowali, że zidentyfikowana sygnatura IFNG (IDO1, CXCL10, CXCL9, HLA-DRA, STAT1 i IFNG) mogłaby służyć jako marker predykcyjny odpowiedzi klinicznej na ICI.
Terminy GO (Gene Ontology), w tym ścieżki procesów biologicznych, komponentów komórkowych i funkcji molekularnych, były znacząco wzbogacone (FDR ≤ 0,05) z podzbiorem 29 genów. Wzbogacone terminy procesów biologicznych były zaangażowane w mechanizmy odpowiedzi na immunoterapię, takie jak komórkowa odpowiedź obronna, odporność zależna od komórek immunologicznych i cytotoksyczność, zabijanie komórek oraz regulacja procesu układu odpornościowego i odpowiedzi immunologicznej. Te ścieżki odgrywają kluczową rolę w odpowiedzi układu odpornościowego na raka, obejmując produkcję cytokin, zapalenie i rekrutację limfocytów T i innych komórek odpornościowych do TME. Podobnie do wzbogaconych ścieżek w terminach funkcji molekularnych, ścieżki wiązania chemokin i receptorów cytokin leżą w ich zdolności do rekrutacji i aktywacji komórek odpornościowych do atakowania komórek nowotworowych, promowania produkcji cytokin zapalnych i indukcji przeciwnowotworowej odpowiedzi immunologicznej. Wiązanie CXCL9, CXCL10 i CXCL11 do CXCR3 indukuje migrację limfocytów T i komórek NK do TME, gdzie mogą rozpoznawać i eliminować komórki nowotworowe. Ponadto termin komponentu komórkowego pokazał, że zewnętrzna strona błony plazmatycznej była wzbogacona pięcioma genami (CXCL10, CXCL9, ITGAE, LAG3 i RTBDN), wskazując na miejsce interakcji między PD-L1 ekspresjonowanym na powierzchni guza lub TICs a atezolizumabem.
- Analiza oparta wyłącznie na danych retrospektywnych z ograniczoną liczbą pacjentów
- Brak kluczowych zmiennych klinicznych (np. stadium nowotworu, miejsca przerzutów)
- Potrzeba walidacji na większych, wielokohortowych zbiorach danych
- Konieczność uwzględnienia innych modalności (np. obrazowanie, profilowanie pojedynczych komórek)
- Potrzeba dostosowania modelu do różnych stadiów choroby i populacji pacjentów
Czy zintegrowane dane poprawiają trafność predykcji?
Aby uzyskać bardziej wymagający zestaw testowy, badacze połączyli zbiory odkrywcze i walidacyjne. Z łączną liczbą 320 pacjentów z mUC, byli w stanie wygenerować predykcje dla tych pacjentów i porównać wydajność swojego modelu z najnowocześniejszymi modelami predykcji odpowiedzi na leki opartymi na ML (np. EaSIeR i JADBio). Przy użyciu profili ekspresji genów, model LGBM-OMC, określany jako GEP (LGBM-OMC), osiągnął najwyższy MCC 0,252, który nieliniowo łączył 49 genów. Dziewiętnaście z tych genów nakładało się z 29 genami z najlepszego modelu CART-OMC w analizach walidacyjnych. CART-OMC również znalazł się wśród najlepszych modeli w połączonych zbiorach danych. CART-OMC na zintegrowanych ekspresjach 63 genów, cechach TMB i TNB, zwany GEP + TMB + TNB (CART-OMC), działał nieco lepiej niż te wykorzystujące same profile ekspresji genów, z najwyższym MCC 0,253.
Aby przewidzieć odpowiedź na atezolizumab w tym samym zestawie 320 pacjentów z mUC przy użyciu EaSIeR, dane z sekwencjonowania RNA zostały wprowadzone do ilościowego określenia specyficznych dla pacjenta, pięciu rzeczywistych sygnatur TME opartych na systemie, w tym 11 typów komórek odpornościowych, 14 aktywności ścieżek, 118 aktywności czynników transkrypcyjnych, 812 par ligand-receptor i 169 par komórka-komórka. Te sygnatury pozwalają na kompleksową charakterystykę guzów, podkreślając, jak złożony skład komórkowy TME, mechanizmy między- i wewnątrzkomórkowe są zaangażowane w pośredniczenie w odpowiedzi immunologicznej i wpływają na skuteczność immunoterapii.
Po zidentyfikowaniu LGBM-OMC łączącego 49 genów (GEP (LGBM-OMC)) i CART-OMC łączącego 63 geny z TMB i TNB (GEP + TMB + TNB (CART-OMC)) jako najlepszych modeli, badacze sprawdzili, czy dodanie 1134 cech obliczonych dla każdego pacjenta przy użyciu EaSIeR, w tym pięciu sygnatur TME opartych na systemie, określanych jako deskryptory TME (1124 cechy), 9 opublikowanych wyników odpowiedzi immunologicznej i wynik EaSIeR, mogłoby poprawić dokładność predykcji. Wynik EaSIeR jest średnią z 10 predykcji odpowiedzi immunologicznej opartych na deskryptorach TME ensemble.
Dodanie indywidualnych zestawów cech (deskryptory TME, wyniki odpowiedzi immunologicznej i wynik EaSIeR) lub ich kombinacji do modelu LGBM z 49 genami poprawiło wydajność predykcyjną w porównaniu do tych zbudowanych wyłącznie na 49 genach (mMCC 0,218). Najlepsza wydajność pochodziła z połączenia 49 genów z 9 wynikami odpowiedzi immunologicznej (mMCC 0,358), podczas gdy użycie tylko kombinacji pięciu deskryptorów TME, 9 wyników odpowiedzi immunologicznej i wyniku EaSIeR skutkowało najniższą wydajnością (mMCC 0,136).
Podobnie, CART z 63 genami, TMB i TNB, w połączeniu z wynikiem EaSIeR (mMCC 0,342) lub 9 wynikami odpowiedzi immunologicznej (mMCC 0,394), poprawił wydajność predykcyjną w porównaniu do tych zbudowanych wyłącznie na 63 genach, TMB i TNB (mMCC 0,236). CART nie był w stanie poradzić sobie z większą liczbą zaangażowanych cech, a wydajność spadła wraz z dodaniem pięciu deskryptorów TME (mMCC 0,145) lub kombinacji pięciu deskryptorów TME, 9 wyników odpowiedzi immunologicznej i wyniku EaSIeR (mMCC 0,105). Najniższa wydajność (mMCC 0,097) została zaobserwowana, gdy CART był oparty wyłącznie na kombinacji pięciu deskryptorów TME, dziewięciu wyników odpowiedzi immunologicznej i wyniku EaSIeR.
Ogólnie, integracja pięciu deskryptorów TME, dziewięciu wyników odpowiedzi immunologicznej i wyniku EaSIeR, obliczonych przy użyciu oprogramowania EaSIeR, i użycie tych cech w treningu modelu dostarcza cennych informacji, które mogą poprawić wydajność predykcyjną. Szczególnie dziewięć wyników odpowiedzi immunologicznej znacząco przyczyniło się do poprawy dokładności zarówno modeli LGBM, jak i CART. Jednak włączenie pięciu deskryptorów TME, samych lub w kombinacji z innymi cechami, nie prowadziło konsekwentnie do zysków wydajnościowych, a w niektórych przypadkach wprowadzało dodatkową złożoność, która zmniejszała efektywność modelu.
Jakie są perspektywy kliniczne i wyzwania wdrożeniowe?
Badacze porównali również swoje wyniki z automatycznym uczeniem maszynowym (AutoML). JADBio to potężne narzędzie AutoML dostosowane do zbiorów danych o niskiej próbce i wysokim wymiarze, takich jak te powstające w problemach biomedycznych lub biologicznych. JADBio generuje optymalne modele predykcyjne poprzez automatyczne trenowanie i ocenianie licznych potoków ML, optymalizując przetwarzanie wstępne danych, selekcję cech, algorytmy ML i ich hiperparametry. Badacze zastosowali JADBio na dwóch zestawach cech: profilach ekspresji genów (GEP) i zintegrowanych profilach ekspresji genów i danych klinicznych (GEP + clinical) do przewidywania odpowiedzi na atezolizumab u 320 pacjentów z mUC z połączonych zbiorów odkrywczego i walidacyjnego przy użyciu modeli regresji i porównali je do swoich najlepszych modeli zbudowanych w tym badaniu na tym samym zestawie pacjentów.
Przy użyciu profili ekspresji genów jako wejścia, JADBio wykonał powtarzaną 10-krotną CV (maks. powtórzeń = 20) z 4276 wypróbowanymi konfiguracjami. Najlepszym modelem jest RF (z następującymi hiperparametrami: trenowanie 100 drzew z kryterium podziału średniego błędu kwadratowego (MSE), minimalny rozmiar liścia = 9, podziały = 1, alfa = 1 i zmienne do podziału = liczba zmiennych podzielona przez 9,0), wraz z selekcją cech SES (z maxK = 2, alfa = 0,1 i budżet = 3 * liczba zmiennych) z MCC 0,179, produkując 6 równoważnych sygnatur 25 z 19 440 genów.
Połączenie profili ekspresji genów i danych klinicznych nieznacznie poprawiło wydajność modelu w przewidywaniu odpowiedzi na atezolizumab przy użyciu JADBio. Najlepszym modelem jest RF (z trenowaniem 100 drzew z kryterium podziału MSE, minimalny rozmiar liścia = 7, podziały = 1, alfa = 1 i zmienne do podziału = liczba zmiennych podzielona przez 9,0), wraz z selekcją cech SES (z maxK = 2, alfa = 0,1 i budżet = 3 * liczba zmiennych) z MCC 0,198, produkując 56 równoważnych sygnatur 19 (15 genów, TMB na megabazę i TNB na megabazę) z 19 448 cech.
Najlepsze modele na połączonym zbiorze danych, z MCC 0,252 dla GEP (LGBM-OMC) i MCC 0,253 dla GEP + clinical (CART-OMC), przewyższały najlepsze modele JADBio z MCC 0,179 dla GEP i MCC 0,198 dla GEP + clinical.
„Nasze wyniki pokazują, że model uczenia maszynowego oparty na ekspresji 29 kluczowych genów może znacznie dokładniej przewidywać odpowiedź na atezolizumab niż pojedyncze biomarkery, co może prowadzić do bardziej spersonalizowanego podejścia do leczenia” – podkreślają autorzy badania.
Opracowanie modelu predykcyjnego dla precyzyjnej onkologii jest trudnym zadaniem, które wymaga zbierania i analizowania znacznej ilości danych. Chociaż najlepsze modele wykazały obiecujące wyniki, istnieją pewne ograniczenia, które należy wziąć pod uwagę w tym badaniu. Po pierwsze, była to tylko analiza in silico i retrospektywna publicznie dostępnych danych z badania klinicznego IMvigor210 i badań Snydera i wsp., z ograniczoną liczbą pacjentów z mUC leczonych atezolizumabem i brakiem istotnych zmiennych klinicznych, takich jak stadium nowotworu w momencie diagnozy i miejsca przerzutów, co utrudnia zastosowanie modelu w kontekście innym niż przerzutowy. Starannie przygotowany większy wielokohortowy zbiór danych poza tymi źródłami powinien być dalej używany do budowania modelu o zwiększonej dokładności predykcyjnej i niezawodności w różnych stadiach choroby i populacjach pacjentów, czyniąc go bardziej użytecznym do kierowania decyzjami leczniczymi. Ponadto można rozważyć zewnętrzną walidację na publicznie dostępnych zbiorach danych lub prospektywną walidację w badaniach klinicznych, aby dalej ustalić jego solidność i możliwość uogólnienia.
Co godne uwagi, wcześniejsze prace badaczy również wykazały możliwość zastosowania modeli ML do przewidywania odpowiedzi na leki zarówno u pacjentów z rakiem we wczesnym stadium, jak i z przerzutami leczonych w warunkach adjuwantowych po operacji, na przykład doksorubicyna u pacjentów z rakiem piersi, gemcytabina u pacjentów z rakiem trzustki, a także cetuksymab w CRC PDXs. Te badania pokazują, że modele ML mogą być dostosowane do takich scenariuszy, dostarczając modele uczenia maszynowego zdolne do rozróżniania między przypadkami wrażliwymi i opornymi, zapewniając tym samym podstawę do przyszłej pracy badającej ten potencjał. Po drugie, efekt kombinacji leków mógłby być dalej oceniany wraz z ich indywidualnymi efektami. Innym ograniczeniem jest to, że włączenie innych modalności, takich jak obrazowanie lub profilowanie pojedynczych komórek, mogłoby pomóc w opracowaniu modelu predykcyjnego. Może to zapewnić wgląd w heterogeniczność guza, prowadząc do bardziej kompleksowego zrozumienia choroby i potencjalnie poprawić decyzje lecznicze.
Pomimo zmieniającego się krajobrazu leczenia przerzutowego raka urotelialnego (mUC), atezolizumab pozostaje klinicznie istotną opcją, szczególnie dla pacjentów niekwalifikujących się do chemioterapii opartej na związkach platyny. Jest również stosowany u pacjentów kwalifikujących się do cisplatyny z guzami PD-L1+ (≥5% ekspresji na komórkach immunologicznych) i w bardziej zaawansowanych ustawieniach leczenia. Przyszłe prace mogłyby również dostosować metodologię badaczy do opracowania i oceny potoku ML do przewidywania odpowiedzi pacjentów na inne ICI, takie jak pembrolizumab, tym samym poszerzając zakres predykcyjny modelu poza leczenia oparte na atezolizumabie. Włączenie danych z wielu ICI i badanie sygnatur molekularnych odpowiedzi mogłoby prowadzić do bardziej uogólnionego modelu predykcyjnego, mającego zastosowanie w szerszym zakresie immunoterapii, w tym w powstających schematach kombinacyjnych, takich jak enfortumab vedotin (EV) plus pembrolizumab.
„Czy wyniki tego badania mogą zmienić podejście do przewidywania odpowiedzi na immunoterapię? Jakie wyzwania mogą pojawić się przy wdrażaniu tej metody w praktyce klinicznej?” – zastanawiają się autorzy.
Podsumowując, ta analiza ML doprowadziła do odkrycia wysoce predykcyjnych i solidnych predyktorów odpowiedzi pacjentów z mUC na atezolizumab w oparciu o profile ekspresji genów, które osiągnęły wartości MCC wyższe niż te oparte na pojedynczym biomarkerze (np. samym TMB, TNB i ekspresji białka PD-L1) oraz inne modele predykcyjne oparte na ML z EaSIeR i JADBio. Cechy predykcyjne zidentyfikowane w tym badaniu mogą służyć jako sygnatury odpowiedzi na atezolizumab. Umożliwia to klinicystom stratyfikację pacjentów z mUC, którzy prawdopodobnie odpowiedzą na atezolizumab, i zapewnienie alternatywnych leków bez opóźnienia dla tych, którzy prawdopodobnie nie odpowiedzą, minimalizując tym samym występowanie działań niepożądanych. Ponadto te odkrycia stanowią punkt wyjścia do badania mechanizmu oporności na atezolizumab u pacjentów z mUC.
Podsumowanie
Badanie koncentruje się na wykorzystaniu uczenia maszynowego (ML) w przewidywaniu odpowiedzi na immunoterapię atezolizumabem u pacjentów z przerzutowym rakiem urotelialnym (mUC). Naukowcy opracowali model oparty na ekspresji 29 kluczowych genów, który znacząco przewyższa skuteczność pojedynczych biomarkerów w prognozowaniu odpowiedzi na leczenie. Model CART-OMC osiągnął najwyższy współczynnik korelacji Matthewsa (MCC) poprzez nieliniowe połączenie genów predykcyjnych. Badanie wykazało, że gen CXCL9 jest najważniejszym predyktorem odpowiedzi na atezolizumab. Integracja danych klinicznych z profilami ekspresji genów nie poprawiła znacząco skuteczności predykcji. Analiza ścieżek biologicznych ujawniła znaczące wzbogacenie w 32 ścieżkach związanych z odpowiedzią na nowotwory i immunoterapię. Model może pomóc w stratyfikacji pacjentów pod kątem prawdopodobnej odpowiedzi na leczenie, minimalizując ryzyko wystąpienia działań niepożądanych u osób, które prawdopodobnie nie odpowiedzą na terapię.