
De strijd tegen longkanker krijgt een krachtige nieuwe bondgenoot in de vorm van geavanceerde algoritmes die patiëntendossiers analyseren. Onderzoekers verbonden aan Amsterdam UMC hebben een methode ontwikkeld die het mogelijk maakt om longkanker tot vier maanden eerder te detecteren dan met de huidige diagnostische processen mogelijk is. Een onderzoeksteam onder leiding van prof. dr. Martijn Schut en prof. dr. Ameen Abu Hanna publiceerde deze bevindingen onlangs in het British Journal of General Practice. Hun innovatieve aanpak combineert natuurlijke taalverwerking met machine learning om bestaande medische dossiers te doorzoeken op subtiele aanwijzingen die aan traditionele detectiemethoden ontsnappen.
Het innovatieve aspect van dit onderzoek ligt in de analyse van ongestructureerde vrije tekst die huisartsen in elektronische patiëntendossiers noteren. Waar eerdere predictiemodellen vooral vertrouwden op vooraf gedefinieerde variabelen zoals rookgedrag of specifieke symptomen, graaft dit algoritme dieper in de volledige medische geschiedenis van patiënten. Klinische notities van huisartsen blijken waardevolle voorspellende patronen te bevatten die met conventionele methoden niet worden opgemerkt. Het algoritme identificeert deze patronen maanden voordat een klinische diagnose wordt gesteld of een verwijzing plaatsvindt.
Voor het onderzoek analyseerde het team de medische gegevens van 525.526 patiënten uit verschillende Nederlandse huisartsnetwerken. Van deze groep ontwikkelden 2.386 personen longkanker, wat een representatieve dataset opleverde voor het trainen en valideren van het predictiemodel.
Het algoritme presteerde indrukwekkend met een AUC-waarde (area under the curve) van 0,88 (95% BI = 0,86-0,89) bij interne validatie. Bij externe validatie daalde deze waarde naar 0,79 (95% BI = 0,78-0,80), wat nog steeds duidt op robuuste voorspellende capaciteit. Met de gekozen afkapwaarde zou ongeveer 62% van de longkankerpatiënten vier maanden eerder kunnen worden geïdentificeerd.
De precisie van het model betekent dat voor elke 34 patiënten die door het algoritme worden gemarkeerd, er gemiddeld één daadwerkelijk longkanker heeft. Dit verhoudingsgetal is aanzienlijk gunstiger dan bij veel bestaande screeningsprogramma’s.
De klinische relevantie van deze tijdwinst kan nauwelijks worden overschat. Longkanker wordt momenteel bij driekwart van de patiënten pas in stadium 3 of 4 ontdekt, wat resulteert in een slechte prognose: meer dan 80% overlijdt binnen een jaar na diagnose. Hoe eerder de ziekte wordt ontdekt, des te eerder kan de behandeling starten. Onderzoek heeft aangetoond dat zelfs vier weken eerdere behandeling al substantiële voordelen biedt voor de prognose. Een tijdwinst van vier maanden, zoals uit de Amsterdamse studie blijkt, kan grote impact hebben.
In Nederland vormt de huisarts voor ruim 80% van de longkankerpatiënten het eerste contactpunt in hun diagnostisch traject. Dit maakt huisartsenpraktijken de ideale omgeving voor vroege interventie. Met ongeveer 14.000 nieuwe longkankerdiagnoses per jaar in Nederland en een vijfjaarsoverleving van slechts 20%, kan deze methodologie een belangrijke bijdrage leveren aan het verbeteren van deze ongunstige statistieken. Een belangrijk praktisch voordeel van dit systeem is dat het geïntegreerd kan worden in bestaande huisartsensoftware, zonder dat er aanvullende tests of consulten nodig zijn. Het algoritme werkt op de achtergrond en kan tijdens reguliere consulten risicobeoordelingen genereren.
Hoewel het onderzoek zich richtte op longkanker, suggereren de onderzoekers dat vergelijkbare technieken mogelijk toepasbaar zijn bij andere moeilijk vroegtijdig te diagnosticeren maligniteiten, zoals alvleesklier-, maag- en eierstokkanker. Deze kankersoorten delen met longkanker de problematiek van late detectie en bijbehorende slechte prognose. Eer het zover is dat het algoritme zijn intrede doet in de spreekkamer van de huisarts zijn er nog wel enkele stappen te nemen. Daarbij behoren prospectieve validatiestudies in verschillende zorgsettings. Ook moet worden onderzocht welke specifieke tekstuele elementen het algoritme gebruikt voor zijn voorspellingen, om de transparantie en verklaarbaarheid te waarborgen die essentieel zijn voor acceptatie in de klinische praktijk.
Referentie
Schut MC, Luik TT, Vagliano I, Rios M, Helsper CW, van Asselt KM, et al. Artificial intelligence for early detection of lung cancer in GPs’ clinical notes: a retrospective observational cohort study. Br J Gen Pract. 2025 Apr 22;BJGP.2023.0489. https://doi.org/10.3399/BJGP.2023.0489