Birinci trimester kombine tarama, Fetal Medicine Foundation yarışan-riskler modeli ve makine öğrenmesi tabanlı yaklaşımlar: hangi modeller ne kadar öngörüyor, ASPRE ile bağlantısı nedir ve dış validasyonun gerçek sınırları nerede?
⚕️ Hedef kitle: Bu içerik sağlık profesyonellerine yöneliktir ve eğitim/güncel-bilgi amaçlıdır. Yapay zekâ araçları klinik karar desteği sunar; klinisyen sorumluluğunun ve onaylı klinik iş akışlarının yerine geçmez.
Preeklampsi, gebeliklerin yaklaşık %2-5'ini etkileyen ve maternal-perinatal mortalite ile morbiditenin önde gelen nedenlerinden biri olan multisistemik bir hipertansif bozukluktur. Klinik açıdan kritik nokta şudur: erken (özellikle preterm) preeklampsi, etkili bir farmakolojik önlemle — gebeliğin erken döneminde başlanan düşük doz aspirin — önemli ölçüde azaltılabilir. Bu durum, "öngörü"yü akademik bir egzersizden çıkarıp doğrudan bir eyleme dönüştürülebilir tarama meselesi hâline getirir: riski yüksek gebeyi birinci trimesterde belirleyebilirsek, koruyucu tedaviyi de zamanında başlatabiliriz.
İşte tam bu noktada öngörü modelleri ve giderek artan biçimde makine öğrenmesi (ML — verideki örüntüleri otomatik öğrenen istatistiksel/algoritmik yöntemler) devreye girer. Bu yazıda, klinik pratikte halihazırda kullanılan yarışan-riskler modelinden başlayarak, daha yeni ML/yapay zekâ tabanlı modellere ve bunların dürüstçe ele alınması gereken dış validasyon (modelin geliştirildiği popülasyon dışındaki gebelerde de aynı performansı koruyup korumadığının test edilmesi) sınırlarına bakacağız.
Modern preeklampsi taramasının çatısı, gebeliğin 11-13+6. haftalarında yapılan kombine taramadır. Buradaki "kombine" ifadesi, tek bir belirtece güvenmek yerine birden çok bağımsız bilgi kaynağını birleştirmeyi anlatır:
Bu yaklaşımın temel öncülü, preeklampside biyobelirteçlerin normalden sapmasının, hastalığın ne kadar erken ve ağır seyredeceğiyle orantılı olmasıdır: erken (preterm) preeklampside MAP ve UtA-PI değerleri belirgin yükselir, PlGF ve PAPP-A ise düşer. Bu nedenle taramanın performansı da en çok erken/preterm hastalıkta güçlüdür.
Bu alanın referans çerçevesi, Londra merkezli Fetal Medicine Foundation (FMF) tarafından geliştirilen yarışan-riskler modelidir (competing-risks model). Yöntem yapay zekâdan çok klasik istatistiğe dayanır: maternal faktörlerden gelen öncül risk, Bayes teoremi kullanılarak biyobelirteç değerlerinin medyanın katı (MoM) dönüşümleriyle birleştirilir ve her gebe için kişiye özgü bir preeklampsi riski hesaplanır. "Yarışan-riskler" ifadesi, doğumun her gebelik haftasında gerçekleşme olasılığını modelleyen ve hastalığı bir eşik (örn. 37 hafta) yerine sürekli bir zaman ekseni üzerinde ele alan istatistiksel kurguya işaret eder.
Modelin temel performans verileri, O'Gorman ve arkadaşlarının 35.948 tekil gebeliği kapsayan prospektif çalışmasından (Akolekar, Poon, Nicolaides ile birlikte; AJOG 2016) gelir. Maternal faktörler + MAP + UtA-PI + PlGF kombinasyonu, %10 sabit yanlış pozitiflik oranında (FPR):
Bu değerler, yalnızca maternal faktörlerle yapılan taramanın aynı koşullardaki performansından (sırasıyla %49 ve %38) belirgin biçimde üstündür. Burada önemli ve sıkça gözden kaçan bir ayrıntı vardır: bu çalışmada PAPP-A eklenmesi taramanın performansını anlamlı biçimde artırmamıştır — preterm preeklampsi için en değerli üçlü, maternal faktörlere ek olarak MAP, UtA-PI ve PlGF'dir (literatürde sık kullanılan "triple test" ifadesi bu üç biyobelirteci kasteder).
FMF modelinin güçlü yanlarından biri, çok merkezli dış validasyonlarda görece tutarlı kalmasıdır. Cuenca-Gómez ve arkadaşlarının İspanya'da 10.110 gebeyi kapsayan prospektif çalışmasında (UOG 2024) FMF modeli preterm preeklampsi için AUC 0,911 (95% GA 0,879-0,943) ile en iyi kalibrasyonu sağlamış; aynı kohortta NICE kontrol-listesi yöntemi %11 tarama-pozitiflik oranında preterm PE'nin yalnızca %46,7'sini, ACOG kontrol-listesi ise %33,8 gibi yüksek bir pozitiflik oranında %65,9'unu yakalayabilmiştir. Yani algoritmik yarışan-riskler modeli, geleneksel "risk faktörü sayma" yaklaşımlarından hem daha duyarlı hem de daha verimli (daha düşük FPR ile) çalışmaktadır.
📌 Pratik not: FMF risk hesaplayıcısı fetalmedicine.org üzerinden klinik kullanıma açıktır. Modelin geçerliliği, biyobelirteç ölçümlerinin sertifikalı/standardize cihazlarla ve doğru gebelik haftasında yapılmasına bağlıdır; yöntemsel sapma performansı doğrudan bozar.
Bir öngörü modelinin klinik değeri, ancak doğru bir müdahaleyi tetikleyebildiğinde ortaya çıkar. FMF taramasının klinik gerekçesini sağlamlaştıran kanıt, ASPRE çalışmasıdır (Rolnik ve ark., NEJM 2017). Bu çok merkezli, çift kör, plasebo kontrollü randomize çalışmada, FMF birinci trimester modeliyle yüksek riskli belirlenen 1776 tekil gebeye 11-14. haftadan 36. haftaya kadar günde 150 mg aspirin ya da plasebo verildi. Sonuç çarpıcıydı: preterm preeklampsi aspirin kolunda %1,6, plasebo kolunda %4,3 oranında görüldü (OR 0,38; 95% GA 0,20-0,74; P=0,004) — yani göreli riskte yaklaşık %62'lik bir azalma.
ASPRE'nin getirdiği paradigma şudur: algoritmik tarama → yüksek riskli grubun seçimi → erken aspirin profilaksisi zinciri, preterm preeklampsiyi anlamlı biçimde önleyebilir. Bu, herhangi bir öngörü modeli için ulaşılabilecek en güçlü gerekçedir: model yalnızca "öngörmekle" kalmaz, sonucu değiştirir.
⚠️ Doz ve zamanlama ayrımı (klinik açıdan kritik): ASPRE çalışmasında kullanılan doz günde 150 mg idi ve aspirin 16. haftadan önce başlandığında (11-14. hafta) en etkili bulundu. Buna karşılık ABD'de ACOG ve USPSTF, yüksek riskli gebelerde günde 81 mg düşük doz aspirini, 12. haftadan itibaren (ideal olarak 16. haftadan önce) başlamak üzere önermektedir. İki rakam farklı kılavuz/çalışma bağlamlarına aittir; yerel protokole göre doğru dozun seçilmesi gerekir. Aspirinin koruyucu etkisinin 16 hafta eşiğinden önce başlandığında daha belirgin olduğu konusunda ise kanıtlar birbiriyle uyumludur.
Son yıllarda, yarışan-riskler modeline alternatif ya da onu tamamlayıcı olarak, doğrudan ham veriden öğrenen makine öğrenmesi modelleri öne çıktı. Bu yaklaşımın iki ana hattı vardır.
İlk hat, FMF'in kullandığı aynı belirteçleri (MAP, UtA-PI, PlGF, PAPP-A) kullanan ama MoM dönüşümüne gerek duymadan ham veriden öğrenen yapay sinir ağı (neural network) modelleridir. Gil ve arkadaşlarının PREVAL kohortunda (İspanya, 10.110 gebe; UOG 2024) test edilen tam-bağlantılı sinir ağı, %10 tarama-pozitiflik oranında preterm preeklampsinin %77,8'ini (AUC 0,913), erken (<34 hafta) preeklampsinin ise %84,4'ünü saptadı. Bu performans, aynı kohorttaki FMF yarışan-riskler modeliyle (preterm PE için %72,7) büyük ölçüde benzerdi.
Burada dürüstçe vurgulanması gereken bulgu şudur: ML modeli, FMF modeline kıyasla çarpıcı bir üstünlük göstermedi; iki yaklaşım kabaca eşdeğerdi. Dahası, modelin farklı bir popülasyona uygulanabilmesi için PlGF'yi ölçen cihaz (analizör) farkına yönelik bir düzeltme (recalibration) yapılması zorunluydu; bu düzeltme yapılmadığında performans belirgin biçimde düştü. Bu, ML modellerinin "kutudan çıktığı gibi" her merkeze taşınamayacağının somut bir örneğidir.
İkinci hat, uterin arter Doppler'in rutin olmadığı sistemlerde (örn. ABD), elektronik sağlık kayıtlarından (EHR) ve rutin gebelik bilgilerinden öğrenen modellerdir. Kawakita ve arkadaşları, nuMoM2b kohortunda (9.467 nullipar gebe; Am J Perinatol 2025) 23. haftadan önce mevcut 131 değişkenle XGBoost (gradyan artırmalı ağaç algoritması) tabanlı bir model geliştirdi. Sekiz değişkene indirgenen son model, doğrulama setinde AUC 0,779 (95% GA 0,722-0,831) elde etti. Bu, FMF tipi biyobelirteç modellerinin AUC'sinden (≈0,91) belirgin biçimde düşüktür — ancak Doppler ve özel biyobelirteçlerin rutin olmadığı bir bağlamda, halihazırda toplanan verilerle ulaşılan makul bir performanstır. En öngörücü değişkenler arasında erken ikinci trimester uterin arter PI'si, kronik hipertansiyon ve pregestasyonel diyabetin öne çıkması, modelin klinik mantıkla uyumlu olduğunu da gösterir.
Sistematik derlemeler de genel tabloyu doğrular. Ranjbar ve arkadaşları (4 çalışma; BMC Pregnancy Childbirth 2024) ML modellerinde AUC aralığını 0,860-0,973 olarak; Malik ve arkadaşları (11 çalışma; Cureus 2024) ise 0,76-0,97 olarak bildirdi. Her iki derleme de XGBoost, rastgele orman (random forest) ve sinir ağlarını öne çıkan algoritmalar olarak işaret etti — ancak çalışmaların önemli bir bölümünün yüksek yanlılık (bias) riski taşıdığını da açıkça vurguladı.
Yüksek AUC değerleri ilk bakışta etkileyici olsa da, bu alanda performans rakamlarını dürüstçe yorumlamak zorunludur. En aydınlatıcı veri, Liu ve arkadaşlarının sistematik derleme ve meta-analizinden (26 çalışma, 31 ML modeli; J Med Internet Res 2026) gelir:
Bu bulguların ortak mesajı nettir: yüksek AUC çoğu zaman modelin geliştirildiği iç veri setindeki "performansını" yansıtır, bağımsız ve çeşitli popülasyonlardaki gerçek "etkinliğini" değil. Modelin görünür başarısı, büyük ölçüde bağlama bağımlıdır (context-dependent). Klinik karar verirken bir modelin "geliştirme kohortunda %0,97 AUC" gibi bir rakamına değil, kendi popülasyonunuzda dış validasyon yapılıp yapılmadığına bakmak gerekir.
Sınırlılıkları sistematik olarak sıralarsak:
Bugünün kanıt durumunda klinisyen için pratik çıkarımlar şunlardır:
Özetle, preeklampsi öngörüsü, obstetride yapay zekânın en olgun ve klinik etkisi en iyi gösterilmiş uygulama alanlarından biridir — ancak bu olgunluğu sağlayan şey, parlak AUC rakamları değil, FMF modeli gibi çok merkezli dış validasyondan geçmiş ve ASPRE gibi bir randomize çalışmayla sonuç-değiştirici etkisi kanıtlanmış bir zincirin varlığıdır. Yeni ML modelleri bu çıtayı korumalı: bağımsız popülasyonlarda valide edilmeli, kalibre edilmeli ve nihayetinde prospektif olarak sonucu iyileştirdikleri gösterilmelidir.
Son güncelleme: . Kaynaklar yayın tarihleri ve güncel sürümleriyle teyit edilmiştir.