Preeklampsi Öngörüsünde Yapay Zeka ve Risk Modelleri

⚕️ Hedef kitle: Bu içerik sağlık profesyonellerine yöneliktir ve eğitim/güncel-bilgi amaçlıdır. Yapay zekâ araçları klinik karar desteği sunar; klinisyen sorumluluğunun ve onaylı klinik iş akışlarının yerine geçmez.

Preeklampsi, gebeliklerin yaklaşık %2-5'ini etkileyen ve maternal-perinatal mortalite ile morbiditenin önde gelen nedenlerinden biri olan multisistemik bir hipertansif bozukluktur. Klinik açıdan kritik nokta şudur: erken (özellikle preterm) preeklampsi, etkili bir farmakolojik önlemle — gebeliğin erken döneminde başlanan düşük doz aspirin — önemli ölçüde azaltılabilir. Bu durum, "öngörü"yü akademik bir egzersizden çıkarıp doğrudan bir eyleme dönüştürülebilir tarama meselesi hâline getirir: riski yüksek gebeyi birinci trimesterde belirleyebilirsek, koruyucu tedaviyi de zamanında başlatabiliriz.

İşte tam bu noktada öngörü modelleri ve giderek artan biçimde makine öğrenmesi (ML — verideki örüntüleri otomatik öğrenen istatistiksel/algoritmik yöntemler) devreye girer. Bu yazıda, klinik pratikte halihazırda kullanılan yarışan-riskler modelinden başlayarak, daha yeni ML/yapay zekâ tabanlı modellere ve bunların dürüstçe ele alınması gereken dış validasyon (modelin geliştirildiği popülasyon dışındaki gebelerde de aynı performansı koruyup korumadığının test edilmesi) sınırlarına bakacağız.

Birinci trimester kombine tarama: temel mantık

Modern preeklampsi taramasının çatısı, gebeliğin 11-13⁺⁶. haftalarında yapılan kombine taramadır. Buradaki "kombine" ifadesi, tek bir belirtece güvenmek yerine birden çok bağımsız bilgi kaynağını birleştirmeyi anlatır:

Maternal faktörler: yaş, vücut kitle indeksi, etnik köken, kronik hipertansiyon/diyabet, önceki gebelikte preeklampsi öyküsü, gebeliğe ulaşma yöntemi gibi öncül (a priori) risk belirleyicileri.
MAP (ortalama arter basıncı — standardize ölçülen kan basıncı değeri).
UtA-PI (uterin arter pulsatilite indeksi — Doppler ultrasonografi ile ölçülen, plasental kanlanma direncini yansıtan parametre).
Biyobelirteçler: serum PlGF (plasental büyüme faktörü — preeklampside düşen anjiyojenik bir protein) ve/veya PAPP-A (gebelikle ilişkili plazma proteini-A).

Bu yaklaşımın temel öncülü, preeklampside biyobelirteçlerin normalden sapmasının, hastalığın ne kadar erken ve ağır seyredeceğiyle orantılı olmasıdır: erken (preterm) preeklampside MAP ve UtA-PI değerleri belirgin yükselir, PlGF ve PAPP-A ise düşer. Bu nedenle taramanın performansı da en çok erken/preterm hastalıkta güçlüdür.

Fetal Medicine Foundation (FMF) yarışan-riskler modeli

Bu alanın referans çerçevesi, Londra merkezli Fetal Medicine Foundation (FMF) tarafından geliştirilen yarışan-riskler modelidir (competing-risks model). Yöntem yapay zekâdan çok klasik istatistiğe dayanır: maternal faktörlerden gelen öncül risk, Bayes teoremi kullanılarak biyobelirteç değerlerinin medyanın katı (MoM) dönüşümleriyle birleştirilir ve her gebe için kişiye özgü bir preeklampsi riski hesaplanır. "Yarışan-riskler" ifadesi, doğumun her gebelik haftasında gerçekleşme olasılığını modelleyen ve hastalığı bir eşik (örn. 37 hafta) yerine sürekli bir zaman ekseni üzerinde ele alan istatistiksel kurguya işaret eder.

Modelin temel performans verileri, O'Gorman ve arkadaşlarının 35.948 tekil gebeliği kapsayan prospektif çalışmasından (Akolekar, Poon, Nicolaides ile birlikte; AJOG 2016) gelir. Maternal faktörler + MAP + UtA-PI + PlGF kombinasyonu, %10 sabit yanlış pozitiflik oranında (FPR):

Preterm preeklampsinin (<37 hafta) %75'ini (95% GA 70-80),
Term preeklampsinin (≥37 hafta) %47'sini (95% GA 44-51) saptamıştır.

Bu değerler, yalnızca maternal faktörlerle yapılan taramanın aynı koşullardaki performansından (sırasıyla %49 ve %38) belirgin biçimde üstündür. Burada önemli ve sıkça gözden kaçan bir ayrıntı vardır: bu çalışmada PAPP-A eklenmesi taramanın performansını anlamlı biçimde artırmamıştır — preterm preeklampsi için en değerli üçlü, maternal faktörlere ek olarak MAP, UtA-PI ve PlGF'dir (literatürde sık kullanılan "triple test" ifadesi bu üç biyobelirteci kasteder).

FMF modelinin güçlü yanlarından biri, çok merkezli dış validasyonlarda görece tutarlı kalmasıdır. Cuenca-Gómez ve arkadaşlarının İspanya'da 10.110 gebeyi kapsayan prospektif çalışmasında (UOG 2024) FMF modeli preterm preeklampsi için AUC 0,911 (95% GA 0,879-0,943) ile en iyi kalibrasyonu sağlamış; aynı kohortta NICE kontrol-listesi yöntemi %11 tarama-pozitiflik oranında preterm PE'nin yalnızca %46,7'sini, ACOG kontrol-listesi ise %33,8 gibi yüksek bir pozitiflik oranında %65,9'unu yakalayabilmiştir. Yani algoritmik yarışan-riskler modeli, geleneksel "risk faktörü sayma" yaklaşımlarından hem daha duyarlı hem de daha verimli (daha düşük FPR ile) çalışmaktadır.

📌 Pratik not: FMF risk hesaplayıcısı fetalmedicine.org üzerinden klinik kullanıma açıktır. Modelin geçerliliği, biyobelirteç ölçümlerinin sertifikalı/standardize cihazlarla ve doğru gebelik haftasında yapılmasına bağlıdır; yöntemsel sapma performansı doğrudan bozar.

ASPRE bağlantısı: öngörünün önleme ile buluşması

Bir öngörü modelinin klinik değeri, ancak doğru bir müdahaleyi tetikleyebildiğinde ortaya çıkar. FMF taramasının klinik gerekçesini sağlamlaştıran kanıt, ASPRE çalışmasıdır (Rolnik ve ark., NEJM 2017). Bu çok merkezli, çift kör, plasebo kontrollü randomize çalışmada, FMF birinci trimester modeliyle yüksek riskli belirlenen 1776 tekil gebeye 11-14. haftadan 36. haftaya kadar günde 150 mg aspirin ya da plasebo verildi. Sonuç çarpıcıydı: preterm preeklampsi aspirin kolunda %1,6, plasebo kolunda %4,3 oranında görüldü (OR 0,38; 95% GA 0,20-0,74; P=0,004) — yani göreli riskte yaklaşık %62'lik bir azalma.

ASPRE'nin getirdiği paradigma şudur: algoritmik tarama → yüksek riskli grubun seçimi → erken aspirin profilaksisi zinciri, preterm preeklampsiyi anlamlı biçimde önleyebilir. Bu, herhangi bir öngörü modeli için ulaşılabilecek en güçlü gerekçedir: model yalnızca "öngörmekle" kalmaz, sonucu değiştirir.

⚠️ Doz ve zamanlama ayrımı (klinik açıdan kritik): ASPRE çalışmasında kullanılan doz günde 150 mg idi ve aspirin 16. haftadan önce başlandığında (11-14. hafta) en etkili bulundu. Buna karşılık ABD'de ACOG ve USPSTF, yüksek riskli gebelerde günde 81 mg düşük doz aspirini, 12. haftadan itibaren (ideal olarak 16. haftadan önce) başlamak üzere önermektedir. İki rakam farklı kılavuz/çalışma bağlamlarına aittir; yerel protokole göre doğru dozun seçilmesi gerekir. Aspirinin koruyucu etkisinin 16 hafta eşiğinden önce başlandığında daha belirgin olduğu konusunda ise kanıtlar birbiriyle uyumludur.

Makine öğrenmesi tabanlı modeller (2023-2026)

Son yıllarda, yarışan-riskler modeline alternatif ya da onu tamamlayıcı olarak, doğrudan ham veriden öğrenen makine öğrenmesi modelleri öne çıktı. Bu yaklaşımın iki ana hattı vardır.

1. Biyobelirteç temelli sinir ağı modelleri

İlk hat, FMF'in kullandığı aynı belirteçleri (MAP, UtA-PI, PlGF, PAPP-A) kullanan ama MoM dönüşümüne gerek duymadan ham veriden öğrenen yapay sinir ağı (neural network) modelleridir. Gil ve arkadaşlarının PREVAL kohortunda (İspanya, 10.110 gebe; UOG 2024) test edilen tam-bağlantılı sinir ağı, %10 tarama-pozitiflik oranında preterm preeklampsinin %77,8'ini (AUC 0,913), erken (<34 hafta) preeklampsinin ise %84,4'ünü saptadı. Bu performans, aynı kohorttaki FMF yarışan-riskler modeliyle (preterm PE için %72,7) büyük ölçüde benzerdi.

Burada dürüstçe vurgulanması gereken bulgu şudur: ML modeli, FMF modeline kıyasla çarpıcı bir üstünlük göstermedi; iki yaklaşım kabaca eşdeğerdi. Dahası, modelin farklı bir popülasyona uygulanabilmesi için PlGF'yi ölçen cihaz (analizör) farkına yönelik bir düzeltme (recalibration) yapılması zorunluydu; bu düzeltme yapılmadığında performans belirgin biçimde düştü. Bu, ML modellerinin "kutudan çıktığı gibi" her merkeze taşınamayacağının somut bir örneğidir.

2. EHR/rutin-veri temelli modeller

İkinci hat, uterin arter Doppler'in rutin olmadığı sistemlerde (örn. ABD), elektronik sağlık kayıtlarından (EHR) ve rutin gebelik bilgilerinden öğrenen modellerdir. Kawakita ve arkadaşları, nuMoM2b kohortunda (9.467 nullipar gebe; Am J Perinatol 2025) 23. haftadan önce mevcut 131 değişkenle XGBoost (gradyan artırmalı ağaç algoritması) tabanlı bir model geliştirdi. Sekiz değişkene indirgenen son model, doğrulama setinde AUC 0,779 (95% GA 0,722-0,831) elde etti. Bu, FMF tipi biyobelirteç modellerinin AUC'sinden (≈0,91) belirgin biçimde düşüktür — ancak Doppler ve özel biyobelirteçlerin rutin olmadığı bir bağlamda, halihazırda toplanan verilerle ulaşılan makul bir performanstır. En öngörücü değişkenler arasında erken ikinci trimester uterin arter PI'si, kronik hipertansiyon ve pregestasyonel diyabetin öne çıkması, modelin klinik mantıkla uyumlu olduğunu da gösterir.

Sistematik derlemeler de genel tabloyu doğrular. Ranjbar ve arkadaşları (4 çalışma; BMC Pregnancy Childbirth 2024) ML modellerinde AUC aralığını 0,860-0,973 olarak; Malik ve arkadaşları (11 çalışma; Cureus 2024) ise 0,76-0,97 olarak bildirdi. Her iki derleme de XGBoost, rastgele orman (random forest) ve sinir ağlarını öne çıkan algoritmalar olarak işaret etti — ancak çalışmaların önemli bir bölümünün yüksek yanlılık (bias) riski taşıdığını da açıkça vurguladı.

Kanıt düzeyi ve sınırlılıklar

Yüksek AUC değerleri ilk bakışta etkileyici olsa da, bu alanda performans rakamlarını dürüstçe yorumlamak zorunludur. En aydınlatıcı veri, Liu ve arkadaşlarının sistematik derleme ve meta-analizinden (26 çalışma, 31 ML modeli; J Med Internet Res 2026) gelir:

Havuzlanmış AUC 0,91 (95% GA 0,87-0,92) gibi yüksek bir değer olsa da, çalışmalar arası heterojenlik aşırıydı (I²>%99) — yani modeller birbirinden çok farklı koşullarda, çok farklı performanslar sergiliyordu.
Yalnızca 6 çalışma dış validasyon yapmıştı; bu çalışmalarda havuzlanmış duyarlılık 0,68'e düştü.
Duyarlılık için %95 öngörü aralığı (prediction interval) 0,32-0,96 gibi çok genişti — yani bazı dış ortamlarda modelin duyarlılığı %32'ye kadar inebilir.

Bu bulguların ortak mesajı nettir: yüksek AUC çoğu zaman modelin geliştirildiği iç veri setindeki "performansını" yansıtır, bağımsız ve çeşitli popülasyonlardaki gerçek "etkinliğini" değil. Modelin görünür başarısı, büyük ölçüde bağlama bağımlıdır (context-dependent). Klinik karar verirken bir modelin "geliştirme kohortunda %0,97 AUC" gibi bir rakamına değil, kendi popülasyonunuzda dış validasyon yapılıp yapılmadığına bakmak gerekir.

Sınırlılıkları sistematik olarak sıralarsak:

Transfer-edilebilirlik (transportability): Bir popülasyonda eğitilen model, etnik dağılım, biyobelirteç ölçüm cihazı, preeklampsi tanı kriterleri ve klinik iş akışı farklı olan başka bir popülasyonda performans kaybeder. Yeniden kalibrasyon (recalibration) çoğu zaman zorunludur.
Veri seti dengesizliği: Preterm preeklampsi nadir bir sonuçtur (kohortlarda sıklıkla %0,3-0,5); bu dengesizlik, sınıflandırıcı eğitimini ve gerçek dünya pozitif öngörü değerini zorlaştırır.
Yanlılık ve eşitsizlik: Eğitim verisinde yetersiz temsil edilen gruplar (etnik azınlıklar, düşük-kaynak ortamlar) için modeller daha zayıf çalışabilir — bu da maternal sağlıkta var olan eşitsizlikleri pekiştirme riski taşır.
Açıklanabilirlik (explainability): "Kara kutu" niteliğindeki bazı ML modelleri, klinik gerekçelendirme ve etik onay açısından sorun yaratır; bu nedenle SHAP gibi yorumlanabilirlik yöntemleri giderek daha çok talep edilmektedir.
Prospektif kanıt eksikliği: Mevcut ML çalışmalarının büyük çoğunluğu retrospektiftir; ASPRE benzeri, sonucu (canlı doğum, maternal morbidite) doğrudan iyileştirdiğini gösteren prospektif klinik etki çalışmaları henüz çok sınırlıdır.

Klinik pratiğe yansıması

Bugünün kanıt durumunda klinisyen için pratik çıkarımlar şunlardır:

Birinci trimester kombine tarama klinik bir gerçekliktir, yenilik değil. FMF yarışan-riskler modeli, geleneksel risk-faktörü kontrol listelerinden (NICE/ACOG) daha yüksek duyarlılık ve daha düşük yanlış pozitiflikle preterm preeklampsiyi öngörür ve bu öngörü, ASPRE ile gösterildiği gibi, erken aspirin profilaksisini yönlendirerek somut bir önleme fırsatı yaratır.
Makine öğrenmesi şimdilik "devrim" değil, "denklik ve erişilebilirlik" sunuyor. Biyobelirteç temelli ML modelleri FMF'e büyük ölçüde eşdeğer performans gösteriyor; asıl katkıları, MoM dönüşümü gerektirmemeleri ve — EHR temelli modellerde — Doppler/özel biyobelirteçlerin bulunmadığı sistemlerde de uygulanabilir olmalarıdır.
Bir model benimsenmeden önce yerel dış validasyon şarttır. Yayınlanmış AUC değerleri kendi popülasyonunuza doğrudan taşınamaz; cihaz/popülasyon farkları için kalibrasyon gerekebilir.
Model çıktısı bir araçtır, karar değildir. Aspirin profilaksisi kararı, hesaplanan risk skoruyla birlikte klinik bağlam, hasta tercihi ve güncel kılavuzlar (doz/zamanlama dâhil) çerçevesinde verilmelidir.

Özetle, preeklampsi öngörüsü, obstetride yapay zekânın en olgun ve klinik etkisi en iyi gösterilmiş uygulama alanlarından biridir — ancak bu olgunluğu sağlayan şey, parlak AUC rakamları değil, FMF modeli gibi çok merkezli dış validasyondan geçmiş ve ASPRE gibi bir randomize çalışmayla sonuç-değiştirici etkisi kanıtlanmış bir zincirin varlığıdır. Yeni ML modelleri bu çıtayı korumalı: bağımsız popülasyonlarda valide edilmeli, kalibre edilmeli ve nihayetinde prospektif olarak sonucu iyileştirdikleri gösterilmelidir.

← Obstetride Yapay Zeka bölümüne dön