IVF/ART'ta Embriyo Seçiminde Yapay Zeka

⚕️ Hedef kitle: Bu içerik sağlık profesyonellerine yöneliktir ve eğitim/güncel-bilgi amaçlıdır. Yapay zekâ araçları klinik karar desteği sunar; klinisyen sorumluluğunun ve onaylı klinik iş akışlarının yerine geçmez.

Tüp bebek (IVF — in vitro fertilizasyon) sürecinde en kritik kararlardan biri, bir kohort içinde transfer edilecek en yetkin embriyonun seçilmesidir. Onlarca yıldır bu seçim, embriyoların ışık mikroskobu altında belirli zaman noktalarında değerlendirildiği morfolojik derecelendirmeye (örneğin blastosist evresi için Gardner sistemi) dayanıyor. Ancak morfolojik değerlendirme, embriyologlar arasında ve hatta aynı embriyoloğun farklı zamanlardaki okumaları arasında belirgin değişkenlik gösterir; ayrıca embriyonun kromozomal durumunu (öploidi/anöploidi) zayıf öngörür. İşte yapay zeka (YZ), bu öznelliği nesnelleştirme ve standardize etme vaadiyle alana girdi.

Bu makale, embriyo seçiminde YZ'nin teknik temellerini, ticari araçların gerçek performansını ve — en önemlisi — randomize kontrollü çalışmaların (RCT) ortaya koyduğu çelişkili tabloyu dürüstçe ele alır. Çünkü bu alan, etkileyici geriye dönük (retrospektif) sonuçlarla beslenen aşırı iyimserliğe son derece açıktır.

Teknik temel: Time-lapse görüntüleme ve derin öğrenme

Modern YZ tabanlı embriyo değerlendirmesinin omurgasını time-lapse görüntüleme (TLM — embriyonun inkübatör içinde sürekli aralıklarla fotoğraflanmasını sağlayan zaman-atlamalı mikroskopi) oluşturur. Geleneksel değerlendirmenin aksine TLM, embriyonun preimplantasyon gelişimini kesintisiz izleyerek, ayrık gözlemlerde kaçırılan morfokinetik parametreleri (hücre bölünmelerinin tam zamanlamaları gibi dinamik özellikler) açığa çıkarır.

Bu görüntü dizileri, konvolüsyonel sinir ağları (CNN — görüntü tanımada kullanılan, katmanlı yapıya sahip bir derin öğrenme mimarisi) ile analiz edilir. Modeller iki temel yaklaşımdan birini izler: (1) Açıklanabilir özellik çıkarımı — döllenme durumu, fragmentasyon derecesi, simetri gibi embriyologun da anlayıp doğrulayabileceği ölçümleri otomatik üretmek; (2) "Kara kutu" canlılık skorlaması — implantasyon/canlı doğum sonucunu doğrudan ham görüntülerden öngörmek. İkinci yaklaşım daha güçlü tahmin gücü vaat etse de yorumlanabilirlikten ve genellenebilirlikten ödün verir.

💡 Önemli ayrım: Bir YZ modelinin morfolojik kaliteyi tutarlı sınıflaması ile klinik sonucu (gebelik, canlı doğum) öngörmesi tamamen farklı zorluk düzeyleridir. Yüksek bir morfoloji-sınıflama doğruluğu, gerçek gebelik öngörü performansını yansıtmaz.

Çığır açan çalışma: STORK (2019)

Bu ayrımı en iyi STORK çalışması örnekler. Khosravi ve arkadaşları (npj Digital Medicine, 2019), Google'ın Inception modelini temel alan STORK adlı bir derin sinir ağını yaklaşık 50.000 embriyo time-lapse görüntüsüyle eğitti. Model, blastosist kalitesini AUC >0,98 (eğri altı alan — 1,0 mükemmel ayrımı gösterir) ile sınıflandırdı ve bireysel embriyologları geçti. Ancak bu metrik, embriyonun morfolojik kalite kategorisini öngörmeye aittir — gebelik sonucuna değil. Nitekim yazarlar, klinik anlamı yakalamak için embriyo kalitesini hasta yaşıyla birleştiren ayrı bir karar ağacı kurmak zorunda kaldı (gebelik şansı yaş ve kaliteye göre %13,8 ile %66,3 arasında değişti). STORK, alanın kanıtını yorumlarken neden dikkatli olunması gerektiğinin erken bir uyarısıydı.

Ticari skorlar: iDAScore örneği

Alanın en yaygın ticari ürünü, Vitrolife firmasının iDAScore (intelligent Data Analysis Score) adlı, tamamen otomatik ve "ek açıklama gerektirmeyen" (annotation-free) derin öğrenme tabanlı embriyo skorlama modülüdür. iDAScore, Avrupa Tıbbi Cihaz Direktifi kapsamında 2020 başında CE işareti almıştır ve embriyologa manuel girdi olmadan embriyoları implantasyon olasılığına göre 1,0–9,9 arası sıralar.

iDAScore'un geliştirme ve doğrulama çalışmaları geniş veri setlerine dayanır. Berntsen ve arkadaşları (PLoS One, 2022) modeli 18 IVF merkezinden 115.832 embriyoyla geliştirip dış-merkez genellenebilirliğini test etti; bilinen implantasyon sonuçlu embriyolarda AUC 0,67, yeni klinikler için ise 0,60–0,75 aralığındaydı. Güncellenmiş v2.0 sürümü 22 klinikten 181.428 embriyoyla eğitildi (Lassen ve ark., Scientific Reports, 2023) ve transfer gününe göre AUC 0,62–0,71 bildirdi. Geriye dönük tek-merkez kohortlarda iDAScore'un yüksek skorları artmış canlı doğum (düzeltilmiş OR 1,81; %95 GA 1,67–1,98) ve azalmış düşük oranıyla ilişkilendirildi (Ueno ve ark., 2022).

Bu sonuçlar tutarlı ama mütevazıdır: gebelik öngörü AUC'leri tipik olarak 0,66–0,74 bandındadır — yani embriyologların manuel değerlendirmesiyle en fazla denk veya hafifçe daha iyi, ancak ondan dramatik biçimde üstün değil. iDAScore'un asıl avantajı doğruluk sıçraması değil, nesnellik, tekrarlanabilirlik ve hız görünmektedir: bir embriyoyu değerlendirme süresi yaklaşık 208 saniyeden 21 saniyeye, neredeyse on kat azalır.

Kritik nokta: RCT kanıtı YZ üstünlüğünü göstermedi

⚠️ Aşırı iyimserliğe dikkat: Geriye dönük çalışmalardaki etkileyici AUC değerleri, prospektif klinik fayda anlamına gelmez. Bu alanda RCT kanıtı, retrospektif vaatleri doğrulamamıştır.

Embriyo seçiminde YZ'nin gerçek klinik değerini ölçen en güçlü kanıt, 2024'te yayımlanan çok-merkezli, randomize, çift-kör, non-inferiorite (eşit-etkililik) çalışmasıdır (Illingworth ve ark., Nature Medicine, 2024). Avustralya ve Avrupa'daki 14 IVF kliniğinde, 5. günde en az iki erken-evre blastosisti olan 42 yaş altı 1.066 kadın, ya standart morfolojik değerlendirmeye ya da iDAScore (v1) ile seçime randomize edildi.

Sonuç çarpıcıydı: iDAScore kolunda klinik gebelik oranı %46,5 (533'te 248), morfoloji kolunda %48,2 (533'te 257) idi (risk farkı −%1,7; %95 GA −7,7 ile +4,3; p=0,62). Önceden tanımlanmış %5'lik non-inferiorite sınırı göz önüne alındığında, çalışma derin öğrenmenin standart morfolojiye eşit-etkili (non-inferior) olduğunu gösterEMEdi. Yani YZ, klinik gebelik oranında morfolojiyi geçemediği gibi, ona denk olduğunu da kanıtlayamadı.

Bu bulgu, alanda öyle yankı uyandırdı ki Human Reproduction dergisindeki bir eşlik eden yorum yazısı (Sakkas, 2025) çalışmayı şu başlıkla özetledi: "Embriyolojinin altın postu bir kez daha elimizden kayıyor." Yazar, iyi blastosist morfolojisinin canlı doğum öngörüsünde "aşılması zor yüksek bir çıta" olarak yeniden kendini kanıtladığını vurgular — ancak morfolojinin yakalayamadığı canlılık özelliklerini bulmak için araştırmadan vazgeçilmemesi gerektiğini de ekler.

Bu tablo, daha geniş bir literatürle uyumludur. Time-lapse görüntüleme sistemlerini değerlendiren toplu meta-analizler tutarlı biçimde "fayda belirsizliği" bildirmiştir; bireysel-katılımcı veri (IPD) meta-analizi protokolü (Bhide ve ark., BMJ Open, 2025) tam da bu belirsizliği — kliniklerin ciddi kaynak yatırımına rağmen — gidermek için tasarlanmıştır.

Embriyolog uyumu: tamamlayıcı mı, ikame mi?

YZ ile embriyolog kararlarının ne ölçüde örtüştüğü de aydınlatıcıdır. Küçük bir retrospektif kohortta (Harir ve ark., 2025; 82 IVF siklusu) embriyolog ve iDAScore seçimleri vakaların yalnızca %64,6'sında uyuştu; üstelik uyumlu ve uyumsuz seçimler arasında gebelik oranı farkı yoktu (%45,2'ye %44,8; p>0,05). Bu, YZ'nin insan yargısıyla "yakın ama özdeş olmayan" bir hizada olduğunu ve mevcut kanıt düzeyinde bir karar desteği aracı — bir ikame değil — olarak konumlanması gerektiğini gösterir.

Öploidi (kromozomal durum) tahmini iddiaları ve sınırı

YZ etrafındaki en iddialı — ve en tartışmalı — vaat, görüntülerden embriyonun öploidi durumunu (kromozomal normalliğini) noninvazif olarak öngörebilmesidir. Bu, anöploidiler için preimplantasyon genetik test (PGT-A — trofektoderm biyopsisi gerektiren, maliyetli, invazif ve etik açıdan tartışmalı altın standart) yerine geçebilecek ucuz bir alternatif olurdu.

Ancak kanıt bu iddiayı desteklemiyor. Yirmi çalışmayı (12'si meta-analizde, toplam 6.879 embriyo) inceleyen sistematik derleme ve meta-analiz (Xin ve ark., EClinicalMedicine, 2024), YZ'nin öploidi öngörüsü için havuzlanmış duyarlılığını 0,71, özgüllüğünü 0,75 ve AUC'sini 0,80 (%95 GA 0,76–0,83) buldu. Tek bir ticari skor için bakıldığında performans daha da düşüktür: iDAScore'un öploidi öngörü AUC'si tek başına yalnızca 0,60–0,61 düzeyinde, klinik ve embriyonik değişkenler eklendiğinde ancak ~0,69'a çıkmaktadır (Cimadomo ve ark., 2023; Ma ve ark., 2024). Bu performans, embriyoları sıralamaya yarayan bir yardımcı sinyal sağlasa da, NGS (yeni nesil dizileme) temelli genetik tanının yerini almaktan uzaktır. Meta-analizin yazarları açıkça şu sonuca varır: YZ modelleri ploidi belirlemede invazif yöntemleri tamamen ikame edemez; PGT-A uygulayamayan hastalar için yardımcı bir araç olabilirler.

Kanıt düzeyi ve sınırlılıklar

Geriye dönük baskınlık: Literatürün büyük kısmı retrospektif validasyondur. Tek mevcut iyi-tasarlanmış RCT, klinik gebelikte üstünlük veya non-inferiorite gösterEMEmiştir.
Mütevazı ayrım gücü: Gebelik için AUC'ler tipik olarak 0,66–0,74; öploidi için tek-araç AUC'si ~0,60. Bunlar "iyi" değil, "orta" düzey ayrım gücüdür.
Dış validasyon kırılganlığı: Modeller yeni kliniklere taşındığında performans düşebilir (iDAScore'da klinik-bazında AUC 0,60–0,75 aralığı). Klinik popülasyonu, laboratuvar protokolleri ve TLM sistemi farkları genellemeyi sınırlar.
Yorumlanabilirlik: "Kara kutu" skorlar, embriyologun gerekçeyi doğrulamasını güçleştirir; açıklanabilir özellik-çıkaran modeller (örneğin Yang ve ark.'nın BlastAssist hattı, 2024) klinik karara daha şeffaf katkı sunar.
Sonuç noktası seçimi: Çoğu çalışma implantasyon/gebelik gibi ara sonuçlara odaklanır; asıl önemli olan canlı doğum ve neonatal güvenlik verisi nispeten kısıtlıdır.

Klinik pratiğe yansıması

Mevcut kanıt ışığında dengeli bir konumlanma şöyle özetlenebilir:

YZ bir karar desteğidir, ikame değil. iDAScore gibi araçlar embriyo değerlendirmesini nesnelleştirir, standardize eder ve hızlandırır — bunlar gerçek ve değerli kazanımlardır. Ancak bugünün kanıtı, bu araçların gebelik/canlı doğum oranını morfolojinin ötesinde artırdığını göstermemektedir.
İş akışı verimliliği güçlü bir gerekçedir. Gözlemciler arası değişkenliğin azalması ve değerlendirme süresinin neredeyse on kat kısalması, özellikle yüksek hacimli laboratuvarlarda anlamlı operasyonel fayda sağlayabilir.
Öploidi tahmini PGT-A'nın yerini almaz. YZ skorları, biyopsi yapılamayan veya PGT-A'ya erişemeyen hastalarda yalnızca yardımcı bir sıralama sinyali olarak düşünülmelidir; kromozomal tanı hâlâ genetik testlere dayanır.
Pazarlama iddialarına eleştirel yaklaşın. Etkileyici AUC rakamları ve "embriyologu geçti" başlıkları çoğunlukla retrospektif veya morfoloji-sınıflama metrikleridir; klinik fayda iddiası için prospektif, randomize, canlı-doğum sonuçlu kanıt aranmalıdır.

Özetle, embriyo seçiminde YZ, IVF laboratuvarının standardizasyon ve verimlilik araç setine gerçek bir katkıdır; ancak "embriyolojinin altın postu" — yani transfer edilecek en yetkin embriyoyu morfolojiden belirgin biçimde daha iyi seçme yeteneği — henüz yakalanamamıştır. Devam eden IPD meta-analizleri ve yeni RCT'ler, hangi hasta alt gruplarının (varsa) bu teknolojiden fayda gördüğünü önümüzdeki yıllarda netleştirecektir.

← Obstetride Yapay Zeka bölümüne dön