Time-lapse görüntüleme ve derin öğrenme, embriyo seçiminde gözlemciler arası değişkenliği azaltma vaadiyle hızla yaygınlaştı. Peki bu teknoloji canlı doğum oranını gerçekten artırıyor mu? Kanıtı — olumlu ve olumsuz yönleriyle — dürüstçe ele alıyoruz.
⚕️ Hedef kitle: Bu içerik sağlık profesyonellerine yöneliktir ve eğitim/güncel-bilgi amaçlıdır. Yapay zekâ araçları klinik karar desteği sunar; klinisyen sorumluluğunun ve onaylı klinik iş akışlarının yerine geçmez.
Tüp bebek (IVF — in vitro fertilizasyon) sürecinde en kritik kararlardan biri, bir kohort içinde transfer edilecek en yetkin embriyonun seçilmesidir. Onlarca yıldır bu seçim, embriyoların ışık mikroskobu altında belirli zaman noktalarında değerlendirildiği morfolojik derecelendirmeye (örneğin blastosist evresi için Gardner sistemi) dayanıyor. Ancak morfolojik değerlendirme, embriyologlar arasında ve hatta aynı embriyoloğun farklı zamanlardaki okumaları arasında belirgin değişkenlik gösterir; ayrıca embriyonun kromozomal durumunu (öploidi/anöploidi) zayıf öngörür. İşte yapay zeka (YZ), bu öznelliği nesnelleştirme ve standardize etme vaadiyle alana girdi.
Bu makale, embriyo seçiminde YZ'nin teknik temellerini, ticari araçların gerçek performansını ve — en önemlisi — randomize kontrollü çalışmaların (RCT) ortaya koyduğu çelişkili tabloyu dürüstçe ele alır. Çünkü bu alan, etkileyici geriye dönük (retrospektif) sonuçlarla beslenen aşırı iyimserliğe son derece açıktır.
Modern YZ tabanlı embriyo değerlendirmesinin omurgasını time-lapse görüntüleme (TLM — embriyonun inkübatör içinde sürekli aralıklarla fotoğraflanmasını sağlayan zaman-atlamalı mikroskopi) oluşturur. Geleneksel değerlendirmenin aksine TLM, embriyonun preimplantasyon gelişimini kesintisiz izleyerek, ayrık gözlemlerde kaçırılan morfokinetik parametreleri (hücre bölünmelerinin tam zamanlamaları gibi dinamik özellikler) açığa çıkarır.
Bu görüntü dizileri, konvolüsyonel sinir ağları (CNN — görüntü tanımada kullanılan, katmanlı yapıya sahip bir derin öğrenme mimarisi) ile analiz edilir. Modeller iki temel yaklaşımdan birini izler: (1) Açıklanabilir özellik çıkarımı — döllenme durumu, fragmentasyon derecesi, simetri gibi embriyologun da anlayıp doğrulayabileceği ölçümleri otomatik üretmek; (2) "Kara kutu" canlılık skorlaması — implantasyon/canlı doğum sonucunu doğrudan ham görüntülerden öngörmek. İkinci yaklaşım daha güçlü tahmin gücü vaat etse de yorumlanabilirlikten ve genellenebilirlikten ödün verir.
💡 Önemli ayrım: Bir YZ modelinin morfolojik kaliteyi tutarlı sınıflaması ile klinik sonucu (gebelik, canlı doğum) öngörmesi tamamen farklı zorluk düzeyleridir. Yüksek bir morfoloji-sınıflama doğruluğu, gerçek gebelik öngörü performansını yansıtmaz.
Bu ayrımı en iyi STORK çalışması örnekler. Khosravi ve arkadaşları (npj Digital Medicine, 2019), Google'ın Inception modelini temel alan STORK adlı bir derin sinir ağını yaklaşık 50.000 embriyo time-lapse görüntüsüyle eğitti. Model, blastosist kalitesini AUC >0,98 (eğri altı alan — 1,0 mükemmel ayrımı gösterir) ile sınıflandırdı ve bireysel embriyologları geçti. Ancak bu metrik, embriyonun morfolojik kalite kategorisini öngörmeye aittir — gebelik sonucuna değil. Nitekim yazarlar, klinik anlamı yakalamak için embriyo kalitesini hasta yaşıyla birleştiren ayrı bir karar ağacı kurmak zorunda kaldı (gebelik şansı yaş ve kaliteye göre %13,8 ile %66,3 arasında değişti). STORK, alanın kanıtını yorumlarken neden dikkatli olunması gerektiğinin erken bir uyarısıydı.
Alanın en yaygın ticari ürünü, Vitrolife firmasının iDAScore (intelligent Data Analysis Score) adlı, tamamen otomatik ve "ek açıklama gerektirmeyen" (annotation-free) derin öğrenme tabanlı embriyo skorlama modülüdür. iDAScore, Avrupa Tıbbi Cihaz Direktifi kapsamında 2020 başında CE işareti almıştır ve embriyologa manuel girdi olmadan embriyoları implantasyon olasılığına göre 1,0–9,9 arası sıralar.
iDAScore'un geliştirme ve doğrulama çalışmaları geniş veri setlerine dayanır. Berntsen ve arkadaşları (PLoS One, 2022) modeli 18 IVF merkezinden 115.832 embriyoyla geliştirip dış-merkez genellenebilirliğini test etti; bilinen implantasyon sonuçlu embriyolarda AUC 0,67, yeni klinikler için ise 0,60–0,75 aralığındaydı. Güncellenmiş v2.0 sürümü 22 klinikten 181.428 embriyoyla eğitildi (Lassen ve ark., Scientific Reports, 2023) ve transfer gününe göre AUC 0,62–0,71 bildirdi. Geriye dönük tek-merkez kohortlarda iDAScore'un yüksek skorları artmış canlı doğum (düzeltilmiş OR 1,81; %95 GA 1,67–1,98) ve azalmış düşük oranıyla ilişkilendirildi (Ueno ve ark., 2022).
Bu sonuçlar tutarlı ama mütevazıdır: gebelik öngörü AUC'leri tipik olarak 0,66–0,74 bandındadır — yani embriyologların manuel değerlendirmesiyle en fazla denk veya hafifçe daha iyi, ancak ondan dramatik biçimde üstün değil. iDAScore'un asıl avantajı doğruluk sıçraması değil, nesnellik, tekrarlanabilirlik ve hız görünmektedir: bir embriyoyu değerlendirme süresi yaklaşık 208 saniyeden 21 saniyeye, neredeyse on kat azalır.
⚠️ Aşırı iyimserliğe dikkat: Geriye dönük çalışmalardaki etkileyici AUC değerleri, prospektif klinik fayda anlamına gelmez. Bu alanda RCT kanıtı, retrospektif vaatleri doğrulamamıştır.
Embriyo seçiminde YZ'nin gerçek klinik değerini ölçen en güçlü kanıt, 2024'te yayımlanan çok-merkezli, randomize, çift-kör, non-inferiorite (eşit-etkililik) çalışmasıdır (Illingworth ve ark., Nature Medicine, 2024). Avustralya ve Avrupa'daki 14 IVF kliniğinde, 5. günde en az iki erken-evre blastosisti olan 42 yaş altı 1.066 kadın, ya standart morfolojik değerlendirmeye ya da iDAScore (v1) ile seçime randomize edildi.
Sonuç çarpıcıydı: iDAScore kolunda klinik gebelik oranı %46,5 (533'te 248), morfoloji kolunda %48,2 (533'te 257) idi (risk farkı −%1,7; %95 GA −7,7 ile +4,3; p=0,62). Önceden tanımlanmış %5'lik non-inferiorite sınırı göz önüne alındığında, çalışma derin öğrenmenin standart morfolojiye eşit-etkili (non-inferior) olduğunu gösterEMEdi. Yani YZ, klinik gebelik oranında morfolojiyi geçemediği gibi, ona denk olduğunu da kanıtlayamadı.
Bu bulgu, alanda öyle yankı uyandırdı ki Human Reproduction dergisindeki bir eşlik eden yorum yazısı (Sakkas, 2025) çalışmayı şu başlıkla özetledi: "Embriyolojinin altın postu bir kez daha elimizden kayıyor." Yazar, iyi blastosist morfolojisinin canlı doğum öngörüsünde "aşılması zor yüksek bir çıta" olarak yeniden kendini kanıtladığını vurgular — ancak morfolojinin yakalayamadığı canlılık özelliklerini bulmak için araştırmadan vazgeçilmemesi gerektiğini de ekler.
Bu tablo, daha geniş bir literatürle uyumludur. Time-lapse görüntüleme sistemlerini değerlendiren toplu meta-analizler tutarlı biçimde "fayda belirsizliği" bildirmiştir; bireysel-katılımcı veri (IPD) meta-analizi protokolü (Bhide ve ark., BMJ Open, 2025) tam da bu belirsizliği — kliniklerin ciddi kaynak yatırımına rağmen — gidermek için tasarlanmıştır.
YZ ile embriyolog kararlarının ne ölçüde örtüştüğü de aydınlatıcıdır. Küçük bir retrospektif kohortta (Harir ve ark., 2025; 82 IVF siklusu) embriyolog ve iDAScore seçimleri vakaların yalnızca %64,6'sında uyuştu; üstelik uyumlu ve uyumsuz seçimler arasında gebelik oranı farkı yoktu (%45,2'ye %44,8; p>0,05). Bu, YZ'nin insan yargısıyla "yakın ama özdeş olmayan" bir hizada olduğunu ve mevcut kanıt düzeyinde bir karar desteği aracı — bir ikame değil — olarak konumlanması gerektiğini gösterir.
YZ etrafındaki en iddialı — ve en tartışmalı — vaat, görüntülerden embriyonun öploidi durumunu (kromozomal normalliğini) noninvazif olarak öngörebilmesidir. Bu, anöploidiler için preimplantasyon genetik test (PGT-A — trofektoderm biyopsisi gerektiren, maliyetli, invazif ve etik açıdan tartışmalı altın standart) yerine geçebilecek ucuz bir alternatif olurdu.
Ancak kanıt bu iddiayı desteklemiyor. Yirmi çalışmayı (12'si meta-analizde, toplam 6.879 embriyo) inceleyen sistematik derleme ve meta-analiz (Xin ve ark., EClinicalMedicine, 2024), YZ'nin öploidi öngörüsü için havuzlanmış duyarlılığını 0,71, özgüllüğünü 0,75 ve AUC'sini 0,80 (%95 GA 0,76–0,83) buldu. Tek bir ticari skor için bakıldığında performans daha da düşüktür: iDAScore'un öploidi öngörü AUC'si tek başına yalnızca 0,60–0,61 düzeyinde, klinik ve embriyonik değişkenler eklendiğinde ancak ~0,69'a çıkmaktadır (Cimadomo ve ark., 2023; Ma ve ark., 2024). Bu performans, embriyoları sıralamaya yarayan bir yardımcı sinyal sağlasa da, NGS (yeni nesil dizileme) temelli genetik tanının yerini almaktan uzaktır. Meta-analizin yazarları açıkça şu sonuca varır: YZ modelleri ploidi belirlemede invazif yöntemleri tamamen ikame edemez; PGT-A uygulayamayan hastalar için yardımcı bir araç olabilirler.
Mevcut kanıt ışığında dengeli bir konumlanma şöyle özetlenebilir:
Özetle, embriyo seçiminde YZ, IVF laboratuvarının standardizasyon ve verimlilik araç setine gerçek bir katkıdır; ancak "embriyolojinin altın postu" — yani transfer edilecek en yetkin embriyoyu morfolojiden belirgin biçimde daha iyi seçme yeteneği — henüz yakalanamamıştır. Devam eden IPD meta-analizleri ve yeni RCT'ler, hangi hasta alt gruplarının (varsa) bu teknolojiden fayda gördüğünü önümüzdeki yıllarda netleştirecektir.
Son güncelleme: . Kaynaklar yayın tarihleri ve güncel sürümleriyle teyit edilmiştir.