Stability AI, Metinden Görüntü Üreten Yeni Yapay Zekâ Modeli “Stable Görüntü Diffusion”ı Duyurdu [Video]

Tıpkı OpenAI üzere yapay zekâ takviyeli teknolojiler üreten firmaların başında gelen Stability AI, bugün çok kıymetli bir duyuru gerçekleştirdi. Bu duyuruda, şirketin yeni yapay zekâ modeli “Stable Görüntü Diffusion” tanıtıldı. Şirketin metinden görsel üretmeye yarayan yapay zekâ modeli “Stable Diffusion” üzerine inşa edilen yeni model, metinleri evvel imajlara, akabinde da görüntülere dönüştürüyor.

Stable Görüntü Diffusion, şimdi erken evrede olan bir yapay zekâ modeli. Hâl bu türlü olunca herkesin kullanımına açık değil. Ancak Stability AI’ın şanslı ferdî ve ticari lisans sahibi kullanıcıları, şirketin yeni yapay zekâ modelini şimdiden deneyebiliyorlar. Bu ortada; Stable Görüntü Diffusion için paylaşılan örnekler, teknolojinin hiç de fena olmadığını gözler önüne seriyor.

İşte Stable Görüntü Diffusion ile üretilen kimi örnek görüntüler:

Stability AI tarafından yapılan açıklamalara nazaran yeni yapay zekâ modeli, SVD ve SVD-XT formunda iki farklı çıktı formatı üretebiliyor. SVD formatı, 14 kareyi 576×1024 piksel çözünürlükte görüntü hâline getiriyor. SVD-XT ise bir içerik için 24 kare kullanabiliyor. Her iki formatta da 3 ila 30 fps arasında manzara alınabiliyor.

Stable Görüntü Diffusion, milyonlarca görüntünün eğitim için kullanıldığı bir model. Şirket, bu türlü devasa bir bilgi seti ile eğittiği modeli, ikinci kademede yaklaşık bir milyon görüntü kullanarak tekrar eğitti. İkinci eğitim, Stable Görüntü Diffusion tarafından üretilen imajlara ince ayar yapılmasını sağladı. Lakin şirket, bilgi setlerinde kullandığı görüntüleri nereden temin ettiğine ait bir açıklama yapmadı. Aslında şirket, eğitim bilgilerinin telifsiz ve kamuya açık data tabanlarından alındığını söylüyor fakat bunun nasıl yapıldığını bilen yok.

Stability AI’ın açıklamasına nazaran yeni yapay zekâ modeli, aslında ticari kullanım için tasarlandı. Şirket, geliştirdiği teknolojinin reklamcılık, eğitim ve cümbüş üzere birtakım kesimlerde işleri kolaylaştıracağını söylüyor. Fakat bunun ferdi açıdan kullanımının yol açabileceği birtakım sıkıntılar olduğunu atlamamak gerek. Sonuçta deepfake teknolojisinin sonuçlarını hepimiz biliyoruz…

İşte Stable Görüntü Diffusion, kişisel kullanım risklerini ortadan kaldırmak için kimi kısıtlamalar içeriyor. Yapılan açıklamalara nazaran bu yapay zekâ modeli, yine düzenlemeye müsaade vermiyor. Ayrıyeten bir kişinin yüzü, metindekiyle uyumlu olmayabiliyor. Tüm bunlara ek olarak yeni yapay zekâ modeli, büyük oranda hareketsiz yahut yavaş kamera efektleri içeren imajlar de üretmiyor. Takımın bu sistemlerle tüketicileri koruyup koruyamayacakları şimdilik bilinmeyen.