Metinden Görsel Oluşturan Yapay Zekâ, Artık Çok Daha Fazlasını Yapabiliyor: Var Olan Görsel de Metin Eklenerek Değiştirilebilecek!

Metinden Görsel Oluşturan Yapay Zekâ, Artık Çok Daha Fazlasını Yapabiliyor: Var Olan Görsel de Metin Eklenerek Değiştirilebilecek!

En popüler metinden görsele yapay zekâlarından birisi olan Stable Diffusion’ın ikinci sürümü yayınlandı. Yapay zekâ, artık çok daha yüksek çözünürlüklerde görsel üretebilecek.

DALL-E 2, Midjourney ve Stable Diffusion gibi yapay zekâlar, hayatımıza istediğimiz görseli sadece yazıyla anlatarak oluşturma gibi olağanüstü bir imkânı soktu. Tabii yeni gelişen her teknolojide olduğu gibi bu teknolojilerin de gelişme hızı, inanılmaz miktarda yüksek seviyede.

Bu teknolojilerin özellikle açık kaynak olarak yayınlanması halihazırda bu gelişime büyük bir katkı sunarken, bugün Stable Difusion’dan heyecanlandıran duyuru geldi. Yapay zekânın ardındaki ekip, Stable Diffusion’un ikinci versiyonunu kullanıma sundu.

“Stable Diffusion 2.0” neler sunuyor?

CompVis tarafından geliştirilen yapay zekânın yeni sürümü Stable Diffusion 2.0, metinden görsel oluşturma imkânını yepyeni boyuta taşıyacak. LAION-5B veri seti ile eğitilen yeni model, daha yüksek çözünürlüklü görseller oluşturabilecek, düşük çözünürlüklü görselleri yüksek çözünürlüğe kavuşturabilecek ve görseller için çok daha tutarlı alternatifler sunabilecek. Gelin, tüm bunlara detaylarıyla bakalım.

Çok daha yüksek çözünürlüklü görseller elde edilebilecek:

Stable Diffusion 2.0 ile birlikte kullanıcılar, 512×512 veya 768×768 çözünürlüklerinde çıktılar alabilecekler. Ek olarak oluşturulan tüm fotoğraflar, LAION’un NSFW filtresinden geçerek yetişkin içeriklerden arındırılacak.

Tabii istediğiniz fotoğrafı alırsanız, bunun çözünürlüğünü çok daha yüksek seviyelere taşıyabileceksiniz:

Yeni sürüm, artık 2048×2048 piksel ve daha yüksek çözünürlükte ‘upscale’ imkânı da sunacak. Oluşturduğunuz görsellerden beğendiğiniz örneği alıp, 512×512 pikselden çok daha yüksek çözünürlüklere taşıyabileceksiniz.

Görselden görsel oluşturmada da yeni geliştirmeler yapıldı:

‘depth2img’ adlı yeni model ile birlikte 2.0 sürümü, görselleri çok daha iyi bir şekilde analiz edebilecek. Bu sayede yapay zekâ, sunduğunuz bir görselin farklı alternatiflerini daha yüksek anlam bağıyla oluşturabilecek.

Görseller üzerinde metinle değişiklik yapılabilecek!

Görselden görsele çıktının yanı sıra kullanıcılar, artık sundukları bir görselde istedikleri değişiklikleri yazıyla belirtebilecekler. Yapay zekâ, önce görseli analiz edecek, sonrasında metinle sunduğunuz değişiklikleri görsel üzerinde uygulayacak.

Stable Diffusion 2.0’a erişmek için bu bağlantıya tıklayarak yapay zekânın GitHub sayfasına ulaşabilirsiniz.

İLGİLİ HABER