Microsoft şimdiye kadar gördüğümüz en etkileyici (hatta en ürkütücü) suni zeka araçlarından birini tanıttı. Yazılım devi tek bir resim ve ses kaydından yola çıkarak realist deepfake videolar oluşturabilen VASA-1 isimli suni zeka modelini ortaya çıkardı. Yeni sinir ağı, insan yüzünün hareketlerini ve duygu ifadelerini inanılmaz bir doğrulukla yansılamak edebiliyor. Bu sayede üretilen videolar son aşama naturel ve inandırıcı görünüyor. Uzmanlar bunu deepfake videolar için “ürkütücü bir makine” olarak adlandırdılar.
VASA-1, yüz dinamiklerini ve baş hareketlerini üretmek için gizli saklı bir yüz uzayı kullanıyor. Microsoft bu yöntemin, önceki tekniklere kıyasla mühim seviyede gelişmiş bulunduğunu ve daha realist sonuçlar verdiğini belirtiyor. Ortaya çıkan emek harcamalar da bunu doğrular nitelikte. Şimdilik genel kullanıma kapalı Algoritma, 512×512 px çözünürlükte ve saniyede 45 kare hızında çevrimiçi video kurmayı destekliyor. Bu da modelle etkileşim oluşturmayı ve realist avatarlar ile reel zamanlı söyleşi etmeyi olası kılıyor.
Microsoft’un şu anda VASA-1’i ticari bir ürün olarak piyasaya sürme niyeti yok. Şirket yeni modelin şimdilik inceleme amaçlı bir vasıta olarak kullanılmasını istiyor. Görünüşe nazaran firma endişeleri yatıştırmak için VASA-1’in kısa sürede kullananların eline geçmeyeceği mevzusunda güvence veriyor. Bu model, film ve oyun endüstrisi için yeni imkanlar sunabilir, sanal asistanlar ve satın alan hizmetleri uygulamaları geliştirmek için kullanılabilir ve hatta tahsil ve sıhhat sektörlerinde de yararlı olabilir.
Kaynak: https://www.donanimhaber.com/harici-baglanti?url=https%253a%252f%252fwww.creativebloq.com%252fnews%252fmicrosoft-ai