SIGGRAPH’da NVIDIA Research, Dijital Avatarlarla “Gösterinin En İyisi”ni Yakaladı

Isha Salian tarafından yazıldı. | Mert Köklü tarafından Türkçe'ye çevrildi.

Yayın Tarihi: Ağustos 10, 2021

Okuma 4 dkKategoriler: AI, Çeviri, Isha Salian

NVIDIA araştırmacıları bir demoda, SIGGRAPH 2021’in Gerçek Zamanlı demosu Real-Time-live için bir dijital avatar teknolojisi hizmetine dört AI modelini yerleştirdi ve Best in Show ödülünü kazandı.

Bilgisayar grafikleri konferansında dünyanın en büyük ve en çok beklenen etkinliklerinden biri olan bu demo, bu yıl sanal ortamda düzenlendi. Oyun teknolojisi, artırılmış gerçeklik ve bilimsel görselleştirmeyi içeren son teknoloji gerçek zamanlı projeler ödüllendirdi. Unity Technologies, Rensselaer Polytechnic Institute, NYU Future Reality Lab ve başka şirketlerden gelen sunucuların da yer aldığı bu demo jüri tarafından incelenen bir dizi interaktif projeye yer verdi.

Silikon Vadisi NVIDIA genel merkezinden canlı yayın yapan NVIDIA Araştırma ekibi, bant genişliği açısından verimli geliştirmeler içeren video konferans ve hikaye anlatımı gibi projeler için gerçeğe yakın sanal karakterler oluşturabilen yapay zeka modelleri koleksiyonunu sundu.

Proje demosu, tek bir fotoğraftan dijital avatarlar oluşturmak, avatarları doğal 3B yüz hareketiyle canlandırmak ve metni konuşmaya dökmek için araçlar içeriyordu.

NVIDIA uygulamalı derin öğrenme araştırmaları başkan yardımcısı Bryan Catanzaro, sunumda “Dijital avatarlar yapmak herkesin bildiği gibi zor, sıkıcı ve pahalı bir süreç. Ancak yapay zeka araçları ile gerçek insanlar ve çizgi film karakterleri için dijital avatarlar oluşturmanın kolay bir yolu var. Video konferans, hikaye anlatımı, sanal asistanlar ve diğer birçok uygulama için kullanılabilir” dedi.

Yapay Zeka, Mülakatları Mükemmelleştiriyor

Demoda, iki NVIDIA araştırmacısı, video konferans üzerinden iletişim kuran bir mülakatçıyı ve iş için görüşme yapan bir aday rolünü oynadılar. Aday, görüşme sırasında görevli ile iletişim kurmak için yapay zeka ile çalışan dijital avatar teknolojisinin yeteneklerini gösterdi.

Aday rolünü oynayan araştırmacı baştan sona bir NVIDIA RTX dizüstü bilgisayara güvenirken, görevli RTX A6000 GPU’lar tarafından desteklenen bir masaüstü iş istasyonunu kullandı. Tüm işlem hattı, buluttaki GPU’larda da çalıştırılabilir.

For privacy reasons YouTube needs your permission to be loaded.

Bir kampüs kafesinde otururken, beyzbol şapkası ve yüz maskesi takan aday, video görüşmesinde yakalı bir gömlek içinde temiz tıraşlı görünmek için Vid2Vid Cameo modelini kullandı. Bu yapay zeka modeli, 3B tarama veya özel eğitim görüntüleri gerektirmeden, tek bir fotoğraftan gerçekçi dijital avatarlar oluşturuyor.

“Dijital avatar anında oluşuyor. Bu yüzden farklı bir fotoğraf kullanarak çok hızlı bir şekilde farklı bir avatar oluşturabilirim” dedi ve modelin kapasitesini kendisinin başka iki fotoğrafıyla gösterdi.

Araştırmacının sistemi, video akışı iletmek yerine yalnızca araştırmacının sesini gönderdi. Ardından bu ses, NVIDIA Omniverse Audio2Face uygulamasına girdi olarak verildi. Audio2Face, 3B baş modelinde ses girişini gerçek zamanlı olarak eşleştirmek için başın, gözlerin ve dudakların doğal hareketini oluşturuyor. Oluşturulan bu yüz animasyonu da, sunucunun dijital avatarıyla doğal görünümlü hareketi sentezlemek için Vid2Vid Cameo’ya girdi olarak verildi.

Araştırmacı, yalnızca fotogerçekçi dijital avatarlar için değil, aynı zamanda animasyonlu bir karakteri seslendirmek için de konuşmasını Audio2Face ve Vid2Vid Cameo aracılığıyla destekledi. Geliştiricilerin NVIDIA StyleGAN kullanarak çizgi film karakterleri veya resimler tarzında modellenen sonsuz dijital avatarlar oluşturabileceklerini açıkladı.

NVIDIA RTX GPU’larda çalışacak şekilde optimize edilen modeller, videoyu saniyede 30 kare hızında kolayca sunuyor. Ayrıca sunucu, yüksek çözünürlüklü bir video beslemesi iletmek yerine ağ üzerinden yalnızca ses verilerini gönderdiği için bant genişliği açısından da oldukça verimli.

Araştırmacı, daha da ileri giderek, kafenin çevresi çok gürültülü olduğunda, RAD-TTS modelinin yazılan mesajları sesine dönüştürebildiğini ve Audio2Face’le beslenen sesin yerini aldığını gösterdi. Çığır açan bu derin öğrenme tabanlı araç, milisaniyeler içinde rastgele metin girişlerinden gerçeğe yakın konuşmayı sentezleyebilir.

“Connecting in the Metaverse: The Making of the GTC Keynote” adlı belgeselimizin galasını izleyebilirsiniz.

For privacy reasons YouTube needs your permission to be loaded.

Yazının kaynağına buradan ulaşabilirsiniz.

OPENZEKA HABERLERİ

Agentic Tekniklerde Uzmanlaşma: Yapay Zeka Ajanlarını Özelleştirme

JetPack 7.2 Yayınlandı: NemoClaw, Jetson Agent Yetenekleri, MIG ve Yocto Desteği

Agentic Tekniklerde Uzmanlaşma: Yapay Zeka Ajanlarını Özelleştirme

JetPack 7.2 Yayınlandı: NemoClaw, Jetson Agent Yetenekleri, MIG ve Yocto Desteği

Yapay Zeka Ekonomisinde Doğru Metrik: Token Başına Maliyet Neden Her Şeyden Önemli?

Agentic Tekniklerde Uzmanlaşma: Yapay Zeka Ajanlarını Özelleştirme

JetPack 7.2 Yayınlandı: NemoClaw, Jetson Agent Yetenekleri, MIG ve Yocto Desteği

Avantajlı Fiyatlardan Faydalanmak İçin Mağazamızı Ziyaret Edin

OPENZEKA HABERLERİ

Agentic Tekniklerde Uzmanlaşma: Yapay Zeka Ajanlarını Özelleştirme

JetPack 7.2 Yayınlandı: NemoClaw, Jetson Agent Yetenekleri, MIG ve Yocto Desteği

Agentic Tekniklerde Uzmanlaşma: Yapay Zeka Ajanlarını Özelleştirme

JetPack 7.2 Yayınlandı: NemoClaw, Jetson Agent Yetenekleri, MIG ve Yocto Desteği

Yapay Zeka Ekonomisinde Doğru Metrik: Token Başına Maliyet Neden Her Şeyden Önemli?

Agentic Tekniklerde Uzmanlaşma: Yapay Zeka Ajanlarını Özelleştirme

JetPack 7.2 Yayınlandı: NemoClaw, Jetson Agent Yetenekleri, MIG ve Yocto Desteği

Hesaplarınızda paylaşmak ister misiniz?

İlgili Yazılar

Çözümler

Hızlı Linkler

Şirketler için Yapay Zeka Dönüşüm Rehberi

Derin Öğrenme Nedir?

Mağaza

Geliştirici Kitler

Hazır Yapay Zeka Kitleri

Modüller

Taşıyıcı Kartlar

İletişim

Open Zeka, NVIDIA Derin Öğrenme Kurumu ve NVIDIA Embedded Türkiye partneri olarak yeni nesil yapay zeka algoritmaları ve sensörleri kullanarak akıllı şehir ve otonom sistem konusunda çalışmaktadır. Özellikle uçtan uca çözüm geliştirilmesi konusunda eğitim, danışmanlık proje ortaklığı hizmetleri sunmaktadır.

Size daha iyi bir hizmet sunabilmek için web sitesi çerezleri ve üçüncü taraf hizmetleri kullanmaktayız. Ayarlar ve anlaşmalar için aşağıya bakınız. Ayarlar OK

Takip Çerezleri

Çerez, bir web sitesinin ziyaretçinin bilgisayarında depoladığı ve ziyaretçinin her dönüşünde ziyaretçinin tarayıcısının web sitesine sağladığı bir bilgi dizesidir. OpenZeka, OpenZeka'nın ziyaretçileri, OpenZeka web sitesini kullanımlarını ve web sitesi erişim tercihlerini tanımlamasına ve izlemesine yardımcı olmak için çerezleri kullanır.

Tracking Cookies

Üçüncü Taraf Çerezleri

Bu web siteleri hakkınızda veri toplayabilir, çerezleri kullanabilir, ek üçüncü taraf izleme ekleyebilir ve bir hesabınız varsa ve bu web sitesine giriş yapmışsanız, gömülü içerikle olan etkileşimi izlemek de dahil olmak üzere bu gömülü içerikle olan etkileşimi izleyebilir.

YouTube

Gizlilik ve Kişisel Veri Politikası

Gizliliğiniz bizim için çok önemlidir. OpenZeka'da takip ettiğimiz birkaç temel ilkemiz var: Gerçekten ihtiyacımız olmadıkça sizden kişisel bilgi istemiyoruz. (Görünen bir sebep olmadan sizden cinsiyetiniz veya gelir düzeyiniz gibi şeyler isteyen hizmetlere dayanamayız.) Kişisel bilgilerinizi yasalara uymak, ürünlerimizi geliştirmek veya haklarımızı korumak dışında kimseyle paylaşmayız.

GİZLİLİK & KİŞİSEL VERİ POLİTİKAMIZI OKUYUN

Kullanım Sözleşmesi, Şartlar ve Koşullar

Sitemizi kullanırken size iyi bir deneyim sunmak istiyoruz. Sunmuş olduğumuz içerikler ve satış hizmetlerinden faydalanabilmeniz için bazı şartlar belirledik. Bu şartlara uygun olarak satın alma işlemlerinin nasıl gerçekleştirileceği, kişisel verilerin işlenişi, hizmet şartlarımız ve ön gördüğümüz bazı sorunlarla ilgili uyarılarımızı öğrenmek için aşağıdaki bağlantıyı ziyaret ediniz.

KULLANIM SÖZLEŞMESİ, ŞARTLAR VE KOŞULLARI OKUYUN

SIGGRAPH’da NVIDIA Research, Dijital Avatarlarla “Gösterinin En İyisi”ni Yakaladı

Yapay Zeka, Mülakatları Mükemmelleştiriyor

OPENZEKA HABERLERİ

Agentic Tekniklerde Uzmanlaşma: Yapay Zeka Ajanlarını Özelleştirme

JetPack 7.2 Yayınlandı: NemoClaw, Jetson Agent Yetenekleri, MIG ve Yocto Desteği

Agentic Tekniklerde Uzmanlaşma: Yapay Zeka Ajanlarını Özelleştirme

JetPack 7.2 Yayınlandı: NemoClaw, Jetson Agent Yetenekleri, MIG ve Yocto Desteği

Yapay Zeka Ekonomisinde Doğru Metrik: Token Başına Maliyet Neden Her Şeyden Önemli?

Agentic Tekniklerde Uzmanlaşma: Yapay Zeka Ajanlarını Özelleştirme

JetPack 7.2 Yayınlandı: NemoClaw, Jetson Agent Yetenekleri, MIG ve Yocto Desteği

Avantajlı Fiyatlardan Faydalanmak İçin Mağazamızı Ziyaret Edin

Abone olmak ister misiniz?

Hemen ilgilendiğiniz alanları seçerek bültenimizden haberdar olabilirsiniz.

OPENZEKA HABERLERİ

Agentic Tekniklerde Uzmanlaşma: Yapay Zeka Ajanlarını Özelleştirme

JetPack 7.2 Yayınlandı: NemoClaw, Jetson Agent Yetenekleri, MIG ve Yocto Desteği

Agentic Tekniklerde Uzmanlaşma: Yapay Zeka Ajanlarını Özelleştirme

JetPack 7.2 Yayınlandı: NemoClaw, Jetson Agent Yetenekleri, MIG ve Yocto Desteği

Yapay Zeka Ekonomisinde Doğru Metrik: Token Başına Maliyet Neden Her Şeyden Önemli?

Agentic Tekniklerde Uzmanlaşma: Yapay Zeka Ajanlarını Özelleştirme

JetPack 7.2 Yayınlandı: NemoClaw, Jetson Agent Yetenekleri, MIG ve Yocto Desteği

Abone olmak ister misiniz?

Hemen ilgilendiğiniz alanları seçerek bültenimizden haberdar olabilirsiniz.

Hesaplarınızda paylaşmak ister misiniz?

İlgili Yazılar

Takip Çerezleri

Üçüncü Taraf Çerezleri

Gizlilik ve Kişisel Veri Politikası

Kullanım Sözleşmesi, Şartlar ve Koşullar