Okuma 5.9 dkKategoriler: AI, Çeviri, Rick Champagne, Uncategorized

Online görüşmeler sırasında, herkes sesini anlaşılır bir şekilde duyurmak istiyor. Ev ofislerinde daha fazla insanla yapılan video görüşmeler veya canlı yayınlarda, arka plan seslerinden arınmış olan zengin ses kullanıcılara daha iyi bir çevrimiçi deneyim sunacaktır.

NVIDIA Maxine, geliştiricilerin görüşme kalitesini ve kullanıcı deneyimini iyileştiren ölçeklenebilir, düşük gecikmeli ses ve video efektleri oluşturmasına yardımcı olmak için GPU hızlandırmalı, yapay zeka özellikli yazılım geliştirme kitleri sunuyor.

NVIDIA, GTC‘de Maxine’in daha iyi ses kalitesi için, akustik eko önleme ve yapay zeka tabanlı örnekleme eklediğini duyurdu. Akustik eko önleme, ses akışındaki yankıyı gerçek zamanlı olarak ortadan kaldırarak, konuşma esnasında çift anlamların kullanıldığı durumlarda bile kalitesini koruyor. Maxine, AI tabanlı teknolojisiyle, geleneksel dijital sinyal işleme algoritmalarıyla elde edilenden daha etkili bir eko önlemesi sağlıyor.

Süper Ses Çözünürlüğü, yapay zeka tabanlı teknikler kullanarak daha yüksek frekans bantlarında kaybolan enerjiyi geri yükleyerek düşük bant genişliğine sahip bir ses sinyalinin kalitesini iyileştiriyor. Maxine Süper Ses Çözünürlüğü, sesin 8 kHz’den (dar bant) 16 kHz’e (geniş bant), 16 kHz’den 48 kHz’e (ultra geniş bant) ve 8 kHz’den 48 kHz’e yükseltilmesini destekliyor.

Modern film ve televizyon stüdyoları, ses kaydı için genellikle 48 kHz (veya daha yüksek) örnekleme hızı kullanıyor. Ultra geniş bantlı örnekleme hızı kullanılmasının sebebi, orijinal sinyalin aslına uygunluğunu ve netliğini korumak.

Süper Ses Çözünürlüğü, manyetik bantlardan veya diğer düşük bant genişliğine sahip ortamlardan elde edilen eski ses kayıtlarının aslına uygun bir şekilde geri yüklenmesine yardımcı olabiliyor.

Ses Boşluğunu Kapatma

Çoğu modern haberleşme, geniş bant veya ultra geniş bant ses kullanılarak gerçekleştiriliyor. NVIDIA Süper Ses Çözünürlüğü, dar bant sesini gerçek zamanlı olarak örnekleyebilmesi ve geri yükleyebilmesi sayesinde, teknolojiyi eski bakır telli telefon hatları ile modern VoIP tabanlı geniş bant haberleşme sistemleri arasındaki boşluğu kapatmak için kullanılabiliyor.

Maxine, piyasaya ilk sürülmesinden bu yana, video konferans görüşmeleri, içerik oluşturma ve canlı yayın için dünyanın önde gelen birçok sağlayıcısı tarafından kullanılmaya başlanmıştır.

Fortune Business Insights’a göre, 2021’de yaklaşık 6,3 milyar dolar olan dünya çapındaki video konferans pazarının, 2028’de yaklaşık 13 milyar dolara yükselmesi bekleniyor.

WFH: Bir Yaşam Tarzı

Evden çalışmaya geçiş(WFH), şirketler arasında kabul edilen bir norm haline geldi ve kuruluşlar yeni beklentilere uyum sağlıyor.

Analist firma Gartner, pandemi öncesine göre yüzde 60’lık bir düşüşle, 2024’te işletmeler için toplantıların yalnızca dörtte birinin yüz yüze olacağını öngörüyor.

ABD’deki sanal işbirliği, pandemi sonrasındaki iki yılda hibrit ve uzaktan çalışmada önemli bir rol oynadı.

Ancak kuruluşlar şirket kültürünü ve işyeri deneyimini sürdürmeye çalıştıkça, yüksek kaliteli medya etkileşimi için riskler artıyor.

Kokteyl Partisi Problemini Çözme

Bazen ev ve iş hayatı çatışması yaşanabiliyor. Görüşmelere genellikle arka plandaki çocuk, inşaat veya araç sirenlerinden gelen arka plan sesleri dahil oluyor ve bu sebeplerden ötürü görüşmelerinin akışında kesintiler olabiliyor.

Maxine, kokteyl partisi sorunu olarak bilinen bu çok eski bir ses sorununu çözmeye yardımcı oluyor. Yapay zeka ile istenmeyen arka plan seslerini filtreleyerek kullanıcıların ister ev ofislerinde ister yolda daha iyi duyulmasını sağlıyor.

Maxine, GPU kullanılarak hızlandırılmış platform, özelleştirilebilir son teknoloji modellerle entegre olan ve standart bir mikrofon ve kamera ile yüksek kaliteli özellikler sağlayan uçtan uca bir derin öğrenme hattı sağlıyor.

Sesiniz En İyi Şekilde Duyulsun

Arka plan gürültüsünden etkilenmenin yanı sıra, görüşmelerde ses kalitesi bazen kulağa zayıf gelebiliyor ve hatta düşük-orta seviye frekanslar kaçırılabiliyor.

Maxine, seslerin daha dolgun, derin ve duyulabilir olması için sesin gerçek zamanlı olarak örneklenmesini(unsampling) sağlıyor.

Logitech: Kulaklıklar Blue Yeti Mikrofonlar için Daha İyi Ses

Yapay zeka kütüphanelerinden yararlanan Logitech, ek bir yazılıma ihtiyaç duymadan cihazlarında iletişimi geliştirmek için Maxine’i doğrudan G Hub ses sürücülerinin içine entegre etti. Bu durum, video konferanslarda veya canlı yayınlarda dikkat dağıtabilecek fanların yanı sıra klavye ve fare tıklama seslerin de ortadan kaldırılmasını sağlıyor.

Logitech G’nin Genel Müdürü Ujesh Desa, “NVIDIA Maxine, Logitech G kullanan oyuncuların mikrofon sinyallerini temizlemesini ve istenmeyen arka plan seslerini tek tıkla ortadan kaldırmasını hızlı ve kolay hale getiriyor.” diyor.

Tencent Cloud, İçerik Oluşturucuları Destekliyor

Tencent Cloud, yaratıcı arka planlar eklemeyi hızlı ve kolay hale getiren NVIDIA Maxine teknoloji ile geliştirdikleri yazılımları sunarak içerik oluşturuculara kolaylık sağlıyor.

NVIDIA Maxine’in AI Green Screen teknolojisi, kullanıcıların geleneksel bir yeşil arka plana ihtiyaç duymadan yüksek kaliteli ön plan ve arka plan ayrımı ile daha kapsayıcı bir yapı oluşturmasına olanak sağlıyor. Gerçek arka plan ayrıldıktan sonra, kolayca sanal bir arka planla değiştirilebiliyor veya alan derinliği efekti oluşturmak için bulanıklaştırılabiliyor. Tencent Cloud, bu yeni özelliği içerik oluşturucularına bir yazılım paketi olarak sunuyor.

Sanal Deneyimler Daha İyi Hale Geliyor

NVIDIA Maxine, uçtan uca derin öğrenme hatlarına yerleştirilebilen son teknoloji gerçek zamanlı yapay zeka ses, video ve artırılmış gerçeklik özellikleri sağlıyor.
Maxine’in yapay zeka destekli SDK’ları, geliştiricilerin ses ve görüntü gürültüsü engelleme, süper çözünürlük, bakış düzeltme, 3B gövde poz tahmini ve çeviri özellikleri içeren uygulamalar oluşturmasına yardımcı oluyor.

Maxine ayrıca birçok dilde gerçek zamanlı sesten metne çeviri sağlıyor. NVIDIA, GTC’de Maxine’in İngilizce, Fransızca, Almanca ve İspanyolca dilleri arasında çeviri yaptığını gösterdi.

Bu efektler, milyonlarca insanın herhangi bir cihazda yüksek kaliteli ve ilgi çekici canlı yayınlar gerçekleştirmesini sağlıyor.

Tencent Cloud ses ve video platformunda ürün merkez direktörü olan Vulture Li, “NVIDIA Maxine’in AI Green Screen teknolojisi, özel ekipman ve aydınlatmaya ihtiyaç duymadan daha sürükleyici yüksek kaliteli deneyimler sağlayarak içerik oluşturuculara çalışmalarında yardımcı oluyor” dedi.

For privacy reasons YouTube needs your permission to be loaded.
I Accept

Yazının kaynağına buradan ulaşabilirsiniz.

OPENZEKA HABERLERİ

Abone olmak ister misiniz?

Hemen ilgilendiğiniz alanları seçerek bültenimizden haberdar olabilirsiniz.

OPENZEKA HABERLERİ

Abone olmak ister misiniz?

Hemen ilgilendiğiniz alanları seçerek bültenimizden haberdar olabilirsiniz.

Hesaplarınızda paylaşmak ister misiniz?

İlgili Yazılar