Facebook ve Instagram’ın çatı şirketi Meta, yeni üretken yapay zeka modelini duyurdu.
Voicebox, özel olarak eğitilmediği halde ses düzenleme, örnekleme ve tarz oluşturma üzere konuşma oluşturma misyonlarını yerine getirme hüneriyle içerik oluşturuculara yardımcı olmak için tasarlandı.
Bu, sırf iki saniyelik konuşmadan gerçekçi bir ses oluşturmak için kullanılabilir, örneğin, potansiyel olarak konuşamayan insanlara ses getirmek yahut insanların seslerini oyunlara eklemek için kullanılabilir.
Meta, birebir lisanı konuşmasalar bile insanların birbirleriyle otantik bir halde konuşmalarına müsaade vererek, bir konuşma pasajını bir lisandan başkasına tarzı koruyacak halde çevirmek için de kullanılabileceğini söyledi.
Şirket, duyurusunda Voicebox’ın rakiplerinden çok daha tesirli olduğunu tez etti.
Örneğin, rakip Vall-E’nin yüzde 5,9’una kıyasla yüzde 1,9 kusur oranıyla sözcükler üretebiliyor ve bunu 20 kata kadar daha süratli yapıyor.
Meta, Voicebox’ın İngilizce, Fransızca, İspanyolca, Almanca, Lehçe ve Portekizce lisanlarında halka açık sesli kitaplardan gelen 50 bin saatlik konuşma ve transkriptlerle eğitildiğini söyledi.
Ancak Meta, modeli piyasaya sürmeyecek kadar büyük riskler olduğunu söyledi.
Hangi istikametlerden risk barındırabileceği açık formda lisana getirilmese de “Diğer güçlü yeni yapay zeka yeniliklerinde olduğu üzere, bu teknolojinin berbata kullanım ve istenmeyen ziyan potansiyeli getirdiğinin farkındayız” denildi.
Çok sayıda rapor, bu sistemlerin haberlerde düzmece görüntüler oluşturmak, dolandırıcılık davetlerinde insanların seslerini taklit etmek üzere risklerine atıfta bulunuyor.