Gerçekçi konuşma oluşturmak için yapay zeka (AI) kullanan bir ses teknolojisi şirketi, son derece uygunsuz ifadeleri okuyan ünlülerin seslerini oluşturmak için ücretsiz aracını kullandıktan sonra ekstra korumalar getireceğini söylüyor.
ElevenLabs, bu ayın başlarında sözde bir ses klonlama paketi yayınladı.
Kullanıcıların, yapay bir ses oluşturmak için kullanılan, konuşan birinin kliplerini yüklemelerine olanak tanır.
Bu daha sonra, şirketin varsayılan olarak bir kerede 2.500 karaktere kadar metin okuyabilen çeşitli aksanlara sahip bir karakter listesi sunan metinden konuşmaya konuşma sentezi özelliğine uygulanabilir.
Daha fazla oku:
Ukrayna savaşı: Zelenskyy’nin Ukraynalılara ‘silahları bırakmalarını’ söylediği Deepfake videosu çürütüldü
Artık ‘Google’ yok mu? AI, web’de arama yapma şeklimizi nasıl değiştirebilir?
İnternetin genelinin teknolojiyi denemeye başlaması uzun sürmedi; buna, Harry Potter oyuncusu Emma Watson’ın Adolf Hitler’in Mein Kampf’ından bir pasaj okumasının da dahil olduğu, oluşturulan kliplerin yer aldığı kötü şöhretli anonim resim panosu sitesi 4chan da dahil.
Sky News tarafından bulunan diğer dosyalar arasında, Joe Biden’ın ABD birliklerinin Ukrayna’ya gideceğini duyurması ve Navy Seals’ta bir kariyerle övünen, ağzı bozuk bir David Attenborough gibi sesler yer alıyor.
Film yönetmeni James Cameron, Top Gun yıldızı Tom Cruise ve podcast sunucusu Joe Rogan hedef alındı ve ayrıca kurgusal karakterlerin klipleri de var, genellikle son derece saldırgan, ırkçı veya kadın düşmanı mesajlar okuyor.
‘Çılgın hafta sonu’
Geçen yıl eski Google mühendisi Piotr Dabkowski ve eski Palantir stratejisti Mati Staniszewski tarafından kurulan ElevenLabs, Twitter’da yaptığı açıklamada, teknolojisinin kötüye kullanılmasını nasıl önleyebileceği konusunda geri bildirim istedi.
“Çılgın hafta sonu – Beta platformumuzu denediğiniz için herkese teşekkür ederiz” dedi.
“Teknolojimizin ezici bir çoğunlukla olumlu kullanım için kullanıldığını görsek de, artan sayıda ses klonlama kötüye kullanım vakaları görüyoruz. Düşünce ve geri bildirim için Twitter topluluğuna ulaşmak istiyoruz!”
Şirket, “üretilmiş herhangi bir sesin izini sürerek” onu yapan kullanıcıya kadar takip edebilse de “ek güvenlik önlemleri” getirmek istediğini söyledi.
Ödeme ayrıntıları veya kimlik istemek gibi ek hesap kontrolleri yapılmasını önerdi; birinin yüklediği kliplerin telif hakkını doğrulamak; veya her ses klonlama isteğini manuel olarak doğrulamak için aracı tamamen bırakmak.
Ancak Salı sabahı itibariyle araç aynı durumda çevrimiçi kaldı.
Şirketin web sitesi, teknolojisinin bir gün makalelere, haber bültenlerine, kitaplara, eğitim materyallerine, video oyunlarına ve filmlere ses vermek için kullanılabileceğini öne sürüyor.
Sky News, daha fazla yorum için ElevenLabs ile iletişime geçti.
1:27 ‘Deepfake porno beni rahatsız etti’
AI tarafından oluşturulan medyanın tehlikeleri
Uygunsuz ses kliplerinin tufanı, yapay zeka araçlarını yeterli koruma olmaksızın kamusal alana salmanın tehlikelerini hatırlatıyor – önceki örnekler şunları içerir: kaldırılması gereken bir Microsoft sohbet robotu hemen saldırgan şeyler söylemesi öğretildikten sonra.
Bu ayın başlarında, teknoloji devindeki araştırmacılar, yalnızca üç saniyelik sese dayalı olarak bir kişinin sesini simüle edebilen VALL-E adlı bir metinden konuşmaya yapay zeka yaptıklarını duyurdular.
Aracı halka açıklamayacaklarını çünkü “potansiyel riskler taşıyabileceklerini” söylediler, insanlar “sesli kimlik sahtekarlığı veya belirli bir konuşmacının kimliğine bürünme” dahil.
Teknoloji, internette giderek yaygınlaşan derin sahte videolarla aynı zorlukların çoğunu sunuyor.
Geçen sene, Volodymyr Zelenskyy’nin derin sahte bir videosu Ukraynalılara “silahları bırakın” mesajı internette paylaşıldı.
Bir dizi gerçekçi Tom Cruise derin sahtekarlığının yaratıcısından sonra geldi. aktörün sihir numaraları yaptığını ve golf oynadığını gösterdiği iddia edilen daha hafif yürekli klipler olsa daizleyicileri teknolojinin potansiyeli konusunda uyardı.