Yapay Zeka ile Ses Taklidi

Yapay zeka (YZ) uygulamaları hayatımıza giderek daha hızlı şekilde giriyor. Deepfake uygulamaları bunlardan birisi. Deepfake uygulamalarının sonuncusu ise Amerikalı rap sanatçısı Gucci Mane’nin taklit sesinin kullanıldığı sesli kitap projesi.

 

“Project Gucciberg” olarak tanıtılan proje ile MSCFH firması tarafından Gucci Mane’nin sesiyle klasikleri sesli kitap haline getirmek için geliştirilmiş bir deepfake yapay zeka uygulaması.

 

Deep learning (derinlemesine öğrenme) ve fake (sahte) sözcüklerinin birleşmesiyle türetilen deepfake uygulamaları gerçeğine son derece benzer sonuçlar yaratıyor. TikTok’da patlayan Tom Cruise videoları bu fenomenin sadece bir örneği.

 

The Verge’e  konuşan MSCHF başkanı Dan Greenberg, Project Gucciberg’in nasıl başladığını anlattı.

 

Greenberg, MSCHF’nin Gucci Mane’nin yaklaşık altı saatlik sesini topladığını söylüyor. Kaynaklar arasında Podcast’ler, röportajlar ve YouTube videoları var. Ekip daha sonra metin okuma yazılımı yardımıyla kliplerin transkripsiyonlarını oluşturdu. Sesinin kendine has özelliklerini daha iyi yakalamak için bir Gucci Mane telaffuz anahtarı yarattılar.

 

Greenberg, “Gucci’nin telaffuzu çok özel bir ritmi takip ediyor – örneğin, ortalama TTS (metinden sese) uygulamasının yapacağından çok daha fazla sayıda sesli harf kullanıyor,” diyor. “Sözlük, modelimizin daha sonra yapı taşları olarak kullandığı kelimeleri ses birimlerine ayırıyor.”

 

“Basit bir örnek için, modelimizin hangi heceleri dışarıda bırakacağımızı veya sözcükler arasında ulama yapacağını bilmesine ihtiyacımız var. Örneğin, “Yalın ayak” yerine “Yalnayak” demesi gerekir.”

 

Bu tür uygulamaların giderek artacağı sosyal medyada hızla popüler hale gelmelerinden anlaşılıyor. Ne var ki burada son derece ciddi sorunlar ve tehlikeler ortaya çıkıyor. Örneğin kötü niyetli kullanımlarla kişileri hiç yapmadıkları şeyleri yapmış gibi göstermek mümkün. Gerçek sonunda ortaya çıksa bile kurbanla ilgili algıyı değiştirmek imkansız hale gelebilir.

İlginizi Çekebilecek Yazılar  Bir Video Oyuna Dönüştürülen ComplexLand Festivali

 

Kötü niyetli uygulamalar dışında da yasal sorunlar olacağı şimdiden görülüyor. Örneğin bu projede ne kitapları ne de Gucci’nin ses taklidini kullanmak için izin alınmış. Kitapları sesli hale getirmek için izin alınması gerektiği ortada ancak taklit ses kullanmanın yasalar bakımından ne durumda olduğu henüz açık değil.

 

Bu durumda bir telif hakkı ihlali mi doğar yoksa bir çeşit kimlik hırsızlığı mı ortaya çıkar akla gelen ilk soru oluyor. Bu soruya her ikisi birden cevabını da vermek mümkün. Anlaşılan o ki teknolojik gelişmeler hukuk dünyasını zorlamaya devam edecek.

 

Daha fazla bilgi için tıklayınız.

 

Fotoğraf: Christopher Burns