“Anda harus bertanya kepada perusahaan, ‘bagaimana suara AI saya akan disimpan? Apakah Anda benar-benar menyimpan rekaman saya? Apakah Anda menyimpannya dienkripsi? Siapa yang memiliki akses ke sana?’” kata Balasubramaniyan. “Itu adalah bagian dari diriku. Itu adalah diri saya yang intim. Aku juga perlu melindunginya.”
Podcastle mengatakan mannequin suara dienkripsi ujung ke ujung dan perusahaan tidak menyimpan rekaman apa pun setelah membuat mannequin. Hanya pemegang akun yang merekam klip suara yang dapat mengaksesnya. Podcastle juga tidak mengizinkan audio lain diunggah atau dianalisis di Revoice. Faktanya, orang yang membuat salinan suaranya harus merekam baris teks yang telah ditulis sebelumnya langsung ke aplikasi Revoice. Mereka tidak bisa hanya mengunggah file yang direkam sebelumnya.
“Andalah yang memberikan izin dan membuat konten,” kata Yeritsyan dari Podcastle. “Apakah itu buatan atau asli, jika ini bukan suara yang dipalsukan, itu adalah suara orang ini dan dia mengeluarkannya. Saya tidak melihat masalah.”
Podcastle berharap bahwa kemampuan merender audio hanya dengan suara kloning orang yang menyetujui akan membuat orang enggan mengatakan sesuatu yang terlalu buruk. Saat ini, layanan tidak memiliki moderasi konten atau batasan pada kata atau frasa tertentu. Yeritsyan mengatakan terserah layanan atau outlet apa pun yang menerbitkan audio — seperti Spotify, Apple Podcasts, atau YouTube — untuk mengawasi konten yang didorong ke platform mereka.
“Ada tim moderasi yang sangat besar di platform sosial atau platform streaming mana pun,” kata Yeritsyan. “Jadi itu tugas mereka untuk tidak membiarkan orang lain menggunakan suara palsu dan membuat sesuatu yang bodoh atau sesuatu yang tidak etis dan menerbitkannya di sana.”
Bahkan jika masalah yang sangat pelik dari voice deepfake dan klon AI nonkonsensual ditangani, masih belum jelas apakah orang akan menerima klon terkomputerisasi sebagai pengganti manusia yang dapat diterima.
Pada akhir Maret, komedian Drew Carey menggunakan alat ElevenLabs untuk merilis seluruh episode acara radio yang dibacakan oleh tiruan suaranya. Sebagian besar, orang membencinya. Podcasting adalah media yang intim, dan hubungan manusia yang berbeda yang Anda rasakan saat mendengarkan orang bercakap-cakap atau bercerita mudah hilang saat robotic melangkah ke mikrofon.
Tetapi apa yang terjadi ketika teknologi berkembang sedemikian rupa sehingga Anda tidak dapat membedakannya? Apakah penting bahwa itu bukan podcaster favorit Anda di telinga Anda? Pidato AI yang dikloning memiliki cara untuk pergi sebelum tidak dapat dibedakan dari ucapan manusia, tetapi pasti akan menyusul dengan cepat. Setahun yang lalu, gambar yang dibuat oleh AI tampak seperti kartun, dan sekarang gambar tersebut cukup realistis untuk membodohi jutaan orang dengan berpikir bahwa Paus memiliki pakaian luar baru yang keren. Sangat mudah membayangkan audio yang dihasilkan AI akan memiliki lintasan yang serupa.
Ada juga sifat lain yang sangat manusiawi yang mendorong minat pada alat bertenaga AI ini: kemalasan. Teknologi suara AI — dengan asumsi itu sampai pada titik di mana ia dapat meniru suara asli secara akurat — akan memudahkan untuk melakukan pengeditan cepat atau mengulang tanpa harus membawa tuan rumah kembali ke studio.
“Pada akhirnya, ekonomi kreator akan menang,” kata Balasubramaniyan. “Tidak peduli seberapa banyak kita berpikir tentang implikasi etis, itu akan menang karena Anda baru saja membuat hidup orang menjadi sederhana.”
Pembaruan, 12 April pukul 15:30 EDT: Tak lama setelah cerita ini diterbitkan, kami diberi akses ke alat AI suara ElevenLabs, yang kami gunakan untuk membuat klip suara ketiga. Cerita telah diperbarui untuk memasukkan hasil.
Subsequent : [randomize]