Jakarta – Microsoft Research Asia memperkenalkan tool AI (Artificial Intelligence) yang mampu membuat deepfake secara instan dan diberi nama Visual Affective Skills Animator (VASA)-1.
Aplikasi ini menggunakan gambar diam atau lukisan seseorang dan memadukannya dengan file audio, sehingga menghasilkan wajah seseorang yang dapat berbicara seperti aslinya.
Tool AI ini juga dapat melakukan berbagai macam hal seperti menirukan gerakan kepala seseorang, ekspresi wajah dan gerakan bibir, sehingga nampak seperti orang sungguhan yang sedang berbicara atau bernyanyi.
Laman resmi Microsoft menyuguhkan banyak contoh video yang dihasilkan dari tool ini, termasuk orang-orang yang bernyanyi dan berbicara selaras dengan trek audio yang telah direkam sebelumnya.
Para peneliti melatih VASA-1 dengan dataset VoxCeleb2 yang dibuat pada 2018 oleh tiga peneliti dari Universitas Oxford. Situs VoxCeleb2 menyebutkan dataset ini berisi 1 juta lebih ucapan dari 6.112 selebritas yang diekstrak dari video unggahan di YouTube.
Perusahaan tersebut mengklaim metode animasi ucapannya saat ini secara signifikan mampu mengungguli metode sebelumnya di berbagai hal, seperti keaslian, ekspresi dan efisiensi berkat pengujian yang ekstensif.
Microsoft menyebutkan tool AI tidak hanya menghasilkan kualitas video tinggi dengan dinamika kepala dan wajah yang realistis, tetapi juga mendukung pembuatan video beresolusi 512 x 512 secara online hingga 40 fps.
Tool AI bermanfaat untuk meningkatkan kesetaraan pendidikan, meningkatkan aksesibilitas bagi individu yang memiliki tantangan komunikasi serta menawarkan pendampingan atau dukungan terapi bagi mereka yang membutuhkan.
Microsoft tidak berencana untuk merilis demo online, API, produk, detail implementasi tambahan, atau penawaran terkait tool ini, hingga mereka yakin bahwa teknologinya ini akan digunakan secara bertanggung jawab dan sesuai dengan regulasi yang berlaku.
Pasalnya, teknologi ini rentan untuk disalahgunakan, oleh sebab itu mereka menentang segala bentuk perilaku dengan menggunakan konten yang bertujuan untuk menipu seseorang.
“Kami menentang perilaku apa pun untuk membuat konten yang menipu atau membahayakan orang sungguhan, dan tertarik untuk menerapkan teknik kami untuk mengembangkan deteksi pemalsuan,” kata Microsoft di laman resminya.
Microsoft menyatakan video yang dihasilkan masih mengandung artefak yang dapat diidentifikasi. Analisis numerik menunjukkan ada kesenjangan untuk mencapai keaslian video yang sebenarnya.
Deepfake merupakan bentuk pemanfaatan AI untuk membuat foto, audio, atau video yang produknya memanipulasi kemiripan individu asli. Salah satu contohnya seperti aplikasi MyHeritage yang mampu membuat gambar diam menjadi bergerak seolah hidup
Teknologi ini termasuk dalam kategori AI yang menggunakan algoritma deep learning. Salah satu metode umum dalam pembuatan deepfake adalah melibatkan penggunaan jaringan deep neural yang menggunakan auto encoder untuk teknik pertukaran wajah.
Auto encoder merupakan program AI deep learning yang mempelajari dari klip video untuk memahami karakteristik individu dari berbagai perspektif dan kondisi lingkungan.
AI lain seperti Generative Adversarial Networks (GAN) juga ditambahkan, agar deepfake makin terlihat nyata. GAN akan mendeteksi dan memperbaiki kekurangan apa saja di deepfake, sehingga membuat detektor deepfake kesulitan mengungkap keasliannya. (adm)
Sumber: kompas.com