Tim SRIN Ajarkan Galaxy AI Bahasa Indonesia

Jakarta – Tim Samsung R&D (Research and Development) Institute Indonesia (SRIN) mengajarkan Artificial Intelligence/AI (kecerdasan buatan) untuk berbicara dalam Bahasa Indonesia. AI dimulai dari dua hal yakni data yang berkualitas dan relevan.

“Setiap bahasa menuntut cara yang berbeda untuk memproses data. Jadi, kami menggali lebih dalam untuk memahami kebutuhan linguistik dan keunikan dari Bahasa Indonesia,” kata Head of AI di SRIN, Junaidillah Fadlil.

“Pengembangan bahasa lokal harus didasarkan pada pemahaman dan ilmu pengetahuan, sehingga penambahan bahasa ke Galaxy AI dimulai dengan merencanakan informasi yang dibutuhkan oleh tim kami secara legal dan etis.”

Fitur-fitur Galaxy AI seperti Live Translate menjalankan tiga proses inti, yakni pengenalan ucapan otomatis (automatic speech recognition/ASR), mesin terjemahan (neural machine translation/NMT), dan teks-ke-suara (text-to-speech/TTS).

Automatic Speech Recognition membutuhkan rekaman suara yang mencakup beragam situasi di berbagai kondisi, dan setiap rekaman dilengkapi transkripsi teks yang akurat.

Tingkat kebisingan rekaman suara yang bervariasi membantu mengakomodasi kondisi lingkungan yang berbeda.

“Tidak cukup hanya menambahkan suara lalu lintas jalan raya ke rekaman. Selain data yang kami peroleh secara legal dari pihak ketiga, kami harus pergi ke kafe atau lingkungan kerja untuk merekam suara kami sendiri. Hal ini memungkinkan kami untuk bisa menangkap suara-suara autentik yang unik dari kehidupan sehari-hari, seperti orang yang sedang memanggil atau ketikan keyboard,” ujar Pemimpin Tim ASR, Muchlisin Adi Saputra/

Tim ASR terus memperbarui bahasa slang terbaru dan cara penggunaannya. Mereka menggali dari berbagai sumber termasuk media sosial (medsos)

Neural Machine Training juga membutuhkan data untuk melatih terjemahan Bahasa Indonesia dirasa tim SRIN penuh dengan tantangan. Penggunaan makna kontekstual dan implisit yang luas bergantung pada petunjuk sosial dan situasional.

Data yang digunakan harus berisi banyak teks terjemahan sebagai referensi bagi AI untuk memahami kata-kata baru, kata-kata asing, kata benda, dan angka.

“Semua informasi dibutuhkan untuk membantu AI memahami konteks dan aturan komunikasi,” ujar Pemimpin Tim NMT, Muhammad Faisal.

Text To Speech (TTS) memerlukan rekaman yang melibatkan berbagai macam suara dan nada, dengan konteks tambahan tentang bagaimana setiap kata terdengar dalam situasi yang berbeda.

Pemimpin pengembangan fitur TTS, Harits Abdurrohman mengungkap rekaman suara yang baik mempercepat pekerjaan yang dilakukan karena mencakup satuan bunyi terkecil yang diperlukan AI untuk membedakan makna.

“Setelah mendapat rekaman suara yang baik pada fase awal, kami dapat fokus pada tahap selanjutnya yaitu penyempurnaan model AI agar dapat mengucapkan setiap kata dengan jelas,” ujarnya.

SRIN bekerja sama dengan para ahli linguistik di Indonesia untuk merencanakan pengembangan banyak data.

Tim ini berkolaborasi dengan sejumlah pusat penelitian Samsung di seluruh dunia agar cepat mengadopsi praktik terbaik dan mengatasi tantangan kompleks dalam menetapkan target data.

“Tantangan ini membutuhkan kombinasi kreativitas, ketangkasan, dan keahlian dalam Bahasa Indonesia dan machine learning. Filosofi Samsung yang terus membuka ruang kolaborasi memainkan peran penting dalam menyelesaikan pekerjaan ini, bersama dengan skala pekerjaan dan sejarah pengembangan AI yang kami miliki,” ucap Junaidillah Fadlil.

Hasil perjuangan ini bisa dinikmati oleh seluruh pengguna HP Samsung yang bisa menjalankan Galaxy AI. Perilisan ini menghadirkan makna yang baru tim SRIN.

“Kami sangat bangga dengan pencapaian kami di sini karena hal ini adalah proyek AI pertama kami. Tentunya, ini bukan yang terakhir karena kami akan terus menyempurnakan dan meningkatkan kualitas model AI kami. Perluasan ini tidak hanya mencerminkan nilai-nilai kami, tetapi juga menghormati serta mengintegrasikan identitas budaya Indonesia melalui bahasa,” tuturnya. (adm)

Sumber: detik.com

Leave a Reply

Your email address will not be published. Required fields are marked *