Kekuatan Komputasi Google Menyempurnakan Alat Penerjemah
Posted by Unknown at Kamis, 30 Oktober 2014
Kekuatan Komputasi Google
Menyempurnakan Alat Penerjemah
Menggunakan kekuatan dahsyat komputasi menghaluskan hasil
terjemahan
Pada suatu pertemuan yang
dilaksanakan di Google pada tahun 2004, pokok bahasannya terarah pada sebuah
surel yang diterima perusahaan itu dari seorang penggemar di Korsel. Sergey
Brin yang merupakan salah satu dari dua pendiri Perusahaan Google,
menjalankan pesan itu melalui sebuah layanan terjemahan otomatis yang telah
dipatenkan perusahaan itu.
Pesan itu berbunyi Google adalah mesin pencari favorit, tapi hasil terjemahan
mengatakan: "Irisan ikan mentah memasang ladam kehendak. Hal bawang hijau
Google!"
Pak Brin mengatakan Google harus bisa melakukannya lebih baik. Enam tahun
kemudian, layanan gratis Penerjemahan Google menangani 52 bahasa, lebih dari
sistem lain yang serupa, dan orang-orang menggunakannya ratusan juta kali
seminggu untuk menerjemahkan halaman-halaman Web dan naskah lain.
"Apa yang anda lihat pada Penerjemahan Google merupakan karya seni"
dalam penerjemahan komputer yang tak dibatasi oleh wilayah subyek tertentu,
ujar Alon Lavie, seorang kolega profesor peneliti pada Institut Teknologi
Bahasa di Universitas Carnegie Mellon, seperti yang dikutip The New York
Times.
Usaha Google untuk berekspansi lebih dari sekedar mesin pencari telah
menghasilkan berbagai kesuksesan. Buku-buku digitalnya telah digantung di
pengadilan, dan pengenalan jejaring sosialnya, Buzz, meningkatkan ketakutan akan
privasi. Contoh itu memperlihatkan bahwa Google bisa salah melangkah ketika dia
mencoba untuk menantang tradisi bisnis dan konvensi kultural.
Namun kenaikan cepat Google ke tingkat eselon atas pada bisnis penerjemahan
merupakan suatu pengingat tentang apa yang akan terjadi jika Google melepaskan
kekuatan komputasinya yang dahsyat terhadap masalah-masalah rumit.
Jaringan pusat-pusat data yang dibangunya untuk pencarian Web sekarang bisa
saja menjadi komputer terbesar di dunia jika digabungkan. Google menggunakan
mesin itu untuk menekan batas-batas teknologi penerjemahan. Sebagai contoh,
kira-kira dua bulan lalu dia mengatakan bahwa dia sedang bekerja menggabungkan
alat penerjemahannya dengan analisis gambar yang dapat menerjemahkan tulisan
dalam gambar.
"Penerjemahan Mesin merupakan salah satu contoh terbaik yang menunjukkan
visi strategis Google," ujar Tim O'Reilly yang merupakan pendiri dan kepala technology
publisher O'Reilly Media. "Itu bukanlah sesuatu yang ditanggapi sangat
serius oleh siapa saja. Tapi Google mengerti sesuatu tentang data yang tak
diketahui orang lain, dan dia sudi membuat investasi yang perlu untuk mengatasi
masalah-masalah rumit ini lebih dulu dari pasar."
Menciptakan satu mesin penerjemah sudah lama dilihat sebagai salah satu
tantangan tersulit dalam bidang kecerdasan
buatan. Selama berpuluh-puluh tahun, para ilmuwan komputer mencoba
menggunakan sebuah pendekatan berdasarkan aturan-aturan yaitu mengajarkan
komputer aturan-aturan linguistik dua bahasa dan memberikannya kamus-kamus yang
diperlukan.
Tapi di pertengahan 1990an, para peneliti mulai memfavoritkan pendekatan
statistikal. Mereka menemukan bahwa jika mereka memberitahukan komputer ribuan
atau jutaan paragraf beserta hasil terjemahan manusianya, komputer itu bisa
belajar membuat terkaan akurat mengenai bagaimana menerjemahkan naskah-naskah
baru.
Ternyata teknik ini yang memerlukan data yang sangat besar dan kekuatan komputasi,
sangat cocok dengan situasi dan kondisi Google.
"Infrastruktur kami sangat sesuai dengan ini," kata Vic Gundotra yang
merupakan wakil presiden bagian teknik di Google. "Kami bisa melakukan
pendekatan-pendekatan yang bahkan tak bisa diimpikan pihak lain."
Sistem-sistem penerjemahan otomat masih jauh dari sempurna, bahkan Google tak
akan membuat para penerjemah manusia kehilangan pekerjaan dalam waktu dekat
ini. Para ahli mengatakan sangatlah sulit bagi sebuah komputer untuk memecahkan
satu kalimat ke dalam bagian-bagian kemudian menerjemahkan dan menyatukan
mereka kembali.
Tapi layanan Google cukup lumayan untuk menyampaikan inti dari sebuah artikel
berita, dan itu telah menjadi sumber instan penerjemahan bagi jutaan orang.
"Jika anda menginginkan sebuah terjemahan kasar siap saji, itu merupakan
tempat untuk dikunjungi. ujar Philip Resnik yang merupakan ahli penerjemahan
mesin dan seorang kolega profesor pada bagian linguistik di Universitas
Maryland, College Park.
Seperti para pesaingnya di lapangan, yang paling dikenal Microsoft dan I.B.M.,
Google telah memasukkan mesin penerjemahnya dengan transkrip pembukaan
Perserikatan Bangsa-Bangsa yang diterjemahkan oleh manusia ke dalam enam
bahasa, dan dari Parlemen Eropa yang diterjemahkan ke dalam 23 bahasa.
Materi-materi dasar ini digunakan untuk melatih sistemnya dengan bahasa-bahasa
paling umum.
Tapi Google telah menjelajah naskah Web, begitu juga data dari proyek
pemindaian buku dan sumber-sumber lain, untuk bergerak ke luar batas
bahasa-bahasa itu. Untuk bahasa yang lebih tak jelas, dia menghadirkan sebuah
"kotak peralatan" yang membantu para pengguna dalam penerjemahan dan
kemudian menambahkan naskah-naskah tersebut ke dalam basis datanya.
Penawaran Google bisa merugikan
penjualan perangkat lunak dari perusahaan seperti I.B.M. Tapi penerjemahan
otomat nampaknya tidak akan pernah menjadi penghasil uang banyak, setidaknya
bukan dari standar bisnis iklan Google. Tetap saja, kerja keras Google bisa menguntungkan
dalam berbagai hal.
"Teknologi ini bisa membuat barikade bahasa hilang," kata Franz Och
yang merupakan kepala ilmuwan di Google yang mengepalai tim penerjemahan mesin
perusahaan itu. "Itu bisa memperkenankan siapa saja untuk berkomunikasi
dengan yang lain."
Pak Och seorang peneliti Jerman yang sebelumya bekerja di Universitas
California Selatan, mengatakan dia pada mulanya enggan bergabung dengan Google,
takut perusahaan itu akan memperlakukan penerjemahan sebagai proyek sampingan.
Larry Page yang merupaka pendiri Google satunya, memanggil dan meyakinkan Pak Orc.
"Pada dasarnya dia berkata
bahwa ini merupakan sesuatu yang sangat penting bagi Google," kata Pak Och
barusan. Pak Och masuk pada tahun 2004 dan segera membawa janji dari Pak Page
ke dalam uji coba. Sementara banyak sistem penerjemahan serupa dengan punya
Google menggunakan hingga milyaran naskah kata-kata untuk membangun pemetaan
sebuah bahasa, Google menggunakan lebih banyak lagi: beberapa ratus milyar
kata-kata dalam bahasa Inggris. "Pemetaannya menjadi lebih baik dan terus
membaik jika lebih banyak naskah yang diproses," ujar PakOch.
Usaha keras akhirnya memberikan
keuntungan. Setahun kemudian, Google memenangkan sebuah kompetisi yang
diselenggarakan oleh pemerintah yang menguji berbagai sistem penerjemahan
rumit.
Google telah menggunakan pendekatan serupa yaitu kekuatan komputasi besar,
tumpukan data dan statistik, untuk mengatasi masalah-masalah rumit lainnya.
Sebagai contoh, pada tahun 2007, perusahaan itu mulai menawarkan 800-GOOG-411 yang
merupakan layanan direktori bantuan cuma-cuma yang menerjemahkan kata-kata yang
diucapkan. Layanan ini memperkenankan Google mengumpulkan berbagai suara dari
jutaan orang agar supaya lebih baik dalam hal mengenali bahasa Inggris yang
diucapkan. Setahun kemudian, Google meluncurkan sebuah sistem pencarian
berdasarkan suara yang sama baiknya dengan buatan bertahun-tahun perusahaan
lain.
Dan pada akhir tahun lalu, Google memperkenalkan sebuah layanan yang disebutGoggles yang
menganalisa foto-foto telepon genggam, mencocokkannya dengan basis data lebih
dari satu milyar gambar-gambar online, termasuk foto-foto berbagai jalan yang
diambil untuk layanan Street Viewnya.
Pak Och mengakui bahwa sistem penerjemahan Google masih membutuhkan
penyempurnaan, tapi dia mengatakan sistem itu cepat menjadi lebih baik.
"Kurva penyempurnaan kualitas masih tetap tinggi," tambahnya.
0 komentar: