Machine Translation dan Computer-Assisted Translation

Kali ini saya tertarik untuk mengupas sebuah artikel berjudul  “Machine Translation and Computer-Assisted Translation: A new way of translating?” Artikel ini ditulis oleh Olivia Craciunescu, Constanza Gerding-Salas, Susan Stringer-O’Keeffe yang dimuat pada bulan Juli 2004 di Translation Jurnal dengan alamat: http://accurapid.com/journal/29bias.htm dan di-update 4 September 2008.

Kehadiran Mesin Penerjemahan dan Penerjemahan Berbantuan Komputer (selanjutnya disingkat menjadi “MT dan CAT”) sudah lama diinginkan oleh orang-orang yang sering melakukan komunikasi antar bahasa. Artikel diawali dengan menguraikan pentingnya teknologi ini dalam dunia modern, sejarah mesin dan komputer pembantu penerjemahan, beberapa teknologi yang dapat digunakan dalam penerjemahan, seperti kamus elektronik, glosari, database istilah, concordance, online bilingual teks, dan memori penerjemahan. Terakhir penulis artikel memberi gambaran dampak pengaruh teknologi penerjemahan ini bagi penerjemah profesional.

Ada beberapa hal, kenapa artikel ini penting untuk kita analisis. Pertama, munculnya gejala MT dan CAT ini tidak hanya terjadi di Amerika dan Eropa semata seperti yang diulas dalam artikel tersebut, tetapi juga di Indonesia pun hal ini telah dikembangkan baik secara pribadi, lembaga swasta, bahkan lembaga resmi seperti Lembaga Ilmu Pengetahuan Indonesia (LIPI). LIPI telah merilis software CAT yang dikembangkannya untuk menerjemahkan teks dari bahasa Inggris ke bahasa Indonesia dan sebaliknya, software ini juga diedarkan secara online, dan masih banyak software dan MT yang telah beredar di masyarakat seperti transtool, alfalink, indodictionary, systran. Dari fenomena ini muncul pertanyaan umum dari para penerjemah profesional “akankah MT dan CAT menjadi ancaman karir profesional mereka?’ Bagi kita, akademisi penerjemahan, hal ini juga menjadi topik menarik terkait dengan pengembangan ilmu pengetahuan dan teknologi. Dalam Artikel memang disebutkan para penerjemah profesional tidak secara tegas mengakui kekhawatiran mereka mengenai pekerjaan (loss of work) tetapi mereka lebih mengkhawatirkan kualitas terjemahan dari MT dan CAT.

Memang, MT dan CAT mampu menjawab kebutuhan masyarakat, yaitu mampu menghasilkan terjemahan dalam waktu cepat, satu detik per halaman bahkan lebih, yang tidak bisa dilakukan manusia. Berarti pasar penerjemahan akan diambil alih oleh operator yang menggunakan mesin penerjemah ini? Ternyata tidak, dalam artikel diberikan perbandingan pasar penerjemahan oleh mesin dan penerjemahan oleh manusia, yaitu: 6 juta berbanding 450 juta lembar per tahun di awal tahun 1990 di daerah Eropa, Amerika dan Jepang. Berarti 1 lmbr oleh mesin dan 75 lembar oleh manusia. Kenapa pasar terjemahan manusia lebih banyak bukankah ia lebih lambat? Penyebabnya adalah kualitas terjemahan MT dan CAT tidak terjamin. Terjemahan manusia memang lambat tetapi kualitasnya lebih terjamin meskipun belum sempurna. Tetapi, hal ini telah menunjukkan bahwa pangsa pasar penerjemahan manusia tidak akan direbut oleh mesin dan komputer. Hal ini terkait proses penerjemahan yang dilakukan oleh manusia dan mesin.

Kedua, seperti telah disebut di atas kualitas terjemahan MT dan CAT masih belum bisa menyamai hasil terjemahan manusia. Terkait dengan perbandingan proses penerjemahan mesin dan manusia (cognitive processes). Ada beberapa keunggulan penerjemahan manusia yang kemungkinan besar sulit dibuat tiruannya pada komputer. Dalam artikel keunggulan tercermin dalam proses penerjemahan oleh manusia yang begitu kompleks, yaitu mulai dari tataran semantik, sintaktik dan pragmatik. Dalam proses penerjemahan manusia menerapkan 5 tipe pengetahuan, yaitu: pengetahuan Bsu, Bsa, kesepadanan antara Bsu dan Bsa, subjek (field), dan pengetahuan aspek sosio-kultural. Hal ini sesuai proses penerjemahan digambarkan oleh Bell (1991:45-67). Berdasarkan hal ini sulit kemampuan komputer atau mesin untuk menyamai manusia.

Sayangnya artikel ini belum membahasa aspek idiologi yang juga mempengaruhi penerjemah, baik itu idiologi penerjemah maupun idiologi negara yang mengatur perilaku/pandangan penerjemah. Kita menyadari dalam proses pengambilan keputusan penerjemah juga mempertimbangkan pembaca teks terjemahannya, baik itu kelamin, latar budaya (geografis/agama/dll), pendidikan, bahkan kebijakan negara. Sehingga muncul idiologi foreinisasi atau domestikasi. Sementara mesin dan komputer tidak pernah mempertimbangkan hal ini. Mesin akan mengalihkan kata-kata, teks, seperti apa adanya tanpa mempertimbangan pembaca akan memahami atau tidak, sesuai dengan idiologi politik negara Tsa tersebut atau tidak. Misalnya ketika menerjemahkan teks terkait ‘the annexation of East Timor into Indonesia” dari hasil terjemahan komputer yang muncul adalah “itu pengambilan; pencaplokan dari Timur Timor ke dalam Indonesia” (hasil IndoDic). Terjemahan ini sangat membingungkan kalaupun diperbaiki menjadi “pengambilan/pencaplokan Timor Timur ke dalam Indonesia” terjemahan ini akan berlawanan dengan sikap politik Indonesia.

Berikutnya, artikel ini penting terkait pandangan masyarakat secara umum terhadap pekerjaan penerjemahan yang masih dianggap sebagai kegiatan yang sederhana, yaitu mengalihkan kata-kata dari satu bahasa ke bahasa lain. Hal ini juga terlihat pada awal masa pengembangan teknologi mesin penerjemahan yang juga menggunakan pendekatan literal translation. Tentu pendekatan ini akan menghasilkan kata-kata yang tidak sesuai konteks. Banyak konsumen penerjemahan yang kebingungan setelah membaca teks hasil terjemahan mesin/komputer yang penuh dengan tanda kurung yang masih menyisakan pilihan kata untuk ditentukan, tata bahasa yang tidak tepat, bahkan deretan kata-kata tanpa makna yang dapat menyesatkan pembaca.

Dalam artikel juga diulas strategi penerjemahan oleh mesin, yaitu: direct strategy, transfer strategy, dan pivot language strategi. Hal ini cukup memberi gambaran proses yang dilakukan mesin masih terfokus pada penerjemahan leksikal. Jika bandingkan dengan pendapat Harold L Somers dalam Baker (2001:144) bahw awal perkembangan MT dan CAT memang pendekatan pengalihan masih pada tataran leksikal dengan sistem pengalihan langsung (direct system). Sehingga tak jarang hasil terjemahannya tidak berterima karena banyak kata-kata yang tidak sesuai konteks, bahkan menyesatkan pembaca. Sementara penerjemahan bukanlah semata-mata pengalihan kata, tetapi pengungkapan pesan yang ada dibalik ungkapan kata-kata tersebut dengan mempertimbangkan gaya bahasa dari Tsu (Kridalaksana dalam Nababan. 2003:19-20; Bell, 1991:12-13; Savory, 1969:13). Hal ini juga dinyatakan Mounin dalam Newmark (1988:3) “… translation cannot simply reproduce, or be, the original” berarti proses penerjemahan tidak dapat dianggap semata-mata menyampaikan ulang dan mempertahankan bentuk asli semata dari teks sumber, namun banyak aspek yang harus dipertimbangkan penerjemah untuk mencapai kesepadanan. Hal inilah yang mendorong pendekatan penerjemahan mesin bergeser ke pendekatan teks dan korpus sehingga hasil terjemahannya menjadi sedikit lebih baik.

Berikutnya, terkait analisis perbandingan hasil terjemahan manusia dan mesin yang diangkat dalam artikel mengungkap beberapa kesalahan. Kesalahan yang muncul, yaitu: terjemahan secara leksikal benar namun tidak sesuai konteks, susunan kata-kata yang tidak memiliki makna (kemungkinan akibat terjemahan literal), secara leksikal benar namun tidak mengikuti gramatika Tsa, dll. Perbandingan ini masih sangat minim dan belum memiliki pola perbandingan yang sistematis. Bila kita menggunakan sistem Analisis Kontrastif, perbedaan ini akan semakin kompleks dan sistematis yang berguna bagi pengembangan software ini maupun bagi masyarakat. Penelitian yang lebih mendalam akan menimbulkan kesadaran dan penghargaan pada profesi penerjemahan. Sebab dewasa ini cukup banyak ‘penerjemah kaki lima’ yang menggunakan software MT dan CAT dalam menjual jasa pelayanan penerjemahan kilat. Mereka dapat menerjemah berlembar-lembar dalam tempo singkat dan harga yang murah, tetapi kualitasnya tidak terjamin, tentu hal ini sangat merugikan masyarakat dan merugikan citra penerjemah.

Selanjutnya, terkait dengan akademisi penerjemahan baik yang terlibat dalam pengembangan software ini maupun yang menganalisisnya secara umum, hal ini merupakan objek kajian yang sangat menarik. Banyak penelitian dan analisis yang telah dilakukan mengungkap kesalahan pada terjemahan mesin (misalnya Ismarita R, 2005:42-46; Kunardi Harjoprawiro, 2005:47-50, Peter Toma, 1976:247-260). Jika kita amati hasil penelitian tersebut, dapat kita peroleh simpulan bahwa penerjemahan mesin masih terfokus pada faktor intertekstual, seperti leksikal dan gramatikal. Sementara faktor ekstratektual (misalnya budaya dari pembaca Tsa) belum masuk dalam pertimbangan proses penerjemahan mesin/komputer. Hal inilah yang menjadi sumber kesalahan dalam mesin penerjemahan.

Jika kita runut balik memang mesin penerjemahan lahir dari pandangan yang menganggap semua bahasa mengikuti suatu aturan dan aturan itu bisa diprogram dengan tepat ke dalam komputer (Toma, 1976:247). Pandangan ini memang terfokus pada masalah linguistik semata. Pandangan ini mungkin lahir dari pandangan Chomsky yang mengajukan struktur dalam (deep structure) yang berlaku universal dan struktur permukaan dari bahasa. Namun, berdasarkan pandangan Haliday dengan Systemic Functional Grammar-nya dan juga hasil dari perbandingan Analisis Kontrastif, tidak selalu struktur dalam itu sama terlihat theme dan rheme dari satu kalimat bisa berubah dari satu bahasa ke dalam bahasa lainnya. Kata kerja bisa menjadi kata benda namun pesan tersebut tetap dapat tersampaikan. Uniknya, menurut Harold L. Somers dalam Baker (2001:148) menyatakan bahwa bahwa dalam perkembangan mesin penerjemahan ini mereka (para pengembang) justru tidak menggunakan teori linguistik, mereka malah menggunakan prinsip matematis, probabilitas dan statistik.

Berikutnya, terkait dengan penerjemahan itu ilmu, seni, atau keterampilan (Nababan, 2003; Hoed, 2006;) juga dapat kita kaji dari artikel ini. Dalam artikel ini disebutkan bahwa mesin penerjemahan hanya mampu menerjemahkan teks ilmu pengetahuan. Mesin penerjemahan tidak dapat menerjemahkan teks seni seperti puisi. Berdasarkan sejarah diketahui memang mesin penerjemahan ini banyak digunakan oleh dinas kemiliteran dan spionase AS dan USSR dan NASA karena mereka perlu memahami teks yang dalam jumlah besar dalam waktu singkat yang merupakan hasil penyadapan (spionase). Namun dewasa ini penerjemahan lebih banyak dilakukan untuk pengembangan ilmu pengetahuan dan teknologi. Sayangnya, peneliti hanya mengungkap persentase hasil penerjemahan pada bidang tersebut dari hasil penerjemahan manusia. Kemudian penulis memaparkan beberapa teknologi mesin penerjemahan yang dapat membantu penerjemahan, seperti database istilah dan glosary. Sebenarnya dibutuhkan penelitian lebih lanjut mengenai kekuatan dan kelemahan penerjemahan mesin pada teks IPTEK. Mengingat bidang IPTEK memiliki banyak istilah baku yang sudah masuk database mesin penerjemahan apakah MT dan CAT mampu menghasilkan terjemahan yang baik? Pertanyaan tentu perlu dijawab melalui penelitian.

Berdasarkan diskusi di atas dan pengalaman sendiri, ada beberapa simpulan yang diperoleh. Mesin penerjemahan baru berhasil melakukan pengalihan pada tataran kata, walaupun pada pengembangan terakhir telah menggunakan pendekatan korpus dan melibatkan analisis leksikal, semantik dan konteks. Namun, analisis ini masih berada dalam lingkungan linguistik. Sementara penerjemahan tidak cukup hanya dengan analsis linguistik tapi juga faktor ekstralinguistik seperti latar belakang budaya calon pembaca, seni, tingkat kesopanan dan formalitas. Sehingga, dalam penerjemahan yang melibatkan ungkapan budaya seperti idiom, metafora, atau gaya bahasa kiasan terjemahannya seringkali mencapai maksud yang diinginkan, pada kondisi terburuk bisa menyesatkan. Lebih lanjut, hasil terjemahan mesin penerjemahan malah lebih sulit untuk diperbaiki oleh penerjemah profesional. Hal ini disebabkan teks tersebut telah kehilangan sense dari teks asli sehingga dari pengalaman sendiri dan penerjemah secara umum lebih baik menerjemahkan teks asli daripada memperbaiki hasil terjemahan mesin. Bagi penerjemah profesional, teknologi mesin terjemahan cukup efektif hanya sebagai kamus elektronik yang mampu memberi terjemahan kata ke Bsa dalam waktu singkat sehingga proses pencarian kata bisa lebih efisien dibandingkan menggunakan kamus biasa.

4 Comments

  1. Betul, Uda Havid…. Google translate ajah masih kayak gitu….

    Quote: “Sebenarnya dibutuhkan penelitian lebih lanjut mengenai kekuatan dan kelemahan penerjemahan mesin pada teks IPTEK. Mengingat bidang IPTEK memiliki banyak istilah baku yang sudah masuk database mesin penerjemahan apakah MT dan CAT mampu menghasilkan terjemahan yang baik? Pertanyaan tentu perlu dijawab melalui penelitian.”

    Ide bagus…segera bikin proposal hibah… ajukan ke DIKTI

  2. Iya emang susah sih, perlu study lebih lanjut. Tapi paling nggak di Indonesia ada yang seperti software ‘Power Word’ nya China, berguna bgt deh, meski nggak nerjemahin satu paragraf, tp perkata bs byk makna, tinggal qt ketik kata yg qt mau trus dia cari sdiri d literatur kamus2nya, mau umum, ilmiah, teknologi, dll, smua ada, trus klo mau tau spelling nya tinggal klik pronounce nya, so qt bs langsung tau arti plus cara baca nya pengucapannya kaya apa, asyik bgt deh, hbs tu tinggal qt rangkai sdiri kalimatnya. Trus asyiknya lagi tiap qt buka software nya, tiap qt arahin krusor, langsung deh arti plus pronounce nya otomatis bs d akses, ga perlu ketik2 lg. Pengen deh ada yg kaya gitu d Indonesia. Aq pasti beli softwarenya. Info2 ya klo dah ada. Sukses trus teknologi Indonesia, Ganbatte Kudasai.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s