BAB I PENDAHULUAN. mendengarkan. Entah kapan bayi mulai dapat mendengar suara, yang pasti ibu atau bapaknya,

BAB I PENDAHULUAN Saat manusia lahir, kegiatan berbahasa yang pertama kali bersinggungan dengannya adalah ‘mendengarkan’. Entah kapan bayi mulai dapat mendengar suara, yang pasti ibu atau bapaknya, dokter atau bidan yang membantu kelahirannya, atau pun orang-orang yang merasa dekat dengan ibu si bayi tersebut lazimnya akan segera memperdengarkan kata-kata bernada bahagia. Bahkan jika bapak si bayi tersebut beragama Islam, sang bapak akan memperdengarkan suara adzan di telinga kanan dan iqomah di telinga kiri bayi. Baru setelah bayi agak besar, dia mulai mengenal keterampilan bahasa lainnya seperti ‘berbicara’, ‘membaca’, dan kemudian ‘menulis’. Proses perkembangan bahasa secara umum sebagaimana digambarkan di atas menunjukkan bahwa ‘mendengarkan’ adalah kegiatan berbahasa yang pertama kali dikenal manusia. Saat seseorang belajar bahasa asing, hal demikian juga akan berulang. Kemampuan ‘mendengarkan’ akan menjadi aset penting bagi proses pembelajaran bahasa berikutnya. Dalam proses belajar yang digambarkan oleh Vandergrift (2007: 191 – 210) keterampilan menyimak atau mendengarkan menjadi pemicu (trigger) kemampuan-kemampuan bahasa lainnya. Hal ini karena menyimak merupakan building knowledge of field yang merupakan pembuka dari aktivitas yang bersinggungan dengan bahasa (periksa juga Oxford, 1993: 205-211). Seperti halnya Vandergrift (2007:191-210) dan Oxford (1993: 205-211), Ballard dan Clanchy (1996:1) mengatakan bahwa para mahasiswa berbahasa pengantar non-bahasa Inggris yang sedang belajar di negara berbahasa pengantar bahasa Inggris akan berhasil baik dalam studi mereka apabila mereka memiliki kemampuan menyimak secara memadai. Diyakini oleh Ballard dan Clanchy (1996:12) bahwa kemampuan demikian menjadi kunci penting bagi proses pemahaman perkuliahan yang menggunakan bahasa Inggris di samping keterampilan lain seperti

membaca, menulis, dan berbicara (lihat juga Conoway, 1982: 15). Gambaran-gambaran di atas menunjukkan bahwa

‘mendengarkan’ adalah kegiatan

berbahasa yang memiliki peran penting dalam komunikasi antar manusia dalam berbagai jenjang kehidupan, baik ‘mendengarkan’ dalam bahasa ibu ataupun ‘mendengarkan’ dalam studi bahasa asing. Kenyataan ini diperkuat pula dengan temuan Rivers (1981; dalam Duzer, 1991:2) yang melaporkan bahwa dalam kehidupan sehari-hari kegiatan ‘mendengarkan’ terjadi hampir dua kali lipat dari pada ‘berbicara’ dan empat sampai lima kali lipat dari kegiatan ‘membaca’ dan ‘menulis’.

Seperti halnya Rivers (1981; dalam Duzer, 1991), Feyten (1991:3) menuturkan

bahwa dalam kehidupan sehari-hari orang secara efektif melakukan kegiatan ‘mendengarkan’ 45%, ‘berbicara’ 30%, ‘membaca’ 16%, dan ‘menulis’ 9%. Namun ironisnya, ‘mendengarkan’ merupakan skill yang paling sedikit mendapat perhatian dari para peneliti bahasa (lihat Call, 1985; Brown, 1990; Morley, 1991; Othman dan Vanathas, 2004). Ihwal rendahnya minat penelitian pada keterampilan ‘mendengarkan’ atau ‘menyimak’ bahasa asing tidak lepas dari pandangan terdahulu yang menganggap menyimak adalah kegiatan pasif. Dalam pandangan ini menyimak dianggap sebagai proses asimilasi suara secara pasif dari pesan yang disampaikan lawan bicara kepada pihak yang menyimak sehingga orang lebih banyak abai terhadap kesulitan mendengarkan. Sesungguhnya, sebagaimana dikatakan oleh Morley (1991: 142) menyimak adalah proses asimilasi yang memerlukan mental processing secara aktif, terutama dalam situasi menyimak secara interaktif. Menyimak bahkan dapat dianggap sebagai a highly problem-solving activity (Byrnes, 1984:320) yang tidak cukup didukung pengetahuan bahasa seseorang tetapi juga memerlukan kemampuan orang tersebut untuk mengidentifikasi bunyi, mensinkronkannya dengan leksikon yang dimilikinya dalam memori, serta memaknai pesan yang diterimanya. Sementara untuk menangkap pesan, seseorang

harus mampu memahami situasi dan terkadang harus memiliki latar belakang pengetahuan tentang topik pembicaraan disamping pengetahuan bahasa yang memadai (Bejar, et al., 2000::3). Dalam kaitannya dengan proses pemahaman menyimak ini, para peneliti bahasa menyimpulkan adanya faktor-faktor tertentu yang berpengaruh pada proses pemahaman. Rivers (1968:14) misalnya, menengarai faktor pengetahuan bahasa sebagai faktor yang berpengaruh dominan dalam proses pemahaman; sementara Campbell dan Wales (1970:137) berpandangan bahwa faktor penentu dalam proses pemahaman menyimak bukanlah ‘pengetahuan bahasa’ semata, tetapi juga ‘kecakapan menggunakan bahasa’ yang dimiliki diri penyimak karena bahasa adalah sarana komunikasi (Campbell dan Wales, 1970:137). Mereka meyakini adanya acuan semantik dan sintaksis, proses top-down dan bottom up yang berlangsung secara simultan pada saat proses menyimak berlangsung (lihat juga Bacon, 1992: 160-178; O’Malley, Chamot & Kupper, 1989: 418-437). Namun, penelitian-penelitian demikian masih terbatas sekali jumlahnya sehingga tidak mudah untuk mengetahui bagaimana sebenarnya proses menyimak berlangsung; apa saja yang berpengaruh dalam proses tersebut. Langkanya referensi dalam kajian menyimak teks bahasa asing ini amat menyulitkan pembelajar bahasa asing merefleksi diri tentang aspek apa yang tidak mereka miliki sehingga kemampuan menyimak mereka tidak dapat berfungsi optimal. Seringkali terjadi, seseorang pembelajar bahasa Inggris yang telah mengikuti kursus persiapan untuk mengikuti tes kemampuan bahasa Inggris bertanya “mengapa saat mengerjakan soal listening terkadang saya dapat mengerti apa yang dibicarakan pembaca soal dengan baik, tetapi terkadang hanya mengerti samar-samar, bahkan terkadang

tidak mengerti sama sekali apa yang disampaikan

narator. Mengapa terjadi ketidakajegan dalam pemahaman ujaran yang diperdengarkan dalam tes bahasa Inggris?”

Belum ditemukannya faktor-faktor yang paling menentukan dalam proses menyimak dan belum memadainya penelitian-penelitian tentang kesulitan dalam tes bahasa Inggris sebagai bahasa asing menjadikan pertanyaan-pertanyaan mendasar di atas sulit untuk dijawab. Dengan demikian, penelitian-penelitian menyimak dengan berbagai latar kesulitan amat perlu untuk dilakukan. Setidaknya terdapat dua hal pokok yang dapat dikedepankan untuk alasan ini. Pertama, para peneliti bahasa masih memerlukan masukan-masukan baru dari hasil penelitian yang lebih luas dan beragam untuk sampai pada kesimpulan mengenai faktor-faktor yang paling dominan dalam proses pemahaman menyimak bahasa asing. Kedua, para peneliti bahasa dituntut mampu mengungkap ketidakajegan kemampuan individu dalam memahami ujaran bahasa asing, terutama dalam tes berstandard internasional seperti TOEFL yang dampaknya begitu luas bagi seluruh siswa, mahasiswa, atau individu berbahasa pengantar non-bahasa Inggris yang harus mengikuti tes tersebut untuk kepentingan-studi lanjut di negara-negara berbahasa pengantar bahasa Inggris atau kepentingan lain yang salah satu prasyaratnya adalah skor TOEFL. Rancangan

penelitian

yang

diajukan

untuk

maksud

penulisan

disertasi

ini

dilatarbelakangi oleh fakta rendahnya kemampuan para mahasiswa Indonesia dalam menyimak ujaran bahasa Inggris dalam tes-tes bahasa Inggris berstandard internasional, di antaranya TOEFL. Sebagaimana dilaporkan oleh Lougheed (1995:24), kemampuan menyimak peserta tes berlatar belakang bahasa Indonesia sebagaimana tergambar dalam laporan penelitiannya secara umum masih sangat rendah. Para peserta tes TOEFL berlatar belakang bahasa Indonesia menunjukkan kemampuan dalam kisaran 40an dari kemungkinan tertinggi 68. Untuk mengatasi persoalan ini, kajian mengenai kesulitan memahami ujaran bahasa Inggris sebagaimana lazimnya diujikan dalam tes bahasa Inggris berstandard internasional perlu diteliti dengan seksama sehingga ketidakajegan dalam pemahaman ujaran bahasa Inggris dapat

dijelaskan dengan logis.

1.1 Latar Belakang Permasalahan Rendahnya capaian kemampuan menyimak para peserta tes bahasa Inggris sebagaimana terlihat dari hasil tes TOEFL atau AcEPT di PPB UGM; dan tidak optimalnya nilai IELTS, khususnya bagian listening comprehension para peserta kursus persiapan IELTS di PPB UGM seperti yang terefleksi dari hasil tes IELTS, khususnya bagian listening comprehension menunjukkan adanya kesulitan serius yang dihadapi para peserta tes. Kesulitan ini berdampak pada capaian hasil secara keseluruhan yang berujung pada tidak tercapainya target yang telah ditetapkan sendiri oleh para peserta tes. Dalam skala yang lebih luas, kesulitan mengerjakan tes menyimak bahasa Inggris juga terlihat dalam capaian TOEFL mereka. Dari rangkuman data yang disampaikan Lougheed (1995:14), para peserta tes berlatar belakang bahasa Indonesia hanya mampu meraih skor listening dalam kisaran 40an. Ini berarti kemampuan rata-rata mendengarkan ujaran bahasa Inggris para peserta tes dari Indonesia tergolong rendah. Memang benar, peserta berlatar belakang bahasa Indonesia, tidak sendirian dalam hal capaian rendah Listening comprehension. Para peserta tes berlatar belakang bahasa tertentu lainnya juga mengalami hal yang sama. Para peserta tes dengan latar belakang bahasa Thailand, Korea, Indonesia, Jepang, Ibo, Arab, Bengali, dan Yoruba hanya mampu meraih skor antara 4045; sementara para peserta dari negara-negara ESL atau English as a Second Language seperti India, Filipina, dan Jerman mampu meraih skor mendekati 55 dari kemungkinan tertinggi 68 (Lougheed, 1995). Peserta dari negara-negara Malaysia, Perancis, Persia, Spanyol di mana bahasa Inggris juga digunakan cukup meluas di negara-negara tersebut berada di tengah-tengah dua kelompok peserta dari negara-negara di atas. Dengan cakupan converted score antara 40-45

dari konversi raw score 14-20 berarti akurasi menyimak para peserta dari negara-negara di mana bahasa Inggris hanya sebagai bahasa EFL adalah 28% - 40%. Dengan akurasi di bawah 40%, amatlah sulit bagi para individu ini untuk dapat mengikuti perkuliahan di negara-negara berbahasa Inggris dengan baik. Mereka harus mengikuti serangkaian persiapan agar kemampuan menyimak meningkat menjadi minimal 75% apabila mereka akan belajar di negara berbahasa pengantar bahasa Inggris. Persyaratan minimal 75% ini atau dalam konversi skor minimal 55 adalah persyaratan yang ditetapkan hampir seluruh perguruan tinggi di negara-negara berbahasa pengantar bahasa Inggris. Language Groups

Listening Comprehension 45

50

55

60

Arabic Bengali Chinese Farsi French German Greek Hindi Ibo Indonesian Japanese Korean Malay Spanish Tagalog Thai Urdu Vietnamese Yoruba Gambar 1.1 Perbandingan skor TOEFL yang dicapai para peserta tes dengan latar belakang bahasa yang berbeda-beda (Lougheed, 1995).

Upaya peningkatan kemampuan menyimak ujaran bahasa Inggris tidak selalu mudah untuk dilakukan. Banyak peserta kursus bahasa Inggris untuk maksud persiapan menghadapi tes bahasa Inggris berstandar internasional di Indonesia yang telah belajar selama berbulan-bulan

masih juga mengalami kesulitan serius untuk mengatasi persoalan Listening Comprehension. Fenomena ini aneh karena menyimak adalah keterampilan bahasa yang paling awal dikenal manusia. Menyimak juga merupakan kegiatan yang paling banyak dilakukan manusia, terutama menyimak dalam bahasa ibu, sehingga seharusnya menyimak merupakan keterampilan yang mudah untuk dipelajari. Underwood (1989:21) bahkan secara eksplisit mengatakan bahwa di negara-negara yang tergolong dalam ‘masyarakat lisan’, di mana orang-orangnya lebih suka bercerita daripada membaca, kemampuan listening para individunya akan lebih tinggi dibanding mereka yang berasal dari ‘masyarakat baca’. Namun dalam kenyataannya, bagi pembelajar bahasa Inggris di Indonesia menyimak masih tetap saja merupakan keterampilan yang sulit untuk dikuasai (acquired). Kenyataan di atas menunjukkan bahwa orang-orang yang berbahasa pengantar ‘bukan bahasa Inggris’ (non-English speaking background), dan hanya menggunakan bahasa Inggris secara terbatas sebagai bahasa asing (English as a foreign language) mengalami lebih banyak kesulitan dalam memahami ujaran bahasa Inggris dibanding orang-orang yang berlatar belakang bahasa Inggris sebagai bahasa kedua (English as a second language). Gambaran ini seolah menyiratkan bahwa pemajanan bahasa Inggris dalam kehidupan sehari-hari dan kemampuan bercakap-cakap dalam bahasa tersebut berkorelasi dengan kemampuan mendengarkan ujaran bahasa Inggris. Kebenaran proposisi ini perlu dikaji lebih teliti. Mengingat listening merupakan kegiatan internal yang tak dapat diamati oleh indra penglihatan dan listening merupakan proses mental yang berhubungan dengan kerja otak, maka di samping mengkaji kemungkinan adanya korelasi antara kemampuan berbicara dan menyimak, penelitian mengenai proses menyimak bahasa asing juga harus diarahkan untuk mempelajari proses mental yang terjadi secara internal dalam diri manusia. Dengan demikian pertanyaan

faktor-faktor internal apa saja yang berpengaruh dalam proses menyimak menjadi relevan untuk dicari jawabnya. Dalam kaitannya dengan faktor-faktor internal ini, Goh (2000: 185-206) telah meneliti kesulitan-kesulitan yang dialami para subjek yang ditelitinya dalam proses mental informasi yang diterimanya melalui indra pendengar. Hasil penelitian Goh menunjukkan bahwa proses menyimak berlangsung melalui beberapa tahap sekaligus, yakni perception, parsing, dan utilization. Pada tahap-tahap ini peran kemampuan inferensial amat vital karena ia menghubungkan pengetahuan bahasa seseorang dengan memori jangka pendek dan memori jangka panjang sekaligus selama proses mental berlangsung. Tanpa kemampuan kognitif seperti ini proses pemahaman tak mungkin dapat berlangsung (idle). Dalam penelitian Goh (2000: 205) terungkap bahwa kesulitan menyimak terjadi pada ketiga tahap tersebut, yakni tahap persepsi, tahap olah input, dan tahap sinkronisasi pengetahuan latar. Ketiga tahap yang disebut Goh (2000:205) di atas berlaku untuk proses mendengarkan dalam bahasa ibu maupun bahasa asing. Perbedaannya adalah bahwa ketika mendengarkan ujaran dalam bahasa ibu, seseorang cenderung mudah mengantisipasi kesulitan persepsi karena ia adalah pengguna aktif sistem bunyi ujaran bahasa ibu; ia telah memiliki elemen-elemen bahasa yang dibutuhkan dan terbiasa menggunakannya dalam proses menyimak sehingga baginya proses mental yang meliputi tahap persepsi, olah input, dan sinkronisasi pengetahuan latar pun menjadi mudah untuk dilakukan penutur asli (Dardjowidjojo, 2012: 29). Hal ini berbeda dengan proses mental yang terjadi pada non penutur asli yang memiliki keterbatasan dalam pengetahuan sistem bunyi ujaran dari bahasa asing yang didengarkannya itu. Pada saat mendengarkan ujaran bahasa asing, seorang non penutur asli yang tidak menguasasi bahasa yang dipelajarinya itu akan merasakan betapa sulitnya mempersepsi bunyi bahasa asing. Salah satu

contohnya adalah kasus kegagalan persepsi yang dialami para mahasiswa tingkat dasar yang belajar bahasa Indonesia di Universitas Hawaii pada saat mereka diminta mendengarkan sebuah rekaman percakapan dalam bahasa Indonesia (Dardjowidjojo, 2012: 29). Dalam percakapan yang mereka dengarkan itu terdapat kalimat yang berbunyi . Ternyata beberapa mahasiswa yang tingkat kemampuannya masih belum memadai itu mempersepsinya sebagai bunyi (Dardjowidjojo, 2012: 30). Mispersepsi terhadap bunyi ujaran di atas memunculkan pertanyaan mendasar: apakah ketidakmampuan para mahasiswa Universitas Hawaii memahami ujaran yang didengarkannya itu disebabkan oleh

adanya keterbatasan kosakata semata atau karena ketidakmampuan

mengenali kata–kata yang didengarkannya itu? Pertanyaan yang sama juga muncul ketika beberapa subjek penelitian untuk disertasi ini tidak mampu mempersepsi kalimat <She must not have found a job yet>. Seorang subjek penelitian mempersepsinya sebagai bunyi <She must another found a job yet>. Benarkah kegagalan subyek penelitian memahami bunyi ujaran di atas disebabkan oleh adanya keterbatasan kosakata semata atau lebih pada ketidakmampuan mereka mengenali kata-kata yang mereka dengarkan? Untuk lebih memastikan apakah kegagalan menyimak ini disebabkan oleh keterbatasan kosakata semata pada diri subjek atau karena ketidakmampuan subjek mengidentifikasi bunyibunyi ujaran yang ia dengarkan, perlu ada kajian mendalam tentang hipotesis ini. Dengan mempertimbangkan kemungkinan pentingnya kemampuan mengidentifikasi bunyi-bunyi ujaran dalam proses mendengarkan bahasa asing, maka persoalan linguistik yang secara langsung berkaitan dengan identifikasi bunyi-bunyi ujaran baik dalam tataran segmental maupun suprasegmental harus

dipertimbangkan dalam penelitian listening atau mendengarkan,

khususnya mendengarkan ujaran bahasa Inggris bagi orang Indonesia. Pentingnya

mengkaji

bunyi ujaran dengan

menyoroti aspek segmental dan

suprasegmental adalah karena adanya perbedaan karakter bahasa sumber, dalam hal ini bahasa Indonesia dan bahasa sasaran, yakni bahasa Inggris. Bahasa Indonesia merupakan bahasa fonetik (phonetic language); sementara bahasa Inggris merupakan bahasa non-fonetik (Wormack, 1957; Essberger, 2001); Dalam bahasa fonetik, tulisan dan bacaan memiliki korelasi langsung. Artinya apa yang terlihat dalam bahasa tulis akan diucapkan sama seperti bagaimana kata itu ditulis. Sebaliknya dalam bahasa non fonetik, apa yang terlihat dalam bahasa tulis tidak selalu berkorelasi dengan cara pengucapannya (Wormack, 1957). Ketika seorang yang berlatar belakang bahasa fonetik mempelajari bahasa berlatar belakang non fonetik, maka ia harus menyesuaikan diri dengan pola-pola pengucapan yang berlaku dalam bahasa yang dipelajarinya itu. Artinya, di samping mempelajari unsur-unsur segmental, ia juga harus mempelajari aspek-aspek suprasegmentalnya. Tanpa mempelajari kedua aspek ini niscaya akan ada kesulitan dalam memahami ujaran bahasa yang dipelajarinya itu. Perbedaan karakter dua bahasa ini berpotensi memicu terjadinya kesulitan dalam mempersepsi bunyi ujaran bahasa Inggris. Secara teoritis kebiasaan menggunakan bahasa fonetis akan berpengaruh pada saat seseorang dihadapkan pada situasi menyimak bahasa non fonetis. Ketika orang Indonesia dewasa yang telah mahir baca tulis bahasa Indonesia mendengarkan ujaran bahasa Inggris ia akan mudah terpajankan pada bahasa Inggris tulis. Alasan yang dapat dikemukakan dalam peristiwa ini adalah bahwa ketika mendengarkan ujaran, orang Indonesia terbiasa menghubungkannya dengan fisik huruf-huruf yang berkorelasi dengan ujaran yang didengarnya (fonetik) sementara ujaran bahasa Inggris lebih mewakili bunyi-bunyinya (fonemik). Sebagai akibatnya orang Indonesia yang mendengarkan ujaran bahasa Inggris lebih

mudah terpajankan pada bahasa tulis. Ia seakan merasa terbantu mengantisipasi bunyi dalam kaitannya dengan ejaan. Tetapi dengan terpajankan pada bahasa tulis, sebenarnya ia akan mudah terdistraksi dengan ansitipasi ejaannya karena ucapan dalam bahasa Inggris tidak sama dengan tulisannya. Berikut adalah beberapa hal yang diperkirakan akan menjadi pemicu terjadinya kesulitan dalam proses mendengarkan bunyi ujaran bahasa Inggris yang dialami oleh orang Indonesia. (1) Ujaran bahasa Inggris selalu diwarnai dengan adanya tekanan silaba yang lokasi tekanannya dapat berubah-ubah tergantung kata-kata di sekitar kata yang mendapat tekanan. Sifat tekanan demikian tidak sama dengan tekanan dalam bahasa Indonesia yang terjadi secara beraturan pada suku tertentu dari kata yang diucapkan. (2) Sekalipun dalam bahasa Indonesia juga dikenal adanya perubahan bunyi vokal sebagai akibat dari adanya pengaruh dari bunyi-bunyi sekitar, perubahan bunyi vokal dalam bahasa Inggris yang dipicu oleh adanya dinamika tekanan silaba atau kata, seperti keras lemah bunyi, tonisitas dan tonalitas dapat menjadi persoalan bagi orang Indonesia dalam hal persepsi bunyi ujaran. (3) Terbiasanya penutur bahasa Indonesia dengan kompresi ucapan pada bunyi-bunyi kata tertentu tidaklah berarti para pembelajar bahasa Inggris berlatar belakang bahasa Indonesia ini akan dengan mudah mampu mengidentifikasi vokal dan konsonan bahasa Inggris yang mengalami kompresi pengucapan, terutama dalam connected speech. Hal ini karena efekefek bunyi yang terdengar sering membentuk bunyi lain yang terdengar mirip atau bahkan sama dengan kata-kata yang secara semantik sebenarnya tidak berhubungan dengan kata yang dimaksud. Dalam proses mendengarkan bahasa ibu, persistiwa seperti ini akan mudah diatasi karena subjek memiliki aspek-aspek kebahasaan yang memadai untuk mempersepsi

bunyi dengan benar.

1.2 Rumusan Permasalahan Dengan mempertimbangkan hal-hal pokok yang telah disampaikan sebelumnya, penelitian ini dirancang untuk menjawab persoalan-persoalan sebagai berikut: 1. Mengapa terjadi kesulitan dalam proses memahami ujaran bahasa Inggris sebagai bahasa asing di Indonesia? 2. Secara fonologis apakah benar bahwa pola tekanan bahasa Inggris dan perubahan bunyi-bunyi vokal dan konsonan sebagai akibat dari terangkainya bunyi ujaran yang mengikuti pola tonisitas, tonalitas, dan ritme bahasa Inggris berpengaruh dalam proses pemahaman ujaran bahasa Inggris sebagai bahasa asing di Indonesia?

1.3 Tujuan Penelitian Penelitian ini secara komprehensif dimaksud untuk: 1. Menjelaskan terjadinya kesulitan dalam proses memahami ujaran bahasa Inggris sebagai bahasa asing di Indonesia. 2. Membuktikan bahwa secara fonologis pola tekanan bahasa Inggris, perubahan bunyibunyi vokal dan konsonan sebagai akibat dari terangkainya bunyi ujaran yang mengikuti pola tonisitas, tonalitas, dan ritme bahasa Inggris berpengaruh dalam proses pemahaman ujaran bahasa Inggris sebagai bahasa asing di Indonesia.

1.4 Kegunaan

Secara teoritis hasil penelitian ini akan memberikan gambaran rinci mengenai faktorfaktor yang berperan dalam proses pemahaman sekaligus memberikan gambaran mengenai faktor penentu kemampuan mendengarkan ujaran bahasa Inggris di Indonesia. Diharapkan, penelitian ini dapat melengkapi khasanah penelitian listening yang masih terbatas jumlahnya. Secara praktis, dalam spektrum yang lebih luas, penelitian ini akan memberikan manfaat penting bagi para individu yang tengah mempelajari keterampilan menyimak, para dosen matakuliah menyimak, para penulis buku-buku keterampilan menyimak, dan lembaga-lembaga atau pusat pelatihan bahasa. Bagi para individu yang tengah belajar keterampilan menyimak, hasil penelitian ini akan memberikan gambaran secara dini tentang apa saja yang harus diperhatikan saat mereka belajar menyimak sehingga mereka dapat dengan lebih mudah mengerti situasinya ketika kesulitan muncul dan mampu mengantisipasi keadaan ini. Bagi para dosen matakuliah menyimak, tentu hasil penelitian ini akan lebih memudahkan mereka mengarahkan para mahasiswanya untuk menguasai elemen-elemen penting dalam proses menyimak; mencermati faktor-faktor yang menjadi kesulitan mahasiswa saat mereka menyimak dan memberikan treatment yang tepat kepada individu mahasiswa yang mengalami kesulitan dalam menyimak. Bagi para penulis buku ‘keterampilan menyimak’, hasil penelitian ini akan memberikan wawasan baru yang akan lebih menyegarkan isi buku yang ditulisnya sehingga lebih ‘menggairahkan’ pembaca mengikuti gagasan-gagasan yang disampaikan lewat buku yang ditulisnya. Dan bagi lembaga-lembaga atau pusat pelatihan bahasa, hasil temuan ini akan memberikan pemahaman baru atau pemantapan tentang apa yang harus dipersiapkan mereka untuk membantu meningkatkan kemampuan menyimak para mahasiswanya.

1.5 Lingkup Disertasi

Kemampuan memahami ujaran bahasa Inggris dipengaruhi oleh banyak faktor di antaranya, pengetahuan bahasa, pengetahuan situasi, dan pengetahuan latar belakang (Bejar, 2000) kemampuan mempersepsi bunyi ujaran (Goh, 2000; Bond, 2006, Ingram 2007, Vandergrift, 2007; Sebastian-Gales, 2006), exposure terhadap bahasa yang dipelajari (Brown, 1990), short term memory (Jacquemot dan Scott, 2006; Ohata, 2006), kecerdasan jamak (Gardner, 1983), kemampuan meta-kognitif (Pierce, 2003), kemampuan kognitif (Teasdale dan Barnard, 1993), kemampuan afektif (Bialystok, 1985; Gardner, 1999), dan lain-lain. Sekalipun penelitian yang telah dilakukan di berbagai negara di dunia telah cukup beragam untuk mengatasi kesulitan menyimak bahasa asing, persoalan listening masih tetap merupakan persoalan yang tidak mudah untuk diatasi dan memerlukan kajian-kajian yang lebih mendalam pada tataran mikro. Kajian tentang listening pada tataran demikian masih amat terbatas jumlahnya dan belum memberikan kontribusi yang signifikan. Penelitian ini dimaksud untuk mengkaji kesulitan-kesulitan memahami ujaran bahasa Inggris dilihat dari sudut pandang mikro, yakni dengan meneliti kemampuan para subjek penelitian mendeteksi elemen-elemen mikro bertekanan lemah (klitik) dan elemen-elemen bertekanan kuat (tonik) pada frasa intonasi yang diujikan. Pertimbangan utama mengapa tataran mikro menjadi perhatian utama penelitian ini adalah karena karakter bahasa Inggris lebih berorientasi pada ritme ucapan, pola tekanan, tonisitas, dan tonalitas. Diyakini, pada tataran inilah persoalan itu muncul. Oleh karena itu kesulitan meahami ujaran bahasa Inggris harus dilihat dari kemampuan mendeteksi elemenelemen onset, middle tonic, dan main tonic (tonik) dan proclitic, interval tonic, dan enclitic (klitik).

1.6 Tinjauan Pustaka Penelitian tentang persepsi bunyi ujaran masih belum begitu popular di dunia linguistik dan masih amat terbatas jumlahnya. Salah satu penelitian penting yang patut disebut adalah penelitian Bond (2006). Penelitian yang diberi tajuk Slips of the Ear: Errors in the perception of Casual Conversation ini dilakukan secara longitudinal dengan metode observasi terhadap penutur asli bahasa Inggris yang berasal dari berbagai kalangan, seperti pelajar, mahasiswa, rekan kerja, sahabat. Dari observasi selama lebih dari satu tahun ini didapatkan 1000 data mispersepsi berisi kata, frasa, dan kalimat (Bond, 2006: 290). Berdasarkan penelitian Bond (2006) ini, persepsi bunyi ujaran tidak selamanya berjalan mulus. Listener acapkali keliru mempersepsi informasi yang disampaikan lawan bicaranya. Baru setelah ia mendengar lebih jauh informasi demi informasi lainnya, ia menyadari telah mengalami mispersepsi pada informasi sebelumnya. Bond (2006) menyebut ada enam faktor penyebab terjadinya kegagalan persepsi bunyi ujaran, yakni (1) pengetahuan fonetik, (2) pengetahuan fonologi, (3) pengetahuan kosakata, (4) pengetahuan tatabasa, dan (5) pengetahuan semantic dan pragmatic. Ke lima faktor ini baik secara sendiri-sendiri maupun secara bersama-sama dapat menyebabkan terjadinya kegagalan persepsi ujaran. Namun sampel yang diteliti Bond (2006) adalah penutur asli bahasa Inggris. Kesulitankesulitan yang dialami para penutur asli dan non penutur asli pasti tidak sama. Menurut Bond (2006) kesalahan persepsi yang dialami oleh para penutur asli bahasa Inggris pada umumnya karena pada saat para subjek mendengar informasi mereka juga pada saat yang bersamaan sedang disibukkan dengan hal lain yang memenuhi pikiran-pikiran mereka. Peristiwa gagalnya persepsi yang dialami non penutur asli bahasa Inggris dapat juga

disebabkan oleh hal yang sama seperti yang dialami para penutur asli bahasa Inggris, tapi terbuka kemungkinan adanya penyebab-penyebab lain seperti keterbatasan kemampuan bahasa Inggris, adanya perbedaan karakter antara bahasa sumber dan bahasa sasaran dalam hal pola ucapan, dan ketidakmampuan mengidentikasi bunyi ujaran. Penelitian Goh (2002) tentang kesulitan memahami bunyi ujaran yang dialami oleh non penutur bahasa Inggris di Tiongkok menunjukkan adanya hal-hal yang penting yang dapat dipelajari siapa saja yang menaruh minat dalam persoalan kesulitan menyimak ujaran bahasa Inggris sebagai bahasa asing. Goh (2002) menengarai pentingnya kemampuan inferensial sebagai penghubung proses bottom-up dan top-down dalam proses mendengarkan bahasa Inggris sebagai bahasa asing. Goh (2000, 2002) melaporkan adanya kesulitan-kesulitan yang dihadapi para mahasiswa Tiongkok dalam memahami tesks lisan berbahasa Inggris. Dalam laporan penelitian yang diberi judul A cognitive perspective on language learners’ listening comprehension problems Goh (2002: 45) menjelaskan kesulitan-kesulitan yang dihadapi para mahasiswa Tiongkok pada tiga tahapan proses kognitif sekaligus, yang meliputi tahap perception, parsing, dan utilization. Perception adalah tahap di mana penyimak mempersepsikan informasi dengan mencurahkan segenap perhatian pada bunyi-bunyi yang didengarkannya (proses bottom-up); parsing merupakan tahap olah input dalam bentuk bunyi untuk dicari maknanya dalam short term memory. Sementara utilization adalah tahap sinkronisasi informasi latar dengan makna dari bunyi yang didengarnya berdasarkan ingatan yang dimilikinya dalam jaringan long term memory (top-down). Hasil penelitian Goh (2000:185–206) menunjukkan bahwa kesulitan-kesulitan menyimak ujaran bahasa Inggris sebagai bahasa asing yang terjadi pada para mahasiswa yang ditelitinya terjadi pada ketiga tahapan tersebut. Pada tahap awal masalah yang dihadapi adalah (1) kesulitan mengenal kata yang sebenarnya telah diketahui

sebelumnya; (2) kesulitan memperhatikan bagian lanjut saat proses rekognisi kata/frasa sulit berlangsung; (3) kesulitan menangkap segmen-segmen yang didengarnya; (4) kesulitan menangkap bagian awal teks; dan (5) kesulitan berkonsentrasi pada informasi teks yang ‘mengalir deras’. Kesulitan dalam tahap tengah atau parsing meliputi (1) kesulitan mengingat apa yang didengarkannya; (2) kesulitan membangun makna dari kata-kata yang didengarnya; dan (3) kesulitan menangkap bagian-bagian lanjut karena adanya masalah-masalah dalam tahap sebelumnya. Terakhir, kesulitan dalam tahap sinkronisasi pengetahuan latar meliputi (1) kesulitan mengolah pesan walau telah mengerti kata-kata yang didengarnya; dan (2) kesulitan menangkap gagasan pokok dari pesan yang diterimanya. Dengan demikian faktor yang berpengaruh dalam proses mendengarkan menurut Goh (2000:201) sudah tidak lagi murni sebatas pada kemampuan bahasa, tapi mengarah pada kemampuan mengolah bahasa yang ada pada ranah kognitif. Dalam konteks mendengarkan informasi bahasa asing, faktor-faktor selain kemampuan inferensial, pun ikut menentukan dalam proses pemahaman. Chen (2005:18), misalnya, menyimpulkan adanya kendala psikologis yang dialami para pembelajar bahasa Inggris di Taiwan. Para mahasiswa yang mengalami kesulitan dalam menyimak ujaran-ujaran bahasa Inggris pada umumnya mengalami gejala psikologis seperti gugup saat mendengarkan, tidak fokus, bingung menentukan strategi yang tepat, dan merasa tidak memiliki kemampuan bahasa yang memadai. Apa yang disimpulkan Chen (2005:18) menunjukkan bahwa di samping faktor kognisi, terdapat juga faktor lain yakni faktor afektif seseorang. 1.7 Landasan Teori Menyimak adalah salah satu keterampilan bahasa yang pada awalnya kurang mendapat perhatian dari para peneliti bahasa (periksa Call, 1985; 765-781; Morley, 1991, Brown, 1990).

Baru setelah timbul kesadaran tentang pentingnya keterampilan menyimak, secara perlahan keterampilan ini mulai mendapat perhatian dari berbagai kalangan, termasuk di antaranya, mereka yang tertarik di bidang psikolinguistik, sosiolinguistik, biolinguistik, neurolinguistik, neuropsikologi, dan bidang lainnya. Dari berbagai literatur yang ada (Rivers, 1968; Brown, 1990; Bond, 2000, Halliday, 1973; Escudero, 2007; Penington, 2007) secara umum orientasi tentang penelitian menyimak terbagi ke dalam tiga fokus perhatian, yakni perhatian pada bahasa sebagai sebuah sistem; perhatian pada bahasa sebagai sarana komunikasi, dan perhatian pada bahasa sebagai sistem komunikasi bahasa yang melibatkan multifaktor, baik faktor-faktor yang berhubungan dengan bahasa maupun non kebahasaan. Perhatian pertama dilatarbelakangi suatu pemahaman bahwa kesulitan menyimak bahasa asing dapat dikaitkan dengan ketidakmapanan sistem bahasa yang tengah dipelajari seseorang. Seseorang yang tidak menguasai ‘sistem bunyi’ dari bahasa yang dipelajari tidak akan mampu memahami informasi yang disampaikan secara lisan; dia juga tidak akan mampu menyampaikan informasi lisan dengan benar kepada orang lain (Rivers, 1968). Kesulitan dalam proses menyimak bahasa asing adalah karena setiap bahasa memiliki sistem suara yang berbeda satu sama lain; apalagi jika bahasa yang dipelajari merupakan bahasa yang amat berbeda karakternya. Agar dapat menguasai keterampilan menyimak dengan baik, menurut pandangan ini, seorang pembelajar bahasa asing harus mempelajari aspek fisik dari produksi suara, yang meliputi fonetik, tatabahasa, kosakata, morfologi (Rivers, 1968, Brown, 1990, Bond, 2000, Escudero, 2007). Pandangan demikian terbentuk karena adanya pemahaman bahasa sebagai sistem, yakni sistem linguistik. Pandangan ini berangkat dari keyakinan bahwa linguistik adalah disiplin induk. Dalam kaitannya dengan paradigma ini, apa yang menjadi perhatian ahli bahasa (linguists)

menjadi target yang harus dipelajari para pembelajar bahasa (Halliday, McIntosh, dan Strevens, 1964; Halliday dan Greaves, 2004: 19). Perhatian kedua dilandasi pemikiran bahwa bahasa bukanlah merupakan sistem linguistik semata, tetapi juga sistem komunikasi. Menurut Campbel dan Wales (1970) di samping pengetahuan sistem bahasa seperti fonetik, morfologi, tatabahasa, dan kosakata, kecakapan menggunakan bahasa juga berperan penting dalam proses pemahaman menyimak (lihat juga Brown, 1990: 27). Menurut pandangan ini untuk memahami ujaran lisan, pengetahuan tentang bunyi dan tatabahasa saja tidaklah cukup. Faktor-faktor lain juga ikut menentukan dalam proses pemahaman menyimak, seperti faktor semantik. Sebagai contoh, kalimat yang mengandung unsur ‘modal’ seperti “You’ll have to stay indoors if you do that” harus dipahami dengan bantuan semantik, di samping pengetahuan sintaksis. Kalimat tersebut menggambarkan adanya pesan tertentu yang tersirat di dalamnya, yakni larangan melakukan sesuatu, yang harus dimengerti oleh orang yang diajak bicara. Perhatian ketiga didorong oleh satu keyakinan bahwa resepsi dan produksi bahasa tidaklah berdiri sendiri, tetapi bertautan dengan faktor-faktor lain, baik yang menyangkut faktorfaktor kebahasaan maupun non-kebahasaan, sebagaimana pernah diteorikan oleh Bejar et al (2000:2), peneliti dan pengamat TOEFL dalam monografnya yang berjudul TOEFL 2000 Listening Framework. Menurut Bejar et al (2000:2), dalam proses menyimak terdapat serangkaian faktor yang beroperasi bersamaan dan menunjang satu sama lain, seperti faktor ‘pengetahuan bahasa’, ‘pengetahuan situasi’ dan ‘pengetahuan latar belakang’.

Proses

menyimak diawali dengan ditangkapnya gelombang bunyi oleh ‘radar pendengaran’ seseorang. Apabila segenap perhatian dicurahkan untuk mengenali gelombang bunyi tersebut, maka kognisi pendengar akan merespons secara inferensial, menghubungkan bunyi tersebut dengan

pengetahuan situasi, pengetahuan bahasa, dan pengetahuan latar untuk memahami pesan yang didengarkannya (periksa juga Pennington 2000; Escudero, 2007 dalam Penington, 2007:110). Dalam peristiwa ini terbangun satu set proposisi yang merupakan efek dari proses olah pesan yang melibatkan tiga pengetahuan di atas. Ditambahkan oleh Bejar (2000:4) walaupun menangkap sinyal akustik yang sama tidak berarti setiap individu dapat membangun proposisi yang sama. Apabila ‘pengetahuan bahasa’, ‘pengetahuan situasi’, dan ‘pengetahuan latar belakang’ individu yang mendengarkan informasi itu berbeda-beda, maka proses pemahaman dan proposisi yang terbangun pun akan berbeda pula. Selanjutnya, makna proposisi ini digunakan untuk merespons pesan yang ditangkap penyimak. Saat merespons pesan, seseorang juga akan menggunakan ketiga pengetahuan di atas yang secara inferensial diolah kembali oleh kognisinya untuk disampaikan kepada lawan bicaranya sehingga terjadi proses menerima, mengolah dan mengirim pesan secara bolak-balik yang sering disebut sebagai dialog (Bejar, 2000:5) Sementara itu, dalam kaitannya dengan tes kemampuan bahasa Inggris, respons yang muncul dapat berbentuk dipilihnya jawaban yang sesuai dengan makna proposisi dari informasi yang ditangkapnya itu (Bejar, 2005:6) Secara eksplisit, Bejar (2000: 4) menegaskan bahwa ketidakutuhan pengetahuan bahasa (linguistic knowledge), pengetahuan konteks situasi (situational knowledge), dan pengetahuan latar belakang (background knowledge) akan berdampak sistemik pada proses pemahaman karena proposisi yang dibangun dari proses pemahaman yang tidak sempurna, akan berimbas pada ketidakakuratan menangkap esensi pesan yang diterimanya.

Secara implisit, Bejar

mengingatkan bahwa agar kemampuan mendengarkan para peserta TOEFL dapat ditingkatkan, seseorang calon peserta tes harus terlebih dahulu mengasah pengetahuan bahasanya, di samping pengetahuan konteks situasi, dan pengetahuan latar. Bagan berikut memberikan gambaran

tentang proses menyimak menurut Bejar (2000)

SK

LK

Knowledge access

Working memory capacity

Acoustic representation

BK

Receptive processes Cognitive processes

Listening stage

Propositional representation of input

SK = Situational Knowledge LK = Linguistic Knowledge BK = Background Knowledge PR = Proposition SK

Working memory capacity

LK

BK

Knowledge access

PR

Responses:

Response task

Receptive processes

Multiple Choice Cognitive processes

Written Spoken

Response stage Gambar 1.2 Proses menyimak menurut Bejar (2000)

Dari ketiga orientasi penelitian mengenai listening ini dapat disimpulkan bahwa faktorfaktor yang berpengaruh dalam proses pemahaman ujaran bahasa Inggris bagi non-penutur asli ini dapat dikaitkan dengan faktor pengetahuan bahasa, faktor kognisi, dan memori jangka pendek seseorang. Ini berarti proses menyimak tidaklah berlangsung secara bottom-up atau top-down saja, tapi secara secara bottom-up dan top down sekaligus dengan katalisator kemampuan inferensial (Vandergrift, 2007). Penelitian ini dilandasi oleh pandangan bahwa proses mendengarkan ujaran berbahasa asing berlangsung secara bottom-up dan top-down sekaligus atau secara inferensial (SebastianGales, 2006; Ingram, 2007; Vandergrft, 2007;

Stæhr, 2009), terutama ketika data yang

diperlukan tersedia dalam memori jangka pendek maupun memori jangka panjang. Ketika data tidak tersedia dalam memori untuk maksud checking schemata, maka proses yang akan terjadi adalah murni bottom-up, yakni hanya mengandalkan pengetahuan bahasa semata. Penelitian ini dilandasi pula oleh satu pemahaman bahwa mekanisme linguistik memungkinkan terjadinya aktivasi faktor-faktor lain yang disebutkan di atas sehingga proses pemahaman hanya dapat berlangsung manakala bunyi ujaran (speech perception) dapat dideteksi pihak yang mendengarkan dengan benar (Bonk, 2000; Rost, 2002, Cauldwell, 2003; Escudero, 2007; Cheng at all., 2008). Tidak terdeteksinya bunyi ujaran ini menyebabkan terhambatnya proses inferensial, yang melemahkan fungsi kognitif (Hewlett dan Beck, 2004, Vandergrift,

2007; Escudero, 2007).

1.7.1 Memahami Ujaran Dardjowidjoyo (2012) menengarai adanya tiga faktor yang dapat membantu seseorang memahami ujaran, yakni pengetahuan umum, kemampuan sintaksis, dan kemampuan semantik. Dengan pengetahuan umum yang dimilikinya seseorang akan dengan mudah memahami ujaran tanpa harus memperhatikan detail bunyi ujaran tersebut. Sebagai contoh, ketika seseorang mendengar dua kalimat berikut : (1) He bought a pair of horse shoes. (2) He bought a pair of alligator shoes. Seseorang yang memiliki pengetahuan umum secara memadai tentu tidak akan terjebak dalam pemahaman ujaran pada dua kalimat di atas. Kalimat pertama pastilah mengacu pada sepatu yang dipakai oleh kuda; sedangkan kalimat kedua adalah sepatu yang dibuat dari kulit buaya. Dengan pengetahuan umumnya, orang akan dengan mudah memastikan bahwa kalimat nomor (2) pastilah bukan sepatu yang dipakai buaya (hal 67). Dengan pengetahuan sintaksis yang dimilikinya, seseorang akan dengan cepat mengidentifikasi bahkan memprediksi kata yang akan muncul setelah dia mendengar kata tertentu. Sebagai contoh, ketika seseorang mendengar kata , maka dia segera mencari kata lain yang berkolokasi dengan kata tersebut, seperti , , , atau agar kata tersebut membentuk sebuah konstituen (hal 68). Dalam bahasa Inggris proses demikian juga akan terjadi. Ketika seseorang mendengar kata maka kata berikutnya yang bisa diprediksi adalah kata benda atau nomina. Bila kemudian yang muncul adalah kata , maka orang tersebut akan menunggu kehadiran kata berikutnya, yakni kata benda. Dan jika ternyata

muncul kata lain lagi yang berkategori bukan kata benda, seperti misalnya, sehingga menjadi untaian

maka pihak yang mendengarkan masih akan terus

menunggu sampai muncul kata benda. Dan seandainya muncul lagi kata lain yang bukan berkelas benda seperti pun orang tersebut akan menunggu sampai dia mendengar kata benda seperti misalnya . Barulah penantian ini akan terhenti sementara, karena pihak penyimak telah mendapatkan kata yang ditunggunya untuk membentuk sebuah konstituen (hal 69). Di samping pengetahuan umum dan sintaksis, pengetahuan lain juga penting, yakni semantik. Ketika seseorang mendengar kalimat berikut: (1) Kucing itu mengejar tikus tentulah orang tersebut akan dengan sangat cepat memahami ujaran tanpa keraguan sedikit pun. Tapi manakala seseorang mendengar kalimat berikut: (2) Tikus itu mengejar kucing maka kemungkinan besar orang yang mendengar ujaran tersebut akan keheranan dan tidak mustahil akan meminta penjelasan kepada pembicara apa memang seperti itu yang diujarkan (hal 73). Itulah ketiga faktor yang lazimnya digunakan penyimak untuk memahami ujaran yang ia dengarkan. Dalam realitanya, terutama dalam proses mendengarkan bahasa asing, faktor-faktor yang disebut Dardjowidjojo (2012) belumlah cukup. Masih ada faktor lain yang tidak kalah vitalnya dalam proses menyimak ujaran bahasa Inggris yang dilakukan non penutur asli, seperti orang yang berlatar belakang bahasa Indonesia. Yang disebut Dardjowidjojo tentu tidak keliru, tetapi dengan asumsi bahwa penyimak mampu mendeteksi bunyi ujaran yang disampaikan pihak yang berbicara. Apabila penyimak tidak mampu mendeteksi sebagian bunyi ujaran yang disampaikan

pihak yang berbicara maka ada kemungkinan terjadi mispersepsi, baik mispersepsi yang bersifat lokal, yakni pada tataran kata atau global pada tataran yang lebih luas, yakni kalimat. Jadi salah satu faktor determinan dalam proses pemahaman ujaran bahasa Inggris adalah kemampuan mempersepsi bunyi ujaran (Cauldwell, 2004). Untuk itu pada bagian ini penting dihadirkan teori tentang persepsi bunyi ujaran; termasuk model persepsi bunyi ujaran dan aspek-aspek yang berhubungan dengan persepsi ujaran. 1.7.2 Peran Fonologi dalam Persepsi Bunyi Ujaran. Persepsi ujaran adalah sebuah proses mental yang berhubungan dengan resepsi sinyal akustik dalam proses komunikasi lisan antar komunikan. Resepsi sinyal akustik itu sendiri tidak dapat dilepaskan dari kemampuan pihak listener menerima sinyal akustik dalam bentuk gelombang bunyi, mengidentifikasi bunyi-bunyi ujaran yang masuk, menghubungkan bunyi ujaran dengan leksikal yang ada dalam memorinya, dan memaknai pesan yang terkandung dalam bunyi ujaran yang didengarnya itu. Dengan demikian peran fonologi begitu penting dalam proses persepsi bunyi ujaran karena Fonologi membidangi persoalan bunyi bahasa yang berhubungan dengan mental processing. Menurut Salwen dan Stacks (1996) kehadiran fonologi sangat penting dalam proses memahami ujaran bahasa Inggris. Fonologi membantu seseorang menganalisis ujaran sampai ke tingkat sedetail-detailnya. Dengan bantuan fonologi seseorang dapat memproses sinyal akustik dan memaknai kata-kata secara tepat konteks sekalipun kata-kata yang didengarkannya itu memiliki bunyi yang sama atau mendekati bunyi kata yang didengarkannya itu. Sejalan dengan pandangan Salwen dan Stacks (1996), Cheung (2007) juga menyebutkan pentingnya fonologi dalam proses menyimak ujaran bahasa asing. Menurut Cheung (2007:151) Phonology awareness provides an informational space for the phonological information derived from listening and

reading to register in a common format. Dengan demikian jelas bahwa peran fonologi dalam persepsi bunyi ujaran sangat penting.

1.7.3 Model Persepsi Bunyi Ujaran Model persepsi bunyi ujaran muncul pertama kali pada awal tahun 1950an, diprakarsai oleh Alvin Liberman, dkk (Diehl, dkk., 2004:151), dan dikenal sebagai Motor Theory. Model ini mendapat respons luas dari berbagai kalangan akademis, termasuk di antaranya dari disiplin biologi, neurologi, psikologi, dan linguistik.

Menurut teori ini manusia mempersepsi bunyi

ujaran dengan menggunakan acuan seperti pada saat dia memproduksi bunyi ujaran itu. Secara spesifik bahkan dikatakan bahwa dalam proses persepsi bunyi, pendengar mempersepsi bunyi ujaran atas perintah syaraf motorik kepada artikulator bunyi, seperti lidah, bibir, vocal folds. Dengan demikian, menurut teori ini gerak artikulasinya hanyalah semu, atau dibayangkan akan terjadi seperti itu (intended gestures). Oleh karenanya, dapat disimpulkan bahwa dalam teori ini yang menjadi perhatian utama adalah ‘artikulasi’ bukan ‘akustik’ (Gleason dan Ratner, 1998: 143-144). Bahkan dalam versi teori berikutnya Liberman dan Mattingly, (dalam Diehl, et al, 2004: 151) mengungkapkan bahwa kemampuan manusia mempersepsi bunyi ujaran bergantung pada dekoder bunyi ujaran (speech decoder) yang berfungsi memutar balik produksi bunyi ujaran, “running the process of speech production backward”. Jadi menurut teori ini proses persepsi semata-mata adalah proses biologis yang bersinggungan dengan syaraf bahasa seseorang. Dalam perkembangannya, teori Liberman ini dikoreksi oleh Fowler (1980) dengan teorinya Direct Realist. Teori ini memiliki kesamaan dengan teori Motor Liberman dalam hal fokus perhatiannya, yakni pada alat artikulasi, bukan akustik. Namun dalam Direct Realist Theory ini acuan yang digunakan adalah gerak artikulasi langsung (direct) dan nyata (real), tidak seperti dalam Teori Motor yang gerak artikulasinya bersifat semu (intended gestures). Dengan demikian, menurut Direct Realist Theory apa yang ditunjukkan oleh gerak bibir pelaku wicara seperti membuka dan menutup pada saat bunyi /pa/ diproduksi memberikan gambaran tentang tanda akustik (acoustic signal) yang dapat dipakai sebagai sarana bagi pendengar untuk memahami apa yang disampaikan pihak yang berbicara. Pemahaman tentang

persepsi bunyi ujaran mengalami pergeseran signifikan ketika

model persepsi berbasis artikularis ditolak. Dalam pendekatan yang lebih terbarui yang disebut dengan General Auditory and Learning Approaches to Speech Perception orientasi teori persepsi diarahkan ke fonetik auditoris. (Diehl dan Klunders1987; Masaro dan Oden 198). Prinsip dasar model General General Auditory and Learning Approaches to Speech Perception adalah bahwa persepsi itu merupakan peristiwa ‘auditory’ atau mendengarkan

fonetik dan akustik bunyi

ujaran, bukan sekedar membayangkan diri menirukan artikulasi pembicara. Model ini menolak anggapan bahwa persepsi itu merupakan proses biologis yang menggunakan mekanisme spesifik dan unik yang hanya dimiliki manusia untuk mengartikulasikannya. Jika persepsi adalah bersifat unik dan berkait dengan artikulasi bunyi yang hanya bisa dimiliki manusia, maka bukti bahwa burung beo dapat mendemonstrasikan kemampuannya untuk dapat membedakan bunyi /b/ dan /d/ sudah cukup untuk menolak teori itu (Diehl, et al. 2004: 154-155). Untuk memahami bunyi ujaran, seseorang dapat mempelajari pola-pola bunyi dan melatihnya untuk dapat mempersepsi ujaran dengan benar. Dengan asumsi, burung beo yang memiliki keterbatasan saja dapat membedakan bunyi /b/ dan /d/, bahkan dapat menirukan bunyi kata, frasa, atau kalimat (Diehl, et al., 2004) maka manusia sebagi homo edukandum akan jauh lebih sempurna baik dalam mengartikulasi maupun mempersepsi bunyi ujaran. Hewlett dan Beck (2006:17) mengungkapkan bahwa persepsi bunyi ujaran dalam kegiatan mendengarkan tidak dapat diobservasi secara langsung karena peristiwa ini merupakan proses mental yang rumit. Pada saat persepsi bunyi ujaran dianalisis, kesulitan akan muncul seketika karena tidak jelasnya bagian linguistik mana yang sebenarnya dapat diakses. Kenyataannya, tatkala seseorang mendengar kata ‘sheep’ yang muncul dalam benaknya adalah gambar (image) seekor biri-biri, dan bukan kata yang terbangun dari fonem [s], [h], [e], [e], [p], ataupun kata bersimbol fonemik /∫/, /i/, dan /p/. Apalagi jika pendengar adalah seorang non

penutur bahasa Inggris yang tidak mengenal kata sheep atau mengalami kesulitan mendeteksi kata tersebut sehingga dia salah mempersepsi kata tersebut menjadi ship, shift, shape, shit, atau kata-kata yang berbunyi mendekati kata sheep secara fonetis (Hewlett dan Beck, 2002).

1.7.4 Proses Persepsi bunyi ujaran Menyimak merupakan proses mental yang berlangsung di dalam otak manusia sebagai respons terhadap hadirnya stimulus berupa sinyal akustik bermuatan pesan-pesan tertentu yang dibawa lobus temporal ke dalam jaringan korteks. Stimulus berupa sinyal-sinyal akustik ini mengudara atas perintah otak melalui alat-alat ucap manusia seperti pita suara, langit-langit, lidah, gigi, bibir dibantu oleh paru-paru. Begitu sinyal-sinyal ini terdeteksi ‘radar pendengaran’ seseorang, maka proses ‘mendengarkan’ ini pun segera berlangsung di dalam otak seseorang (Hewlett dan Beck, 2006). Hal-hal yang kemudian terjadi seperti dipahaminya pesan informasi oleh pihak yang mendengarkan atau gagalnya pesan informasi itu dipahami seseorang berkaitan dengan banyak faktor, di antaranya faktor memadai tidaknya pengetahuan bahasa seseorang terhadap bahasa yang digunakan dalam komunikasi itu; mendukung tidaknya pengetahuan konteks yang bersangkutan, dan seberapa akurat antisipasi-antisipasi yang bersangkutan terhadap arah topik pembicaraan (Goh, 2000). Secara ringkas, hubungan pola kerja otak mengolah sinyal akustik digambarkan oleh Hewlett dan Beck (2006) dalam bagan sebagai berikut: The Speaker The brain

Controls the translation of an idea into spoken language and

The vocal apparatus Lungs, larynx, tongue, lips, etc. act together to

The Air

Sounds pass from speaker to listener as acoustic energy

The Listener The auditory system Sounds are detected by the ear and

The brain

The listener interprets what is heard, using their knowledge of

initiates speech production

produce speech sounds

information is passed to the brain of the listener

spoken language, context, expectations, etc.

Gambar 1.3 Pola kerja otak mengolah sinyal akustik

Bagan model Hewlett dan Beck ini memperlihatkan proses transfer bunyi ujaran berisikan pesanpesan tertentu dari seorang pembicara ke pendengar. Bagan ini sekaligus mengisyaratkan bahwa proses menyimak tidaklah sesederhana “pasang telinga” lantas dengan serta merta informasi yang disampaikan lawan bicara mengalir memenuhi slot memori jangka pendek atau memori jangka panjang pihak pendengar, untuk kemudian tiba-tiba memahami pesan yang diterimanya. Menurut Hewlet dan Beck (2006:17) untuk dapat memahami pesan informasi yang disampaikan lawan bicara, seseorang harus mengerahkan segenap kemampuannya untuk menangkap sinyal akustik dengan bantuan pengetahuan bahasa, pengetahuan konteks, dan kemampuan antisipasi terhadap arah topik pembicaraan. Dengan demikian, proses menyimak menurut bagan ini berlangsung secara inferensial dengan kombinasi bottom-up dan top-down. Bottom-up berkenaan dengan pengetahuan bahasa seseorang; sementara top-down berhubungan dengan pengetahuan konteks dan arah antisipasi yang dibuat orang tersebut. Dari gambaran proses transfer informasi yang ditunjukkan bagan Hewlett dan Beck (2006), tampak jelas bahwa menyimak merupakan bagian dari proses komunikasi baik dalam bentuk interaksional (timbal balik) maupun transaksional (searah). Pada saat proses ini berlangsung pihak penyimak tidak berada dalam keadaan pasif, tapi aktif menunggu informasi yang disampaikan pihak yang berbicara untuk kemudian mencerna dan meresponsnya (dalam konteks komunikasi interaksional) atau menyimpannya di memori jangka pendek (dalam konteks komunikasi transaksional). Dengan demikian kegiatan menyimak melibatkan tiga komponen

sekaligus, yakni pihak yang menyampaikan pesan, pesan yang disampaikan, dan pihak yang menerima pesan. Menurut Kent dan Read (2002:12) tiga komponen yang terlibat dalam kegiatan menyimak ini sekaligus mewakili tiga ranah yang saling berhubungan satu sama lain, yakni ranah fisiologi (the physiologic arena), akustik (the acoustic arena), dan persepsi (the perceptual arena). Ranah fisiologi berkaitan dengan artikulasi bunyi, yakni bagaimana bunyi itu dibuat oleh pihak yang menyampaikan pesan. Ranah akustik meliputi aspek-aspek fisika bunyi, seperti berapa frekuensi

untuk bunyi vokal, berapa milisekon bunyi sebuah frasa yang diucapkan

secara terangkai (connected); dan bagaimana bunyi-bunyi sukukata-sukukata tertentu itu terangkai (dilihat dengan bantuan spectrogram);

dan ranah persepsi berhubungan dengan

persepsi bunyi-bunyi ujaran yang menentukan apakah proses pemahaman teks lisan berlangsung dengan benar atau terjadi mispersepsi bunyi ujaran yang mengakibatkan pada kegagalan pemaknaan pesan yang disampaikan (Kent dan Read, 2002). Untuk itu, agar dapat memahami proses menyimak, seseorang harus mengetahui secara mendetail hubungan antar komponen di atas, atau lebih spesifiknya, tentang apa yang terjadi pada saat komunikasi itu berlangsung, mulai dari bagaimana pesan informasi itu dikemas oleh pihak yang berbicara sampai bagaimana pesan itu dicerna dan dipahami oleh pihak yang menyimak (Kent dan Read, 2002). Gambaran detail demikian diperlukan karena jika terjadi kesulitan pada proses pemahaman informasi, kesulitan tersebut dapat dilacak kembali pada bagian mana kesulitan itu muncul dan apa penyebab terjadinya kesulitan itu. Sebelum Hewlett dan Beck (2006) menggambarkan proses transfer bunyi ujaran, pada awal tahun 2000an Kent dan Read (2002: 15) telah mengemukakan teorinya tentang proses transfer bunyi ujaran dari sudut pandang linguistik yang digambarkan dalam bagan sebagai

berikut:

Message Lexical Selection

Syntactic construction

Phonological Representation

Lexical interpretation

syntactic analysis

lexical recognition

Prosodic Construction

prosodic analysis

Phonetic Specification

phonetic recognition

Articulatory Movements

Auditory processing

Acoustic signal Gambar 1.4 Proses transfer informasi dua arah Dalam bagan Kent dan Read (2002) ini digambarkan bahwa proses komunikasi diawali dengan pemilihan kata-kata yang sesuai dengan pesan yang ingin disampaikan pihak yang berbicara; pada saat yang bersamaan dia harus menentukan struktur kalimat yang secara tepat mendukung pemaknaan pesan yang terkandung dalam kata-kata yang telah dipilihnya itu. Katakata yang telah diseleksinya itu memerlukan pengucapan yang sesuai dengan maksud pesan, dikaitkan dengan struktur kalimat yang dibuatnya dengan mempertimbangkan aspek prosodi,

lalu terbentuklah spesifikasi bunyi yang siap diartikulasikan menjadi pesan dalam bentuk gelombang akustik sebagai pembawa pesan. Ketika sinyal akustik ini sampai ke telinga pihak yang mendengarkan, maka dimulailah proses pemahaman menyimak ini. Proses dimulai dengan rekognisi fonetik sekaligus analisis aspek prosodi untuk mendapatkan gambaran secara pasti mengenai kata-kata apa yang diucapkan pihak pembicara (lexical recognition). Kata-kata yang telah terdeteksi dicari maknanya dengan mempertimbangkan struktur kalimat

yang

ditangkapnya. Apabila antara kata-kata yang diucapkan pihak pembicara dalam struktur kalimat yang telah ditetapkannya itu sebangun dengan kata-kata yang dideteksi pihak penyimak, maka dapat dikatakan informasi terdeteksi secara akurat seperti yang diucapkan pihak yang menyampaikan pesan. Dalam hal ini terjadi persepsi yang akurat terhadap bunyi-bunyi ujaran yang disampaikan pihak pembicara; sebaliknya apabila terdapat selisih makna atau terjadi perbedaan dalam pesan yang disampaikan oleh pihak yang berbicara maka dapat dikatakan terjadi mispersepsi terhadap bunyi ujaran (Kent dan Read, 2002). Mispersepsi bunyi ujaran dapat terjadi pada suku kata, kata, atau hubungan antar kata dalam kalimat.

Mispersepsi seperti ini lazim terjadi dalam sebuah komunikasi lisan yang

menggunakan bahasa asing sebagai bahasa pengantar. Hal ini disebabkan karena adanya pengaruh dari pola artikulasi bunyi ujaran, fitur prosodi, konstruksi sintaksis bahasa asing yang tidak kongruen dengan bahasa asal (Kent dan Read, 2002) . Menurut

Polivanov and Trubetzkoy

(dalam

Escudero, 2007: 109), dalam proses

pemahaman bahasa asing, bahasa asal akan berfungsi sebagai “phonological filter” untuk mempersepsi bunyi ujaran bahasa asing yang didengarkannya itu. Ini berarti, pola ucapan, ritme, dan fitur prosodi lainnya dalam bahasa asal akan menjadi acuan utama bagi proses persepsi bunyi ujaran, manakala kemampuan bahasa asing seseorang masih belum memadai. Pendapat

Polivanov and Trubetzkoy ini sejalan dengan pandangan Major (2001) bahwa persepsi bahasa asing dipengaruhi oleh kebiasaan persepsi dalam bahasa asal; dan Escudero (2007: 110), yang meyakini bahwa pengaruh bahasa asal dalam mempersepsi bunyi tak terhindarkan manakala seseorang mencoba memahami ujaran dalam bahasa asing. 1.7.5 Bahasa fonetik vs bahasa non fonetik Ditinjau dari korelasi antara bentuk tulisan dan bacaannya, sebuah bahasa dapat dikategorikan sebagai bahasa fonetik atau bahasa non fonetik. Sebuah bahasa dikatakan berkategori bahasa fonetik jika bahasa tersebut mempunyai ciri adanya kesamaan antara tulisan dan pengucapannya (Wormack, 1957: 388); sebaliknya bahasa dikatakan berkategori non fonetik apabila tidak terdapat korelasi antara tulisan dan bacaannya. Bahasa Indonesia dapat dimasukkan dalam kategori bahasa fonetik (phonetic language). Dalam bahasa ini apa yang terlihat dalam tulisan, seperti itulah ucapan dibuat. Bahasa-bahasa lain yang masuk dalam kategori bahasa fonetik adalah bahasa Finlandia, Hungaria, dan Italia (Wormack, 1957: 386). Sementara bahasa Inggris, dengan melihat pola hubungan antara tulisan dan bacaannya, tidak dapat dikategorikan sebagai bahasa fonetik (Essberger, 2001). Apa yang tertulis dalam bahasa Inggris tidak selalu diucapkan seperti yang terwakili dalam tulisan tersebut. Contoh-contoh berikut memberikan gambaran pernyataan di atas sekaligus sebagai bukti bahwa bahasa Inggris bukanlah bahasa fonetik (Essberger, 2001). Perhatikan contoh berikut: 1. though 2. through

3. cough 4. plough

5. rough 6. Ought

7. borough

Ketujuh kata di atas secara fonetis memiliki unsur pembentuk kata yang sama, yakni ough. Tetapi dari ke tujuh kata tersebut tidak ada satu kata pun memiliki ucapan yang sama dengan kata lainnya dalam kelompok tersebut. Ini membuktikan bahwa bahasa Inggris tidak selalu konsisten dalam hal korelasi tulisan dan bacaan. Kata pertama, yakni diucapkan /ðəʊ/. Tetapi kata kedua, yakni tidak diucapkan / θrəʊ/, melainkan /θruː/. Bahkan kata berikutnya, terdengar lebih jauh dari ucapan kata pertama dan kedua, yakni /kɒf/, bukan /kəʊ/ atau /kuː/. Di samping itu ada juga kata yang diucapkan /rʌf/, dan kata , , dan yang secara berturut-turut diucapkan /plaʊ/, /ˈɔːt/, dan /ˈbʌrə/.

Semuanya itu menunjukkan adanya inkonsistensi dalam pengucapan. Perhatikan

kembali deret kata beserta pengucapannya sebagaimana terlihat dalam tabel berikut ini:

Tabel 1.1 Contoh ucapan mengandung unsur ough

Data pada tabel menunjukkan

adanya

pengucapan pada kata-

/ ðəʊ/

/θruː/

/kɒf/

/rʌf/

/plaʊ/

/ˈɔːt/

/ˈbʌrə/ (Essberger, 2001)

kata-kata

yang

1.1 inkonsistensi kata

yang

mengandung unsur ough. Dalam bahasa fonetik seperti bahasa Indonesia, inkonsistensi

pengucapan kata yang mengandung unsur yang sama seperti tujuh contoh di atas tidak akan terjadi. Semua kata yang dibangun dengan huruf-huruf yang sama pada umumnya

akan

mendapatkan ucapan yang sama, seperti contoh-contoh berikut: Tabel 1.2 Contoh ucapan kata dalam bahasa Indonesia yang mengandung unsur /ai/

/aɪr/

/caɪr/

/kaɪl/

/kaɪn/

/baɪk/

<main>

/maɪn/

/gaɪb/

Tabel di atas menunjukkan adanya korelasi antara tulisan dan ucapan dengan unsur dasar /aɪ/. Bunyi kata pertama, yakni diucapkan /aɪr/. Bunyi kata kedua diucapkan /caɪr/, dan bunyi kata ketiga diucapkan /kaɪl/. Demikian pula bunyi kata-kata berikutnya, yaitu kata , , <main>, dan yang secara berturut-turut diucapkan /kaɪn/, /baɪk/, /maɪn/, dan /gaɪb/. Semua bacaan atau pengucapan menunjukkan keajegan korelasi antara tulisan dan bacaannya. Pola seperti ini yang disebut Wormack

(1957) sebagai karakter utama bahasa

fonetik.

1.7.6 Persepsi ujaran lintas bahasa. Kajian persepsi bunyi ujaran pada umumnya dilakukan pada tataran segmental dan dalam lingkungan bahasa ibu (Strange, 1995). Dengan demikian tidak banyak informasi yang dapat

diperoleh tentang kajian persepsi bunyi ujaran pada tataran yang lebih luas, apalagi kajian persepsi bunyi ujaran lintas bahasa (Sebastian-Gales, 2006 : 546). Kajian-kajian persepsi bunyi ujaran lintas bahasa masih amat langka referensinya sehingga belum dapat memberikan gambaran yang komprehensif tentang persoalan persepsi bunyi ujaran lintas bahasa (Best, McRoberts, dan Goodell, 2001). Salah satu catatan penting dari kajian para peneliti persepsi ujaran adalah bahwa persepsi bunyi ujaran lintas bahasa dipengaruhi oleh properti fonologi bahasa ibu dari pihak penyimak (Strange, 1995; Sebastian-Gales, 2006; Best, McRoberts, dan Goodell, 2001). Oleh karena itu, persepsi bunyi ujaran lintas bahasa sering mengalami clash antara apa yang disampaikan pihak pengirim pesan, yang dibungkus dalam fitur fonologi pengirim pesan dan apa yang ditangkap oleh penerima pesan, yang menggunakan properti fonologi bahasa penerima pesan. Sebagai akibatnya mispersepsi sering terjadi dalam peristiwa komunikasi lintas bahasa (Segui, Frauenfelder, dan Halle, 2001) Untuk menghindari adanya mispersepsi ujaran dalam proses persepsi lintas bahasa diperlukan pengetahuan tentang fitur-fitur fonologi bahasa sasaran secara memadai. Dalam konteks penelitian ini, orang Indonesia yang terlibat dalam komunikasi lintas bahasa dengan penutur asli bahasa Inggris akan lebih mudah memahami makna informasi dari pihak penutur asli apabila mereka menguasai fonologi bahasa Inggris. Ketidakpahaman tentang fitur-fitur fonologi bahasa Inggris akan menyulitkan mereka memahami ujaran bahasa Inggris (Brown, 1990; Strange, 1995; Sebastian-Gales, 2006; Best, McRoberts, dan Goodell, 2001). Di antara fitur-fitur fonologi bahasa Inggris yang penting untuk diketahui adalah: (1) Tekanan (stress pattern), (2) tonisitas, (3) tonalitas, dan (4) ritme dalam bahasa Inggris. Keempat fitur ini penting untuk dikuasai pembelajar bahasa Inggris, karena dalam bahasa Inggris lisan tanpa menguasai

fitur-fitur

fonologi

ini

para

pembelajar

bahasa

Inggris

akan

mengalami

kesulitan

mengidentifikasi bunyi ujaran dalam connected speech yang kerapkali mewarnai ujaran bahasa Inggris (Cauldwell, 2002). Berikut ini dipaparkan tekanan kuat dan tekanan lemah, tonisitas, tonalitas, dan ritme dalam bahasa Inggris.

1.7.7 Tekanan Kuat dan Tekanan Lemah dalam Bahasa Inggris Setiap bahasa memiliki ke-khas-an iramanya masing-masing yang melekat pada bahasa itu. Salah satu bagian penting yang harus diperhatikan dalam bahasa Inggris adalah

pola

tekanannya (Brown, 1990: 43). Bahasa Inggris merupakan salah satu bahasa yang memiliki irama khas yang diwarnai dengan adanya tekanan keras lemah dalam pengucapannya (weak and strong stress). Pola tekanan ini berpengaruh pada pada ‘ritme’ ucapan, ‘tonisitas’, yakni penekanan yang sengaja dibuat oleh penutur ujaran agar lawan bicara atau pihak pendengar mengetahui adanya informasi yang ditonjolkan, dan ‘tonalitas’ atau pengelompokan elemen bunyi menjadi sebuah satuan (chunk). Menurut Brown (1990: 53) untuk menunjukkan adanya informasi yang ditonjolkan, kalimat-kalimat bahasa Inggris selalu memiliki bagian yang diberi tekanan, baik itu tekanan kuat maupun lemah. Adapun bagian-bagian yang lazim mendapatkan tekanan kuat (strong stress) adalah (1) nouns, (2) demonstratives, (3) adjectives, (4) adverbs, (5). Lebih jauh Brown (1990) mengemukakan bahwa dalam bahasa Inggris ada bagian yang biasanya ingin dikontraskan dengan cara memberi penekanan pada bagian tertentu. Bagian yang lazim diberi tekanan ini adalah semua kata yang tergolong dalam lexical words, yang meliputi kata-kata yang disebut brown (1990) di atas; sementara bagian yang tidak lazim mendapat tekanan adalah kata-kata

yang tergolong dalam grammatical words, yakni kata-kata yang memiliki fungsi gramatik semata, seperti preposition, conjunctions, pronouns. Kata-kata ini mendapat tekanan lemah (weak stress) sehingga tidak menonjol dalam pengucapannya (non prominent). Untuk mengetahui bagian-bagian mana yang diberi tekanan kuat sehingga terdengar menonjol (prominent), seseorang dapat melihat letak tekanan (stress) pada daftar kata yang terdapat di kamus-kamus, terutama kata-kata yang terisolir atau berdiri sendiri, bukan kata dalam untaian kalimat. Untuk kata-kata yang terdapat dalam untaian kalimat bagian yang dalam konteks tertentu diberi tekanan dapat mengalami pergeseran tekanan pada konteks yang berbeda. Perhatikan bahwa ketika /ɪə/ dalam kata mendapat tekanan kuat seperti dalam , kualitas diftong /ɪə/ akan terdengar jelas; tapi dalam posisi tidak diberi tekanan seperti dalam diftong /ɪə/ diucapkan pendek dengan kualitas suara yang berbeda, dan dengan kecenderungan kurang jelas, hanya terdengar /ə/ (Brown, 1990: 47). Menurut Brown (hal 55) bagian yang tidak diberi tekanan memang cenderung kurang jelas, kurang sempurna, dan bergeser dari bunyi aslinya. Hal ini disebabkan karena setiap konsonan dan vokal terpengaruh bunyi-bunyi vokal dan konsonan di sekitarnya (hal 62). Dalam kasus terjadinya pergeseran tekanan yang secara dinamis mengikuti pesan yang disampaikan pihak penutur, perubahan bunyi lebih banyak disebabkan oleh upaya penutur menjaga keajegan irama. Dampak dari kebiasaan ini adalah terjadinya kompresi atau mampatan bunyi pada bunyi-bunyi non-prominent yang terapit bunyi prominent. Sebagai akibatnya bunyibunyi bertekanan lemah mengalami penurunan kualitas sehingga tidak terdengar jelas ketika diucapkan, seperti yang diutarakan Brown sebagai berikut: Any unstressed syllables occurring between the stressed syllables will be compressed as far as possible in order to allow the next stressed syllable to come on the regular beat. (hal 44).

Dengan demikian pola tekanan bahasa Inggris menjadi penting untuk dikuasai para pembelajar bahasa Inggris berlatar belakang bahasa fonetik karena pola tekanan ini menggambarkan sisi suprasegmental yang sangat kental dalam bahasa Inggris. Pola tekanan bahasa Inggris dapat dianalisis dengan menggunakan matrix grid yang menggambarkan sebaran tekanan kuat dan tekanan lemah dari sebuah frasa intonasi. Matrix grid sekaligus dapat dipakai untuk menunjukkan tingkat sonoritas (sonority level) masing-masing elemen yang diwakili silabel-silabel pembentuk frasa intonasi. Sonoritas adalah kuatnya bunyi silabel-silabel tertentu dibanding dengan silabel-silabel sekitarnya dalam sebuah frasa intonasi. Bunyi-bunyi sonoritas dapat mewakili elemen yang mendapat seconday stress yakni tekanan kuat pada elemen-elemen frasa intonasi, dapat pula mewakili primary stress, yakni elemen yang mendapat tekanan utama dalam frasa intonasi tersebut. Berikut adalah contoh sebuah frasa intonasi yang dianalisis dengan menggunakan matrix grid untuk melihat tekanan-tekanan kuat dan tekanan lemah dari kalimat <Many people use word processors.>.

X X Ma

X ny

X X peo

X ple

X use

X X X word

X X pro

Primary stress Secondary stress X ces

X sor

Dari tabel matrix grid di atas terlihat bahwa elemen yang memiliki level sonoritas tertinggi adalah elemen <word>. Oleh karena itu tekanan utama atau primary stress dari frasa intonasi kalimat <Many people use word processors> adalah elemen <word>. Elemen-elemen-elemen lain yang juga memiliki sonoritas adalah silabel <ma> dari kata <many>, silabel dari kata , dan silabel <pro> dari kata <processors>. Dengan demikian, dalam frasa intonasi kalimat tersebut, elemen-elemen yang mewakili silabel <ma>, silabel , dan silabel <pro>

merupakan elemen yang bertekanan kuat dan elemen-elemen dari kata <many>, dari kata , dan <sors> dari kata <processors> merupakan elemen-elemen yang mendapatkan tekanan lemah dalam frasa intonasi tersebut. Adapun keputusan untuk menentukan elemen mana yang mendapatkan tekanan utama sepenuhnya ada pada otoritas speaker (Brazil, 1995). Keputusan untuk menentukan elemen mana yang mendapat tekanan utama dan elemen mana yang tidak mendapat tekanan utama disebut sebagai tonisitas (Well, 2006). Pada bagian selanjutnya dijelaskan tentang tonisitas, tonalitas dan ritme frasa intonasi sebagai bagian tak terpisahkan dari pendekatan fonologi.

1.7.8 Tonisitas Tonisitas adalah penempatan tekanan kuat (tonic) pada silaba tertentu yang dianggap paling penting (prominent) dalam sebuah frasa intonasi (Wells, 2006: 24). Tekanan kuat dalam bahasa Inggris ini bersifat dinamis dan tidak seperti tekanan dalam bahasa Indonesia yang cenderung statis, yakni terjadi pada suku kata tertentu dari sebuah kata atau frasa bahasa Indonesia. Tekanan kuat dalam bahasa Inggris bisa berpindah-pindah lokasi tergantung hubungan antar bagian dalam kalimat. Wells (2006) mengatakan bahwa ketika seseoranɡ mencari pada bagian mana dari intonation phrase sebuah tekanan kuat (tonik) dijatuhkan, maka oranɡ tersebut tengah mencermati tonisitas sebuah frasa intonasi. Tonisitas merupakan ‘hak prerogatif’ pihak yang berbicara karena dialah yang sesungguhnya menentukan pada silabel mana tonik itu akan dijatuhkan (Brazil, 1994). Pada prinsipnya tonisitas dapat terjadi pada (1) sebuah suku kata yang mendapatkan tekanan (a stressed syllable), (2) akhir kata atau mendekati akhir kata (on or near the last word), (3) content words dan function words, (4) compound, dan (5) double-stressed compounds.

Pada masing-masing intonation phrase selalu ada satu kata yang mendapat perhatian utama dari pihak yang berbicara. Kata yang mendapat perhatian utama ini lazimnya diberi tekanan kuat pada salah satu suku katanya. Pada kata inilah tonik atau sering juga disebut dengan istilah nucleus berada. Jika dalam sebuah intonation phrase terdapat lebih dari satu tekanan, maka toniknya terdapat pada bagian akhir. Bagian-bagian umum sebelum tonic disebut sebagai prenuclear; sementara bagian sebelum tonic yang juga mendapat tekanan kuat disebut onset. (Wells, 2006:23). Nukleus juga dapat dikenali di kata terakhir atau mendekati terakhir dalam intonation phrase, terutama jika kata tersebut memiliki makna penting, sebagaimana ditunjukkan dalam contoh-contoh berikut:

‘

<She’s just started a new re’lationship.>

Pada contoh-contoh di atas, semua bagian yang diberi garis bawah menunjukkan nukleus dari masing-masing intonation phrase. Contoh-contoh di atas menguatkan pernyataan Altenberg (1987:56) bahwa nukleus hadir pada kata terakhir dari sebuah intonation phrase. Dalam penelitian Alternberg, dengan korpus 1200 intonation phrase, 88% nukleus jatuh pada kata terakhir dari intonation phrase. Untuk mengenali nukleus sebuah intonation phrase, seseorang juga bisa mendeteksinya dengan mencari content word paling akhir dari intonation phrase. Content words sering dikontraskan dengan function words, di mana content words diterjemahkan sebagai kata-kata yang memiliki makna yang lazim didefinisikan dalam kamus; atau kata-kata yang memiliki ekuivalensi dengan kata-kata dalam bahasa lain; sementara function words sering didefinisikan

sebagai kata-kata yang maknanya lebih banyak ditentukan oleh struktur tatabahasa daripada kamus. Yang termasuk dalam contoh functions words adalah pronouns, prepositions, articles, auxiliary verbs, modal verbs. Berikut adalah contoh-contoh nukleus yang terdapat pada content words paling akhir dari intonation phrase: Ketika mengidentifikasi kata terakhir dari intonation phrase, seseorang harus memperhatikan adanya konstruksi kata majemuk (Collins, 2008). Kata majemuk ini memiliki dua bagian yang harus dicermati, yakni bagian depan dan belakang. Untuk kata majemuk ini, nukleus atau sering juga disebut sebagai lexical stress, terletak di bagian depan. Contoh-contoh berikut memberikan gambaran dimaksud:

< It’s ‘well past your ‘bedtime.> <don’t look at the ‘keyboard!.> <Where’s your ‘grandmother?> Terkadang kata majemuk ditulis secara terangkai menjadi satu kata; adakalanya ditandai dengan tanda hubung; atau ada juga yang ditulis dalam dua kata. Hal demikian tidak mempengaruhi letak lexical stress dari sebuah intonation phrase. Nukleus berada pada kata pertama dari kata majemuk tersebut.

Ada beberapa kata majemuk yang memiliki tekanan ganda, yakni tekanan pertama dan kedua. Tekanan pada kata yang pertama di sebut onset; sementara tekanan pada kata yang kedua, yakni lexical stress merupakan tekanan utama (nucleus) intonation phrase. Dalam konteks tertentu terkadang tonicity dipengaruhi oleh pengetahuan latar para komunikan. Sesuatu yang sudah menjadi jelas, diketahui bersama terkadang tidak lagi diberi penekanan, seperti contoh berikut: . Kata train dalam kalimat tersebut bukanlah merupakan informasi baru, tapi merupakan informasi yang telah diketahui para komunikan (shared knowledge), karena informasi itu dibuat di dalam kereta, dan pihak yang mendengar diasumsikan berada di dalam kereta tersebut. Jadi kata train tidak diberi tekanan (Collins, 2008).

1.7.9 Tonalitas Penempatan tonik dalam ujaran bahasa Inggris merupakan bagian penting dari ciri prosodi yang melekat dalam bahasa Inggris (Wells, 2006: 24). Dengan memperhatikan tonik sebuah frasa intonasi, seseorang dapat mendeteksi bagian yang ditonjolkan dalam informasi yang disampaikan pembicara sekaligus memastikan makna yang disampaikan pembicara. Dengan demikian seseorang harus memberikan perhatian pada bagian yang diberi tekanan dalam kalimat yang didengarkannya itu. Hal yang sama juga berlaku pada tonalitas, atau frasa informasi atau potongan-potongan informasi berupa chunks, yakni untaian ujaran yang dibuat oleh pembicara

agar informasi menjadi jelas maksudnya. Perlu diketahui, para pakar menggunakan istilah tonalitas, frasa intonasi dan chunks secara bergantian; dan terkadang mereka juga menggunakan word group (Cauldwell, 2003). Tonalitas ini sifatnya arbitrer (Tench, 1996; Brazil, 1996, Cauldwell, 2003,Wells, 2006) terserah pihak yang berbicara. Adalah tugas dari seorang pendengar untuk mencermati potonganpotongan informasi berupa chunks yang disampaikan oleh pihak yang berbicara agar informasi dapat dipahaminya dengan baik dan benar. Seorang speaker dapat saja mengucapkan kalimat dengan tonalitas yang dia kehendaki, sebagaimana terlihat pada contoh berikut:

Kalimat pertama terdiri dari satu chunk, diawali dengan bentuk imperatif Look dan diakhiri dengan kata eye disertai tanda seru. Kalimat kedua terdiri dari dua chunks. Chunk yang pertama adalah Look at that dog; dan chunk yang kedua adalah with one eye. Kalimat-kalimat ini berpotensi menimbulkan mispersepsi pada makna kedua kalimat tersebut. Namun apabila diperhatikan pola chunking-nya, maka mispersepsi tersebut akan dapat dihindari. Kalimat pertama jika diterjemahkan ke dalam bahasa Indonesia, artinya ‘Lihatlah anjing bermata satu itu! Kalimat kedua artinya ‘Lihatlah anjing itu dengan sebelah mata saja!’. Tonalitas yang dibuat penutur asli bahasa Inggris acapkali membentuk connected speech. Connected speech yang menyerupai rantai ujaran yang tak terputus ini menimbulkan persoalan yang kompleks karena bunyi kata demi kata cenderung tidak jelas dan sulit diidentifikasi pihak yang mendengarkan. Menurut Bond (2006:292) mispersepsi yang timbul sebagai akibat dari adanya connected speech ini terjadi pada tataran fonetik, fonologi, kosakata, dan sintaks. Pada

tataran fonetik kesalahan mengenali bunyi ujaran lebih banyak terjadi pada bunyi-bunyi ‘konsonan’ dibanding ‘vokal’. Contoh-contoh berikut memberikan gambaran mengenai kekeliruan dalam mengenali bunyi-bunyi konsonan karena tidak tertangkapnya konsonan pada kata-kata tertentu:

(1) When their condition → air condition; /wen ðeə kənˈdɪʃn̩/ /eə kənˈdɪʃn̩/ (2) The only poor meet → the only poor me. / ði ˈəʊnli pʊə miːt/ /ði ˈəʊnli pʊə miː/ Bond (2006: 293) Hilangnya konsonan pada posisi awal seperti yang terjadi pada contoh nomor (1) adalah karena adanya kecenderungan terjadinya pergeseran tekanan kata dari kata bertekanan lemah (their) ke kata bertekanan kuat (condition) dan karena adanya asimilasi bunyi antara /wen/ dan /ðeə/ di mana bunyi /ð/ mengalami pelesapan. sehingga terdengar seperti /-eə/. Sementara pada contoh (2) tidak terdeteksinya konsonan dalam posisi akhir terjadi karena adanya tekanan silaba yang cenderung melemah pada suku akhir sehingga kurang terdengar bunyinya. Kekeliruan dapat pula terjadi karena kehadiran konsonan palsu (spurious consonants). Konsonan palsu muncul karena adanya asosiasi dengan word boundary misassignments sehingga mengecoh bunyi kata yang didengarnya, seperti contoh berikut: (3) slip of the ear → slip of the year; /slɪp əv ði ɪə/ /slɪp əv ðə ˈjiə/ (4) Tapas bars /tæpəs bɑːz/

→ Topless bars. /tɒpləs bɑːz/

(Bond, 2006: 293)

Bagi non penutur asli, tautan bunyi yang gagal ditangkap telinga sehingga menimbulkan mispersepsi menjadi persoalan tersendiri. Hal ini karena input yang masuk tidak mungkin dapat direspons dengan benar oleh penyimak. Jika peristiwa ini terjadi pada seorang peserta tes yang

sedang mengerjakan tes kemampuan mendengarkan bahasa Inggris, tentu akibatnya menjadi fatal. Dia akan mengalami kesulitan menjawab pertanyaan dengan cepat; padahal waktu yang disediakan lazimnya sangat pendek. Perhatikan contoh soal Listening Comprehension yang memiliki kemungkinan menciptakan distraksi pada diri peserta tes.

Suara narator :

Doris took it to the closet. /dɒrɪs tʊk ɪt tə ðə ˈklɒzɪt/

Opsi jawaban:

(A) I told Doris to close it. /aɪ təʊld dɒrɪs tə kləʊz ɪt/ (B) I took the doors off to the closet. /aɪ tʊk ðə dɔːz ɒf tə ðə ˈklɒzɪt/ (C) Doris clipped the dog’s claws. /dɒrɪs klɪpt ðə ˈdɒɡz klɔːz/ (D) Doris put it in the cabinet. /dɒrɪs pʊt ɪt ɪn ðə kæbɪnət/

ˈSoal seperti di atas diperkirakan sulit dikerjakan oleh mereka yang tidak memiliki kemampuan rekognisi bunyi yang memadai. Perhatikan pilihan (A) I told Doris to close it. Kata close dan it terdengar sama dengan closet. Peserta yang tidak memahami makna kalimat secara keseluruhan akan terdistraksi dengan pilihan ini karena gagal mengenali bunyi close it yang dipilih oleh pembuat soal untuk mengecoh bunyi kata closet. Demikian pula pilihan (B) I took the doors off to the closet. Kata doors berhomofon dengan kata Doris sehingga kemungkinan peserta tes juga bimbang dengan pilihan ini. Pilihan (C) Doris clipped the dog’s claws, walaupun secara keseluruhan amat jauh dari padanan kalimat soal, bagi peserta yang memiliki kemampuan terbatas akan berpeluang mengecoh juga, terutama hadirnya kata claws yang ketika diucapkan dekat dengan ucapan closet. Sementara pilihan (D) Doris put it in the cabinet, bagi peserta

dengan kemampuan terbatas mungkin malah tidak dipertimbangkan sebagai jawaban karena efek-efek bunyi yang tercipta tidak sedekat tiga pilihan lainnya.

Ini membuktikan bahwa

rekognisi bunyi memiliki peran penting dalam proses pemahaman teks lisan berbahasa Inggris (Gear dan Gear, 1996). Dengan mempertimbangkan tingginya kemungkinan terjadinya mispersepsi bunyi sebagai akibat dari adanya connected speech, maka perlu dilakukan telaah mendalam tentang aspek-aspek yang berhubungan dengan connected speech ini. Fenomena connected speech ini perlu dibedah sampai sekecil-kecilnya sehingga terjadinya mispersepsi dapat direkonstruksi pada bagian mana mispersepsi itu terjadi. Bagian-bagian yang harus dilihat dengan teliti dalam connected speech menurut Roach (2005) adalah: (1) rhythm, (2) assimilation, (3) Elision, dan (4) linking.

1.7. 10 Ritme Menurut Roach (2005: 136) Ritme atau rhythm adalah pola intonasi bahasa berupa tekanan-tekanan ritmis yang diucapkan secara selaras mengikuti pola interval tempo yang sama. Bahasa Inggris sering dikatakan sebagai bahasa yang ritmis, yakni ritmenya dapat dideteksi dari adanya tekanan silaba pada interval tempo yang sama. Keajegan tempo ini jangan diartikan seperti ajegnya jalannya jarum jam; keajegan ini bersifat relatif. Menurut Roach stress-timed rhythm itu hanyalah karakteristik dari sebuah gaya bicara, dan tidak melekat pada ujaran bahasa Inggris secara keseluruhan. ..one always speaks with some degree of rhytmicality, but the degree varies between a minimum value (arhythmical) and a maximum value (completely stress-timed rhythm. (ibid:137). Dalam berbagai literatur dikatakan bahwa bahasa Inggris tergolong dalam bahasa berkategori stress-timed language. Proponen teori stress-timed language adalah Abercombie

(1967) yang pandangannya begitu berpengaruh pada pemahaman bahasa Inggris sebagai stresstimed language hingga sekarang. Menurut Abercombie, dilihat dari pola ucapannya, bahasa di dunia dapat dikelompokkan menjadi dua, yakni stress-timed language dan syllable-timed language. Dalam stress-timed language, stress atau tekanan terjadi pada interval waktu yang sama (time isochrony); sementara dalam syllable-timed languages, tekanan silaba akan jatuh pada interval waktu yang sama (syllable isochrony). Dengan melihat keteraturan interval temponya, maka bahasa Inggris dapat dikategorikan sebagai stress-timed language. Dalam praktiknya, bahasa berkategori stress-timed language tidak sulit untuk didemonstrasikan. Underhill (1994:28), misalnya dalam buku panduan stress-timed language untuk para guru bahasa Inggris sebagai bahasa kedua atau sebagai bahasa asing menunjukkan contoh-contoh bagaimana stress-timed language itu diperagakan. Berikut dicuplikkan salah satu contoh yang diperagakannya: a. YOU

ME

HIM

HER HER

b. YOU

and

ME

and

HIM

c. YOU

and

ME

and

HIM

and

HER

d. YOU

and

ME

and

HIM

and

HER

e. Dst. Dalam contoh di atas terlihat betapa teraturnya jatuhnya tempo tekanan beserta intervalnya, sekali pun pada contoh a, b, dan c terdapat perbedaan isi pada interval-intervalnya. Menurut Abercombie keteraturan demikian merupakan dasar-dasar dari lahirnya sajak (1967: 98).

Hipotesis Abercombie ini diikuti oleh banyak pengikut seperti Underhill (1994),

Cruttenden (1997), Ball dan Rahilly (1999), dan Rogers (2000). Sekalipun pandangan Abercombie tentang stress-timed language dan syllable-timed

language memiliki banyak pengikutnya hingga sekarang, sebenarnya dua dekade setelah lahirnya hipotesis tersebut, pandangan ini dikritik oleh Roach (1982: 137)).

Dengan

menggunakan sampel 6 subyek yang bahasa pengantarnya digunakan sebagai dasar acuan Abercombie, yakni Perancis, Telugu, Yoruba (syllable-timed language) dan bahasa Inggris, Rusia, dan Arab (stress-timed language) Roach membuktikan bahwa bahasa-bahasa yang diberi label stress-timed ternyata memiliki variabilitas yang lebih tinggi pada panjangnya inter-stress interval dibanding bahasa-bahasa yang diberi label syllable-stressed languages. Ini berarti, jatuhnya tempo pada interval tidak isochronous. Pada tahun yang hampir bersamaan, Dauer (1983: 51-62) juga mengadakan penelitian mengenai stress-timed dan syllable-timed languages. Dia menggunakan rekaman dari dua bahasa berlabel stress-timed, yakni bahasa Inggris dan Thai, satu bahasa berbasis syllable-timed, yakni Spanyol, dan dua bahasa yang belum diklasifikasikan jenisnya yakni bahasa Italia dan Yunani. Dari penelitiannya itu Dauer menyimpulkan bahwa ternyata tidak ditemukan adanya perbedaan yang berarti di antara bahasa yang ditelitinya itu. Menurut Dauer, yang membedakan adalah kecepatan yang digunakan. Ketika para subyek menggunakan kecepatan ekstrim terlihat bahwa ternyata bahasa dengan basis stress-timed memperlihatkan variabilitas pada panjangnya interstress interval. Penelitian yang dilakukan oleh Roach (1982) dan Dauer (1983) ini sebenarnya telah memberikan pertanda bahwa hipotesis Abercombie tidak seluruhnya benar. Sinyalemen in relatif sama dengan hasil penelitian Couper-Kuhlen (1993:27) yang menyebutkan bahwa bahasa Inggris bukanlah bahasa yang isochronous. Namun Couper-Kuhlen tidak dengan sangat tegas mengatakan demikian. Dengan fokus penelitian pada persepsi pendengar dalam mengidentifikasi ‘rantai isokroni’ (isochronous chain). Couper-Kuhlen menyimpulkan bahwa bahasa Inggris

tidaklah 100% stress-timed. Ditinjau dari perspektif yang luas, bahasa Inggris tidak isochronous; namun jika ditinjau dari perspektif mikro, bahasa Inggris dapat dikatakan isochronous. Jadi, sampai

pendapat Couper-Kuhlen dipublikasikan memang masih belum ada clear-cut atau

batasan yang jelas tentang status bahasa Inggris sebagai bahasa yang memiliki stress-isochrony atau bukan. Predikat stress-timed atau syllable-timed language pada bahasa tertentu agaknya sulit ditinggalkan. Laver (1994) misalnya mengemukakan bahwa sulitnya meninggalkan konsep stress-timed language merupakan indikasi kuatnya teori tersebut; sementara Crystal (1996:11) meyakini bahwa istilah stress-timed language akan tergantikan manakala telah lahir klasifikasi baru yang lebih akurat. Dalton dan Seidfolder (1994:19) mengungkapkan bahwa sekalipun telah terbukti ada banyak indikasi ketidak akuratan teori stress-isochrony dan syllable isochrony, stress-timed dan syllable-timed languages adalah istilah yang sulit untuk ditolak dan kenyatannya sampai sekarang masih banyak dipakai oleh para pakar bahasa. Pada tahun 2004, seorang pakar speech perception Richard Cauldwell menyampaikan pandangannya secara radikal tentang pola ucapan bahasa Inggris. Menurut Cauldwell (2004:4) apa yang dikatakan para pakar sebelumnya bahwa: 1. Yes/no questions memiliki intonasi naik 2. Wh-questions memiliki intonasi turun 3. Bahasa Inggris adalah bahasa berbasis stress-timed 4. Bahasa Perancis adalah bahasa berbasis syllable-timed 5. Intonasi naik-turun berarti ‘surprise’ 6. Tone dengan lagu naik turun berarti ‘I’m not certain’ tidaklah benar. Bukti-bukti yang disodorkannya menolak hipotesis ini. Menurut Cauldwell,

ucapan sehari-hari diwarnai dengan hal-hal yang berlawanan dengan hipotesis di atas. Perihal mengapa sampai sekarang hipotesis Abercombie masih dipakai banyak pakar bahasa, Cauldwell secara tegas mengatakan bahwa karena dunia pengajaran bahasa Inggris tidak memiliki ilmuwan bunyi ujaran yang memadai, maka apa yang terjadi cenderung dicari dasar pembenarannya dengan menggunakan hipotesis Abercombie. Cauldwell mengkritik bahwa jika ilmuwan mendapatkan hipotesisnya runtuh, maka mestinya ia memulai lagi dengan hipotesis baru. Namun yang terjadi, dunia pengajaran bahasa Inggris tidak memiliki speech scientists yang dibanggakan di bidang ini, yang ada seolah-olah hanya speech priests. Walhasil,

manakala hipotesis

bertentangan dengan kenyataan, hipotesis tersebut tetap diikuti, seolah-olah hipotesis itu menjadi artikel ‘sakral’ yang harus ‘diimani’ kebenarannya (Cauldwell, 2004:2) Menurut Cauldwell (2004:4) ada beberapa alasan mengapa dunia pendidikan bahasa Inggris tidak memiliki speech scientist, tapi speech priests. Dengan mengutip pandangan Richard Dawkins (1996) Cauldwell mengatakan bahwa kita cenderung terperangkap dalam TAR, yakni Tradition, Authority, dan Revelation. Selama ini kita selalu ketat mengikuti apa yang ditulis dalam buku-buku yang diwariskan dari generasi satu ke generasi lain (Tradition); kita selalu percaya penuh pada apa yang disampaikan oleh orang-orang yang kita anggap pakar (Authority); dan kita selalu mengalami proses ‘private thinking’ yang terus menerus sampai kita yakin akan adanya kebenaran tertentu (Cauldwell, 2002:7). Selama ini kita amat patuh dan menjunjung tinggi tradisi dan mengikuti dengan begitu yakin apa yang disampaikan oleh orang yang kita anggap ahli sehingga apa yang terjadi adalah lahirnya kesenjangan antara apa yang dipelajari dan apa yang kita alami di dunia nyata (Cauldwell, 2002:7). Pandangan Cauldwell seperti inilah yang mendasari pemikiran-pemikirannya yang merupakan paradigma baru dalam dunia speech sciences, yakni bidang ilmu yang berhubungan dengan bunyi-bunyi ujaran, termasuk di

antaranya tentang pola-pola ucapan bahasa. Bunyi-bunyi ujaran dalam bahasa Inggris yang terdengar selama proses komunikasi timbal balik atau dialog

berlangsung sering tidak teratur iramanya dan acapkali memaksa

pendengar untuk memperhatikan keras lemahnya bunyi agar dapat dipahami dengan pasti makna pesan yang disampaikan pihak yang berbicara. Pihak yang berbicara memiliki otoritas penuh atas diksi yang digunakan, keras lemahnya suku kata atau kata yang dia tekan, dan intonasi yang dialunkannya. Hal ini sejalan dengan apa yang disampaikan Brazil (1995: 26-39) bahwa bunyi ujaran dalam peristiwa komunikasi timbal balik cenderung bersifat speaker-controlled, purposedriven, interactive, cooperative, context-referenced, dan context-changing. Untuk itu, agar pihak yang mendengarkan

(listener) dapat memahami informasi yang disampaikan pihak yang

berbicara

maka

(speaker),

listener

harus

memperhatikan

betul

bagaimana

speaker

menyampaikan informasinya. Speaker adalah pihak yang memproduksi ujaran. Dengan demikian speaker merupakan “the agents of rhythm”. Semua yang berkaitan dengan pola ucapan baik segmental maupun supra segmental, seperti ucapan bunyi-bunyi tertentu, keras lemahnya kata, naik turunnya intonasi, tone-unit, merupakan fakor dominan yang menentukan irama bunyi ujaran. Dan faktorfaktor inilah yang merupakan faktor penting dari pola ucapan bahasa Inggris (Cauldwell, 2005). Faktor ini pula lah yang harus diperhatikan listener agar dia mampu mempersepsi bunyi ujaran dengan benar. Tidak seperti para pendahulunya yang selalu mengaitkan, atau kalau perlu memaksa setiap bunyi ujaran agar selalu berirama mengikuti

interval tempo yang sama, Cauldwell

(2002:6) berpandangan bahwa rhythm bahasa dapat saja memiliki interval tempo yang sama tapi dapat pula tidak. Bagi Cauldwell (2002:6) sama atau tidaknya interval tempo yang terjadi

semata-mata karena sifat bahasa yang elastis, yang dikatakannya sebagai plasticity of speech. Dengan demikian, yang terpenting saat seseorang mempersepsi bunyi ujaran adalah memahami elastisitas atau plastisitas bunyi ujaran bahasa yang didengarkannya. Inilah pemikiran yang melahirkan paradigma baru dalam Speech Perception. Dengan paradigma baru ini, seseorang tidak lagi menunggu irama yang ‘ajeg’, tapi yang bersangkutan harus memperhatikan betul elastisitas ujaran. Dengan demikian dia dapat memperhatikan bagian mana yang dianggap penting (prominence) dan diberi penekanan kuat (tonic); bagian mana yang seolah-olah hilang tak terdengar karena pengaruh keras lemahnya bunyi ujaran; atau karena mengikuti naik turunnya intonasi, juga mengikuti persesuaian antara bunyi satu dengan bunyi-bunyi lain dalam satuan-satuan yang disebut Cauldwell (2002) sebagai tone-unit. Apa yang dikatakan Cauldwell (2002) bahwa dalam persepsi ujaran, yang penting adalah memahami elastisitas atau plastisitas bunyi ujaran bahasa sebenarnya sejalan dengan pandangan Giegerich (1992) sekalipun Giegerich lebih berorientasi pada keserasian kaki (foot isochrony). Menurut Giegerich (1992) pemahaman tentang stress timed language dan syllable timed language itu sangatlah bias. Orang mengatakan bahasa Inggris tergolong dalam stress-timed language, kenyataannya timing-nya tidak selalu sama. Giegerich (1992) selalu mengatakan dengan tambahan kata ‘roughly’ ketika mengacu pada time isochronous. Ia menyebutnya sebagai roughly isochronous. Pada saat yang sama, Giegerich (1992) juga tidak tegas menyebut syllable isochronous untuk bahasa Inggris. Menurutnya, bahasa Inggris lebih dekat ke time-isochronous daripada syllable-isochronous. Padahal seperti yang dikatakan Giegerich (1992), bahasa Inggris tidaklah sepenuhnya time-isochronous. Dengan demikian tidak ada perbedaan pandangan antara Cauldwell (2002) dan Giegerich (1992) tentang adanya elastisitas atau plastisitas bunyi ujaran dalam ujaran bahasa Inggris.

Menurut Giegerich (1992), untuk memberikan gambaran yang komprehensif tentang pola tekanan dalam bahasa Inggris dapat digunakan metrical phonology sebagai konsep acuan tekanan keras dan tekanan lemah. Metrical phology ini dapat dituangkan dalam metrical tree dari sebuah frasa intonasi kalimat tertentu. Dengan membaca metrical tree sebuah kalimat, seseorang dapat mengidentifikasi ritme sekaligus tekanan-tekanan kuat dan tekanan-tekanan lemah sebuah frasa intonasi. Metrical tree yang digunakan dalam analisis tekanan untuk disertasi ini mengacu pada metrical tree yang diusulkan Giegerich (1992). Dalam Metrical tree usulan Giegerich ini, frasa intonasi atau intonation phrase (IP) sebuah kalimat dianalisis elemen-elemenya, yakni silabelsilabel kalimat dalam formasi elemen biner yang membentuk struktur kaki (foot) dari frasa intonasi kalimat tersebut. Menurut Giegerich (1992) metrical tree secara structural dapat dibuat berdasarkan struktur sintaksisnya atau pun struktur fonologinya. Berikut adalah contoh kalimat dengan sebaran tekanan kuat dan tekanan lemah yang digambarkan dengan menggunakan metrical tree dengan mengacu pada struktur sintaksis.

IP S S W

S S

W

S

W S

S S

S

W

W

S

Lots

W of

W S W em ploy ers

W in

ist

W on

S W W word pro cess ing

W ex

S pe

W ri

W ence

Gambar 1.5 Metrical tree berorientasi sintaksis (Giegerich,1992:263) Metrical tree dalam gambar 1.5 adalah metrical tree yang berorientasi pada ranah sintaktik dari pada fonologi (syntax overrides phonology) sekalipun elemen-elemen yang dipercabangkan adalah elemen fonologi, yakni elemen bertekanan kuat (S) dan elemen bertekanan lemah (W). Menurut Giegerich (1992) metrical tree seperti ini mengandung kelemahan karena formasi footnya terganggu, terutama untuk kata-kata yang tergolong dalam function words. Formasi foot sebagaimana ditunjukkan gambar 1.5 bukanlah formasi yang dapat diterima sebagai unit fonologi. Dengan demikian metrical tree yang berorientasi ke sintaksis tidak direkomendasikan untuk analisis metrical phonology (hal. 262) Giegerich (1992) memberikan rekomendasi bahwa untuk penempatan elemen-elemen biner dalam formasi kaki yang membentuk frasa intonasi, orientasinya harus ke fonologi, bukan sintaksis (phonology overrides syntax). Konfigurasi seperti ini akan memungkinkan kaki-kaki (feet) menjadi satuan fonologi. Gambar berikut adalah gambar metrical tree dengan orientasi fonologi. IP

W

S S S

W W

S

W

W

S S

S S Lots

S W of

W S W W em ploy ers in

S S ist

S

W S W W on word pro cess ing

W ex

S pe

W ri

W ence

Gambar 1.6 Metrical Tree berorientasi fonologi (Giegerich, 1992: 265)

Gambar 1.6 menunjukkan metrical tree yang berorientasi pada fonologi. Dalam gambar tersebut tampak bahwa semua elemen, termasuk elemen yang berasal dari function words masuk dalam ikatan biner membentuk kaki-kaki frasa intonasi (Giegerich, 1992: 265). Metrical tree yang direkomendasikan oleh Giegerich (1992) dapat digunakan untuk mengidentifikasi sebaran tekanan keras dan tekanan lemah dari elemen-elemen pembentuk frasa intonasi. Tapi untuk mengetahui lokasi terjadinya kesalahan persepsi (mispersepsi) pada elemen tertentu dalam frasa intonasi, model analisis Cauldwell (2002) lebih mudah untuk diaplikasikan. Alasannya, dalam model Cauldwell (2002) tekanan kuat dan tekanan lemah telah diberi istilah masing-masing sehingga mudah untuk dijadikan acuan dalam pembahasan. Adapun istilah yang lazim digunakan Cauldwell (2002) untuk frasa intonasi adalah tone unit; untuk elemen-elemen bertekanan lemah adalah proclitic, interval clitic, dan enclitic; dan untuk elemen-elemen bertekanan kuat diberi istilah onset, middle tonic, dan tonic. Pada bagian berikut, dipaparkan tentang tone unit dan elemen-elemen pembentuknya.

1.7.11 Tone-unit dan elemen-elemen pembentuknya Tone unit yang juga sering disebut sebagai intonational phrase adalah sebuah konstruksi fonologi yang memiliki elemen-elemen pembentuk yang terdiri dari clitics dan tonic (Cauldwell,

2002). Clitics merupakan bentuk terikat yang melekat pada tonic sebuah frasa intonasi, dan tonic merupakan bagian dari tone unit berupa kata atau suku-kata yang mendapat tekanan kuat dalam satuan tersebut (Katamba, 1994: 242). Dengan demikian tone unit merupakan frasa intonasi yang dibangun dari unsur-unsur pembentuk frasa intonasi yang meliputi clitics dan tonic. Clitic merupakan unsur yang tidak pernah mendapat tekanan kuat (unaccented). Ia melekat pada sebuah tonic yang berada di depan atau pun di belakangnya. Clitic yang melekat pada sebuah tonic yang berada di belakangnya atau yang berada di samping kanannya disebut proclitic; sementara clitic yang melekat pada sebuah tonic yang berada di sebelah kirinya disebut enclitic (Katamba, 1994: 245). Menurut Halpern (dalam Spencer &Zwicky, 2001:101) clitics baik proclitic maupun enclitic merupakan unsur tone unit yang secara fonologis memiliki tekanan yang lemah dan sering mengalami proses reduksi bunyi ketika melekat pada tonic. Ketika sebuah frasa intonasi memiliki dua unsur yang mendapat tekanan kuat, maka di antara unsur bertekanan kuat pertama (onset) dan unsur bertekanan kuat kedua (tonic) akan dijembatani oleh sebuah interval clitic. Selanjutnya jika sebuah tone unit memiliki tiga unsur bertekanan kuat maka di antara unsurunsur bertekanan kuat itu terdapat pula interval clitic yang menjembatani masing-masing tonic. Dengan demikian sebuah tone unit dapat terbentuk dari : (1) Proclitic + tonic + enclitic, (2) proclitic + onset + interval + tonic + enclitic, (3) proclitic + onset + interval +middle tonic + interval+tonic+enclitic Secara garis besar, bunyi ujaran dalam bahasa Inggris dapat dibagi menjadi: (1) singleprominence tone unit, (2) double-prominence tone unit, dan (3) triple prominence tone unit (Cauldwell, 2002). Terkadang, terdapat pula quadruple prominence tone unit. Batas-batas toneunit amatlah sukar untuk didefinisikan secara pasti. Hal ini karena adanya elastisitas bunyi ujaran

bahasa Inggris yang sulit diprediksi pihak yang mendengarkan. Listener hanya pasif mengikuti apa saja yang dikehendaki speaker saat speaker memutuskan untuk memberi tekanan pada suku kata tertentu atau menunda penekanan karena masih ada bagian yang perlu diselipkan (interval) di antara bagian yang akan diberi penekanan (tonic). Perlu ditegaskan bahwa konsep tone-unit Cauldwell tidaklah sama dengan tone-unit yang pernah disampaikan oleh Crystal (1969) dan Halliday (1967, 1994). Dalam konsep Crystal dan Halliday, tone unit dapat bermuatan lebih dari satu tone, sementara dalam konsep Cauldwell, dalam satu tone-unit hanya ada satu tone saja.

1.7.11.1 Single-prominence tone-units Dari eksperimennya yang menggunakan rekaman-rekaman dialog berjudul ‘Moving Again’, ‘Houses in New Zealand’, dan ‘Voices in the University’,

Cauldwell (2002:12)

menunjukkan bahwa Single-prominence tone-unit memiliki struktur sebagai berikut:

Tabel 1.3 Struktur single-prominence tone-unit 1

2

3

element

proclitic

tonic

Enclitic

words/syllables

when he

SELLS

his house

weni

selz

iz haʊs

duration (ms)

186

369

517

Dalam tabel 1.3 terlihat struktur tone-unit dengan elemen-elemen proclitic, tonic, dan enclitic. Kolom dengan warna gelap menunjukkan bagian yang dianggap prominence (penting)

dan yang berwarna terang menunjukkan bagian yang dianggap non-prominence. Angka pada baris akhir menunjukkan durasi elemen-elemen tone-unit dalam hitungan milliseconds (ms). Pada tabel di atas proclitic ‘when he’ berlangsung sangat cepat, yakni 186 ms. Hal ini disebabkan karena setelah proclitic akan segera muncul tonic-nya atau tekanan kuatnya sehingga ucapan pada bagian proclitic cenderung terpengaruh, yakni bunyi /h/ pada kata ‘he’ cenderung luluh dan tak terdengar. Setelah bunyi SELL terdengar kuat, bunyi his house (elemen enclitic) kembali melemah mengakhiri tone-unit tersebut.

1.7.11.2 Double-prominence tone-units Jika Single-prominence tone unit hanya memiliki satu tone saja, maka doubleprominence tone units memiliki dua tones sekaligus yang elemen-elemen lengkapnya sebagai berikut: Tabel 1.4 Struktur Double-prominence tone-unit

Elements

1

2

3

4

5

Proclitic

Onset

Interval

Tonic

enclitic

BUILT

for her

Words/syllables he’s

HA ving a house

/hiz

hæ vɪŋ ə haʊs

Duration (ms)

148

122

493

bɪlt 216

fərə 442

Dalam tabel 1.4 terlihat Double-prominence tone units yang berstruktur lima elemen: dua elemen prominence (onset dan tonic) dan tiga elemen non-prominence (proclitic, interval, dan enclitic). Adanya dua elemen prominence membuat rhythm naik turun mengikuti bagianbagian yang berperan dalam ujaran tersebut. Bagian proclitic diucapkan cepat sekali, yakni 148

ms, sementara bagian enclitic berlangsung lebih lama dari proclitic, yakni 442 ms. Di tengahtengah dua tonic (onset tonic dan final tonic) terdapat satu interval berdurasi 493 ms (Cauldwell, 2004: 13)

1.7.11.3 Triple-prominence tone-units Jenis tone-unit ketiga yang dilaporkan oleh Cauldwell (2002:14) adalah Tripleprominence tone-units yang memiliki tiga tones dengan elemen-elemen sebagai berikut: Tabel 1.5 Struktur Triple-prominence tone-units

elements

7

1

2

3

4

5

6

Proclitic

Onset

Middle

enclitic

FIVE

Interval (2) Months

Tonic

MOVE

Interval (1) Into in

TIME

[pause]

168

387

270

334

414

280

words/syllables which she’d duration (ms) 416

Dalam tabel 1.5 terlihat susunan triple-prominence tone-unit yang berstruktur tujuh elemen, yang terdiri dari tiga elemen prominence (onset, middle, tonic) dan empat elemen nonprominence (proclitic, interval 1, interval 2, enclitic). Elemen-elemen prominence onset, middle dan tonic mendapat penekanan lebih kuat daripada elemen-elemen lain. Tidak seperti doubleprominence tone unit yang hanya memiliki satu interval, triple-prominence tone-unit memiliki dua interval. Dalam proses menyimak bahasa Inggris sebagai bahasa asing, kemampuan individu mempersepsi bunyi ujaran amat penting perannya. Namun kemampuan ini tidaklah mudah dimiliki seseorang yang tidak mengenal betul anatomi tekanan dalam bahasa Inggris. Perihal proposisi bahwa persepsi bunyi ujaran memegang peran penting dalam proses mendengarkan

perlu ditelusur lebih lanjut. Penelitian ini difokuskan untuk mengungkap sejauh mana peran persepsi bunyi ujaran berperan dalam proses menyimak bahasa Inggris di Indonesia.

1.7.12 Asimilasi (Assimilation), Elisi (Elision), dan Liaison. Ada cukup banyak kajian yang menyoroti sulitnya mendeteksi bunyi ujaran bahasa Inggris bagi mereka yang berlatar belakang non-bahasa Inggris. Kesulitan ini berhubungan dengan banyak hal seperti kecepatan bicara (Giles and Smith, 1979), pola ucapan yang berbeda (Rivers 1968; Brown, 1990) dan adanya reduksi bunyi ujaran dalam peristiwa connected speech (Cauldwell 2003; Roach 2005; Wells 2006; Caree, 2009, Escudero, 2007, Bond 2000, Hewlett and Beck, 2006) yang semuanya mengarah pada terjadinya proses asimilasi bunyi. Hasil penelitian Giles dan Smith (1979:30) menunjukkan bahwa semakin tinggi kecepatan bicara seseorang semakin tinggi pula tingkat kesulitan mendeteksi bunyi ujaran secara akurat bagi pihak yang mendengarkan. Kesulitan-kesulitan mengidentifikasi bunyi ujaran secara akurat dalam informasi yang disampaikan dengan kecepatan di atas 188 kata per menit lebih banyak disebabkan oleh tidak jelasnya bunyi-bunyi yang harus diidentifikasi karena faktor berubahnya bunyi-bunyi ujaran sebagai akibat dari adanya persesuaian antara bunyi satu dengan bunyi lain. Kesulitan mendeteksi bunyi ujaran dalam bahasa Inggris juga dapat terjadi karena pola ucapan yang berbeda antara bunyi bahasa Inggris dan bunyi bahasa yang biasa dipakai individu yang bersangkutan. Menurut Rivers (1968) dan Brown (1990) agar seseorang dapat mendengarkan bunyi ujaran dalam bahasa Inggris dengan benar, maka ia harus mempelajari aspek fisik dari bahasa tersebut seperti fonetik, fonemik, morfologi, dan sebagainya. Tanpa mempelajari aspek fisik bahasa seperti ini, kesulitan memahami bunyi ujaran dalam bahasa

Inggris akan menghadang; karena absennya pengetahuan pola ucapan bahasa Inggris akan memposisikan bahasa ibu sebagai instrumen untuk mendeteksi bunyi ujaran yang tentunya tidak selalu akurat. Masalah ini akan menjadi rumit ketika seseorang yang tidak menguasai pola ucapan bahasa Inggris harus memahami bunyi ujaran yang diucapkan dengan kecepatan tinggi yang menyebabkan terjadinya perubahan bunyi vokal maupun konsonan sebagai akibat dari terjadinya interaksi bunyi-bunyi ujaran yang sulit diamati. Kesulitan ini akan menjadi semakin rumit ketika seorang non-penutur bahasa Inggris dihadapkan pada satu kenyataan bahwa bunyi-bunyi ujaran yang diucapkan oleh penutur asli bahasa Inggris sering mengalami penyusutan bunyi, seperti dalam fenomena connected speech (Cauldwell 2003; Roach 2005; Wells 2006; Caree, 2009, Escudero, 2007, Bond 2000, Hewlett and Beck, 2006). Cauldwell (2002:1) mengungkapkan bahwa para non-penutur asli bahasa Inggris yang telah belajar bahasa Inggris selama bertahun-tahun di negaranya, ketika datang ke sebuah negera berbahasa pengantar bahasa Inggris sering kaget mendapati bahasa yang dipelajarinya ternyata belum cukup untuk memahami bunyi ujaran yang diucapkan dengan cepat. Bunyi ujaran yang diucapkan penutur asli meluncur begitu deras secara verbal tanpa ada sekatsekat kata yang mudah untuk diamati. Kata satu dengan kata yang lain seolah terangkai dan menjadi bunyi lain yang sulit untuk dideteksi (Rost, 2002:13). Kesulitan-kesulitan yang digambarkan di atas, yakni adanya perubahan bunyi ujaran sebagai akibat dari diucapkannya kata-kata dalam kecepatan tinggi, adanya perbedaan pola ucapan pada bahasa ibu, juga adanya peristiwa connected speech yang membuat bunyi-bunyi ujaran sulit dideteksi harus dapat dianalisis dengan cermat. Pernyataan Rost (2002) bahwa bunyi ujaran yang diucapkan penutur asli mengalir begitu deras sehingga sekat-sekat antar kata atau frasa tak mungkin bisa dideteksi lagi oleh non penutur asli harus disikapi sebagai sebuah

tantangan yang mesti dicari solusinya. Dengan ditemukannya alat pengurai bunyi ujaran yang sekarang telah banyak dipakai di departemen fonetik universitas-universitas terkemuka di Eropah dan Amerika, apa yang diungkapkan oleh Rost sekarang ini tidak lagi merupakan misteri, tapi terbuka untuk analisis. Perkembangan alat bantu penelitian yang begitu pesat memungkinkan terjadinya revisirevisi pada pemahaman tentang pola analisis bunyi ujaran. Sebagaimana dikatakan Caree (2009:129), sekarang saatnya analisis bunyi ujaran tidak lagi berkonsentrasi pada konfigurasi artikulasi yang bersifat statis. Fakta menunjukkan bahwa bunyi ujaran mengalami proses dinamis mengikuti ruang-ruang yang dimasukinya. Dengan demikian, analisis bunyi ujaran pun harus dapat dipakai untuk mengurai konfigurasi artikulasi secara dinamis. Agar analisis bunyi ujaran ini dapat dilakukan dengan cermat dengan menggunakan alat bantu yang memadai, terutama untuk hal-hal yang berkaitan dengan terjadinya perubahan bunyibunyi ujaran sebagai akibat dari lingkungan bunyi

yang dimasukinya, maka diperlukan

pemahaman tentang proses-proses yang menyebabkan terjadinya bunyi ujaran seperti asimilasi, elisi, dan linking.

1.7.12.1 Asimilasi Asimilasi adalah peristiwa terkoneksinya sebuah bunyi ujaran dengan bunyi ujaran yang lain sebagai akibat dari persesuaian antara ‘bunyi akhir dari suatu kata’ dengan ‘bunyi awal kata lain’ di sebelahnya yang membentuk suatu paduan bunyi baru. Perubahan bunyi yang tercipta dapat berupa loncatan fonem akhir dari kata yang ada di depan ke fonem awal dari sebuah kata yang ada di belakangnya; atau dapat pula terjadi karena adanya loncatan fonem pertama dari sebuah kata ke bunyi akhir dari kata yang ada di depannya (Collins, 2008:34). Loncatan fonem

yang menimbulkan bunyi-bunyi baru ini bagi individu yang memiliki pengetahuan bahasa Inggris kurang memadai dapat menimbulkan kesulitan tersendiri, yang berujung pada terjadinya mispersepsi pada bunyi ujaran yang didengarkannya, baik pada taraf mispersepsi lokal maupun global. Mispersepsi lokal terjadi ketika bunyi yang tercipta pada kata atau frasa tertentu menimbulkan bunyi yang berbeda tapi tidak mengganggu makna dari kata-kata yang mengalami asimilasi; sementara mispersepsi global lazimnya terjadi ketika perubahan bunyi itu dipersepsi sebagai bunyi baru yang tidak ada hubungannya sama sekali dengan bunyi ujaran dari kata-kata yang diproduksi pihak yang berbicara. Menurut Roach (2002:138), derajat asimilasi bervariasi, bergantung pada gaya dan kecepatan bicara, namun secara umum terjadi pada ucapan yang cepat dan spontan. Asimilasi dapat terjadi antara konsonan satu dengan konsonan lain; yakni konsonan akhir atau final consonant (Cf) dan konsonan awal atau initial consonant (Ci). Oleh Roach, loncatan konsonan akhir dan konsonan awal digambarkan sebagai berikut: --------- Cf Ci --------batas kata

Jika Cf berubah menjadi Ci, maka asimilasi yang terjadi adalah ‘asimilasi regresif’ atau mundur; jika Ci berubah menjadi Cf, maka asimilasi yang terjadi adalah ‘asimilasi progresif’ atau maju (ibid hal. 139). Secara umum pola asimilasi dapat berupa asimilasi regresif; atau sering disebut juga sebagai leading assimilation dan anticipatory assimilation (contoh: /ə bip mʌtʃ/), asimilasi progresif; atau juga disebut sebagai lagging and preservative assimilation (contoh: / in nə kɔ:nə/), dan asimilasi timbal balik atau reciprocal assimilation, yakni asimilasi di mana kedua fonim yang berasimilasi mengalami perubahan bunyi pada masing-

masing fonem (contoh /ðɪʃ ʒɪə /). Perubahan-perubahan bunyi ujaran bagi penutur asli bahasa Inggris terjadi secara alami dan spontan. Sementara bagi non-penutur asli perubahan bunyi ujaran yang terjadi tidak harus dipelajari untuk maksud reproduksi seperti bunyi aslinya, tapi perlu dipelajari untuk dimengerti agar terhindar dari mispersepsi bunyi (ibid. 139-140). Setidaknya non-penutur asli memahami bahwa peluang terjadinya asimilasi sangat besar karena ada persesuaian antar kata di tempat artikulasi, juga pada cara asimilasi, dan pada bunyi bersuara dan tak bersuara. Dengan demikian asimilasi bunyi konsonan dapat terjadi pada tempat artikulasi, cara artikulasi, dan penyuaraan (voicing). Asimilasi yang terjadi pada tempat artikulasi lazimnya dinamakan ‘asimilasi tempat artikulasi’; pada cara artikulasi dinamakan ‘asimilasi cara artikulasi’; dan pada penyuaraan disebut ‘asimilasi suara’. Asimilasi tempat artikulasi dapat diamati secara jelas pada beberapa kasus di mana (Cf) alveolar bertemu dengan (Ci) non-alveolar. Sebagai contoh, konsonan akhir dalam kata /ðæt / adalah alveolar t. Ketika diucapkan dalam kecepatan tinggi bunyi t ini akan menjadi p sebelum konsonan bilabial, seperti dalam contoh-contoh berikut: /ðæp pɜ:sn /; /laɪp blu: /; <meat pie> /mi:p paɪ/.

Sebelum konsonan velar, bunyi /t/ akan

menjadi /k/ seperti dalam: /ðæk keis /; /braik kʌlə/; /kwaik ɡud /. Dalam konteks yang sama bunyi d akan menjadi b, d, and g; bunyi n akan menjadi m atau ŋ. (ibid. 140). Tidak seperti ‘asimilasi tempat artikulasi’, ‘asimilasi cara artikulasi’ tidak begitu mudah untuk dikenali. Asimilasi ini pun lazimnya terjadi pada ucapan yang sangat cepat dan dalam konteks yang tak formal.

‘Asimilasi cara

artikulasi’ ini mengalami perubahan cara yang

cenderung mengarah pada konsonan yang mengalami sedikit hambatan pada arus udara. Sebagai

contoh, dalam kasus di mana final plosive menjadi frikatif atau nasal, seperti: /ðæs saɪd / dan /ɡʊn naɪt /. Dalam kasus yang lain, ketika sebuah kata berfonem awal d mengikuti bunyi plosif atau nasal pada fonem akhir dari kata yang mendahuluinya maka kelaziman yang terjadi adalah Ci menjadi identik dengan Cf dalam hal cara artikulasinya, seperti contoh berikut:

/ɪn ðə/ /ɡet ðəm/ /ri:d ði:z/

/ɪnnə/ /ɡettəm/ /ri:ði:z/

Asimilasi suara juga acapkali terdengar dalam ucapan formal maupun tak formal. Pada umumnya asimilasi suara ini terjadi secara regresif. Jika Cf adalah konsonan lenis (bersuara) dan Ci fortis (tak bersuara) maka konsonan lenisnya menjadi tak bersuara. Jika Cf adalah fortis (tak bersuara) dan Ci-nya lenis (bersuara), maka asimilasi suara tak terjadi. Contoh: /aɪ laɪk ðət blæk dɒɡ/. Asimilasi suara juga sering terjadi pada sufik s yang melekat pada kata benda berbentuk jamak atau kata kerja yang mengikuti ‘orang ketiga tunggal’. Jika sufik tersebut mengikuti konsonan fortis (tak bersuara) maka bunyi s akan muncul; jika sufik mengikuti konsonan lenis (bersuara), maka bunyi z akan muncul. Berikut contoh-contoh yang diambilkan dari Roach (2002:141):

/kæts/ <jumps> /dʒʌmps/ <Pat’s> /pæts/

<dogs> /dɒgz/ /rʌnz / <Pam’s> /pæmz/

1.7.12.2 Elisi Secara singkat elisi dapat dikatakan sebagai peristiwa hilangnya fonim dari bentuk ideal

yang tergambar dalam sebuah kata, seperti: <steamed pudding> /sti:m pʊdɪŋ / /rɪˈdjuːst tu ə paʊnd/, / kəmˈprest faɪlz/.

Seperti halnya dalam asimilasi, elisi lazimnya terjadi dalam ucapan yang cepat dan spontan, sehingga bunyi fonem tertentu sulit terdeteksi dengan baik, karena kecenderungannya terjadi ‘overlap’ bunyi satu dengan yang lain. Contoh yang sering kita dengar dalam peristiwa komunikasi sehari-hari adalah kata seperti : <potato> /pteitəʊ/, /tmɑ:təʊ/, /phæps/, /tədeɪ/. Dalam hal konsonan, konsonan yang paling sering terpengaruh dalam elisi adalah konsonan yang berada dalam titik artikulasi alveolar, khususnya bentuk plosive /t d/ ketika terjadi dalam deret tiga konsonan. Berikut adalah contoh-contoh yang diambilkan dari Collins (2008: 61): <past tense> /pɑ:s tens / / ru:in ðə mɑ:kɪt / / lef lʌɡɪdʒ /

Untuk memberikan gambaran lebih rinci mengenai terjadinya elisi, berikut ditampilkan contoh-contoh elisi yang disarikan dari Collins (2008: 59-60) dan Roach (2005): (1). ,

<would> hanya diucapkan

d

(setelah bunyi vocal) dan

əd (setelah bunyi

konsonan). (2). , hanya diucapkan s (setelah konsonan fortis), dan z (setelah konsonan lenis); kecuali setelah s, z, ʃ, ʒ, tʃ, dʒ, is diucapkan iz dan has diucapkan əz.

(3). diucapkan

v (setelah vocal) dan əv (setelah konsonan).

(4). Elisi dapat terjadi pada bentuk schwa (lemah) atau suku kata yang tidak mendapat tekanan kuat, di mana /e/ diikuti sonoritas tertentu, seperti /l r n/, contoh: / histəri/ / trævəlɪŋ/ / fedərəl/

/histri/ /trævlɪŋ/ /fedrəl /

(5). Bunyi /h/ tidak terdengar dalam ‘function word’ sebagaimana terlihat dalam contoh berikut: / aɪ θɪŋk I wɪl əv təʊld ə/ (6). Elisi yang berhubungan dengan bunyi lemah juga terjadi pada dental fricative /d/ dalam <‘em> (7). Elisi /v/ dalam kata terjadi sebelum dental fricative / d/ atau dalam bunyi ujaran cepat sebelum konsonan-konsonan lain:

/ ə pi:s ə peipə / / əz ə mætrə fækt

1.7.12.3 Liaison Jika hakikat asimilasi adalah ‘berubahnya bunyi ujaran’, dan elisi adalah ‘hilangnya bunyi ujaran’, maka Liaison dapat dikatakan sebagai ‘munculnya bunyi ujaran baru’. Liaison merupakan fenomena munculnya bunyi ujaran, berupa konsonan yang menghubungkan bunyibunyi ujaran sekitarnya. Contoh kasus yang paling lazim dijumpai dalam bahasa Inggris adalah hadirnya bunyi /r/. Bunyi /r/ dalam bahasa Inggris tidak muncul (tidak diucapkan) jika menjadi fonem terakhir dari sebuah kata, seperti :

/hiə/ /fɔ:/

/fɑ:/ /fɑ:mə/

(Collins, 2008: 37) Namun ketika muncul dalam frasa, bunyi /r/ yang tadinya tidak muncul (non-pronounced) menjadi hidup dan merangkai kata di sebelahnya, dengan catatan apabila kata yang di sebelahnya itu diawali dengan vokal. Contoh-contoh berikut memberikan gambaran dimaksud: /hiə/ /fɔ:/ /fɑ: / /fɑ:mə/

‘here are’ /hiər ə/ ‘four eggs’ /fɔ:r eɡz/ ‘far away’ /fɑ:r əweɪ/ ‘the farmer isn’t here’ /ðə fɑ:mə r ɪznt hiə/

Kasus munculnya bunyi /r/ di atas sering disebut sebagai linking-r. Kasus ini tidak sama dengan intrusive /r/ yang juga merupakan bagian dari peristiwa liaison. Dalam intrusive /r/ hadirnya bunyi /r/ tidak dalam rangka memverbalkan bunyi /r/ yang tak diucapkan, tetapi memunculkan bunyi /r/ yang tadinya tidak ada. Contoh-contoh berikut menggambarkan munculnya intrusive /r/. <media event>

/mi:diər ɪvent/ /fɔ:mjələr eɪ/ /ɒstreliər ɔ:l aʊt/

Tidak seperti linking-r yang dapat dilacak keberadaannya dalam kata asal, intrusive /r/ tidak memiliki “historical justification” (Collins, 2008: 61), artinya tidak dapat dilacak keberadaannya karena memang tidak ada dalam ortografinya pada kata-kata di atas: ‘media (-) event’, ‘formula (-) A’, dan ‘Australia (-) all out’

1.8 Metode Penelitian Proses mendengarkan ujaran bahasa Inggris dipengaruhi oleh banyak hal, di antaranya,

pengetahuan bahasa, pengetahuan situasi, dan pengetahuan latar belakang (Bejar, 2000) kemampuan mempersepsi bunyi ujaran (Goh, 2000; Bond, 2006, Ingram 2007, Vandergrift, 2007; Sebastian-Gales, 2006), exposure terhadap bahasa yang dipelajari (Brown, 1990), short term memory (Jacquemot dan Scott, 2006; Ohata, 2006), kecerdasan jamak (Gardner, 1983), kemampuan meta-kognitif (Pierce, 2003), kemampuan kognitif (Teasdale dan Barnard, 1993), kemampuan afektif (Bialystok, 1985; Gardner, 1999), dan lain-lain. Setidaknya dari penelitian yang dilakukan oleh para peneliti sebelumnya, didapatkan gambaran umum bahwa faktor-faktor yang disebut di atas memiliki pengaruh yang kuat dalam proses mendengarkan ujaran bahasa Inggris. Sekalipun penelitian tentang kemampuan mendengarkan ujaran bahasa asing

telah

dilakukan secara meluas di berbagai negara di dunia dan saran-saran telah diberikan oleh para peneliti bagi perkembangan dunia pengajaran bahasa Inggris, terutama di bidang listening, persoalan listening masih tetap merupakan persoalan yang tidak mudah untuk diatasi dan memerlukan kajian-kajian yang lebih mendalam pada tataran mikro. Kajian tentang listening pada tataran demikian masih amat terbatas jumlahnya dan belum memberikan kontribusi yang signifikan. Penelitian ini dimaksud untuk mengkaji kesulitan-kesulitan memahami ujaran bahasa Inggris dilihat dari sudut pandang mikro,

yakni dengan meneliti kemampuan para subjek

penelitian mendeteksi elemen-elemen mikro bertekanan lemah (klitik) dan elemen-elemen bertekanan kuat (tonik) pada frasa intonasi yang diujikan. Untuk mendapatkan subjek penelitian yang diperlukan, langkah pertama yang dilakukan adalah dengan menjaring para ‘calon’ subjek penelitian yang memiliki skor TOEFL 310 – 667, dengan rentang skor listening 31 – 68. Diseleksinya para subjek dengan tentang skor terbuka dari 31 – 68 adalah untuk melihat kesulitan-kesulitan pempersepsi ujaran bahasa Inggris sebagai

bahasa asing di Indonesia: siapa saja yang mengalami kesulitan dalam mempersepsi bunyi ujaran dan apa saja penyebab terjadinya kesulitan persepsi. Secara garis besar, prosedur penelitian dilakukan dengan urutan:

NO Prosedur Penelitian 1 TOEFL

2

3

Listening Test dalam dua versi A- Tanpa Transkrip B- Dengan Transkrip

Speech Perception Test

Tujuan

Hasil yang diharapkan

Untuk menjaring subjek Data pengelompokan penelitian yang memiliki skor subyek berdasarkan skor Listening dengan rentang 31 Listening – 68 sebagaimana diharapkan A. 31 – 40 dalam penelitian ini. B. 41 – 45 C. 46 – 50 D. 51 – 55 E. 56 – 60 F. 61 – 68 Untuk memastikan apakah subyek penelitian itu sebenarnya memiliki masalah dalam Listening (sehingga perlu diteliti secara mendetail) atau masalah bahasa secara umum saja.

Untuk menguji apakah kemampuan persepsi bahasa Inggris seseorang berkorelasi dengan kemampuan mengerjakan tes Listening. Gambar 1.7 Prosedur penelitian disertasi

Signifikansi perbedaan Listening Versi A dan Bersi B

Korelasi antara kemampuan persepsi dengan skor Listening

1.8.1 Sampel Penelitian Kriteria untuk sampel yang digunakan dalam penelitian ini adalah orang Indonesia dewasa berusia 20 tahun sampai 40 tahun yang memiliki kemampuan bahasa Inggris beragam dengan jenjang kemampuan antara 310 – 667 dalam skala TOEFL. Dalam penelitian ini jenis

kelamin tidak dipertimbangkan karena yang diutamakan adalah mereka yang memiliki skor sebagaimana tertera dalam kriteria di atas. Penelitian ini juga tidak mempertimbangkan apakah subjek pernah tinggal di negara berbahasa pengantar bahasa Inggris. Yang penting adalah bahwa subjek memiliki skor antara 310 – 667. Alasan yang digunakan mengapa jenis kelamin dan exposure bahasa Inggris tidak dipertimbangkan adalah karena fokus dari penelitian ini adalah persepsi fonologi terhadap ujaran bahasa Inggris. Tinjauannya mengarah pada micro skill bukan pada aspek-aspek lain. Sampel yang digunakan dalam penelitian ini mahasiswa S1, S2, dan S3 tanpa melihat latar belakang jurusan mereka. Dipilihnya mahasiswa dengan tidak membatasi jenjang strata ini adalah untuk mendapatkan sampel populasi yang beragam dengan kemampuan bahasa Inggris yang bervariasi sesuai dengan pengelompokan yang dikehendaki dalam penelitian ini. Oleh karena sampel yang diperlukan dalam penelitian ini mencakup para pembelajar bahasa Inggris dengan kemampuan bahasa Inggris berjenjang dari skor terendah 310 sampai skor tertinggi 677, dilakukanlah penjaringan subjek penelitian dengan cara mengundang sebanyak-banyaknya calon subyek penelitian yang memiliki skor sesuai dengan maksud penelitian ini. Kesulitan yang dihadapi adalah langkanya calon subjek penelitian yang memiliki rentang skor di atas 550 dalam skala TOEFL.; terlebih lagi para calon subjek penelitian yang memiliki skor di atas 600. Awalnya sejumlah 50 mahasiswa S1 UGM secara acak dilibatkan, tapi hasilnya terlihat ada sebaran skor yang tidak merata, dan tidak ada satu calon subjek penelitian pun yang dapat meraih skor 550. Pada kelompok berikutnya dilibatkan lagi 50 orang mahasiswa dengan jenjang studi gabungan S1, S2, dan S3. Hasil tes menunjukkan rentang skor yang tidak jauh dari tes pertama yakni hanya ada 2 peserta yang meraih skor di atas 550. Pada screening test ketiga,

jumlah calon subyek penelitian yang dilibatkan ditingkatkan menjadi 60 peserta dan para mahasiswa Sastra Inggris dan Karya siswa dari Bappenas yang tengah mengikuti pre departure training program di PPB UGM dilibatkan. Mereka adalah para peserta yang berasal dari seluruh Indonesia yang telah belajar khusus persiapan IELTS dan IBT selama 900 jam di PPB UGM. Dari screening test ketiga didapatkan data yang lebih baik dari tes pertama dan kedua. Dari 60 peserta itu terdapat 6 peserta yang meraih skor di atas 600. Jadi, secara kesuluruhan calon subjek penelitian yang dilibatkan mencapai jumlah 160 mahasiswa berlatar belakang S1, S2, dan S3. Untuk kepentingan penelitian ini, skor selain Listening Comprehension, yakni Structure and Written expression dan Reading Comprehension diabaikan. Dari hasil tes Listening Comprehension dipilih 30 subjek penelitian. Mereka dikelompokkan menjadi enam berdasarkan rentang skor yang mereka capai. Kelompok A adalah kelompok yang mewakili subjek dengan converted score dalam range 31-40, kelompok B: 41 – 45; kelompok C: 46 – 50; kelompok D: 51 – 55, kelompok E: 56 – 60; dan kelompok F: 61 – 68. Dikelompokkannya para subjek penelitian dalam wilayah skor tertentu itu untuk melihat hubungan apakah jenjang kemampuan bahasa Inggris yang ditunjukkan dalam skor TOEFL berkorelasi dengan kemampuan memahami ujaran bahasa Inggris.

1.8.2 Instrumen Penelitian Untuk mendapatkan hasil yang akurat dalam kaitannya dengan pertanyaan-pertanyaan yang diajukan dalam penelitian ini diperlukan instrumen-instrumen yang secara tepat mampu mensuplai data-data akurat yang relevan dengan kebutuhan penelitian ini. Adapun instrumeninstrumen yang digunakan dalam penelitian ini adalah (1) TOEFL. Instrumen ini telah teruji sejak tahun 1960an, dimaksud untuk menjaring subjek penelitian sehingga didapatkan data berupa para subjek dengan rentang skor 310 – 677; (2) Listening Comprehension versi A dan B.

Instrumen ini digunakan untuk menguji apakah tes listening tanpa intervensi (Versi A) dan tes listening dengan intervensi, yakni dihadirkannya transkrip listening pada saat tes diberikan (Versi B) hasilnya berbeda secara signifikan. (3) Speech Perception, yaitu tes kemampuan persepsi bunyi ujaran. Tes ini dimaksud untuk menguji kemampuan subyek dalam mempersepsi bunyi ujaran.

1.8.2.1 TOEFL TOEFL adalah tes resmi bahasa Inggris sebagai bahasa asing berstandar internasional yang dibuat oleh tim pembuat soal di Princeton Amerika Serikat. Tes ini mulai digunakan tahun 1963 dan telah mengalami perubahan semenjak diperkenalkannya itu (Hening, 1991: 16). Saat ini terdapat dua TOEFL resmi, yakni Internet-Based Testing (IBT) dan Institutional Testing Program (ITP). IBT digunakan sebagai tes untuk keperluan melamar perguruan tinggi di negaranegara berpengantar bahasa Inggris; sementara ITP tidak dimaksud untuk keperluan melamar perguruan tinggi di negara berpengantar bahasa Inggris, tetapi hanya sekedar mengukur kemampuan bahasa Inggris seseorang secara formal. Dalam prakteknya, ITP dapat digunakan sebagai persyaratan awal seleksi beasiswa luar negeri, atau untuk memenuhi persyaratan seleksi masuk program S2/S3 universitas-universitas di Indonesia. Selain ITP, di beberapa perguruan tinggi di Indonesia, untuk seleksi masuk program S2/S3 digunakan TOEFL setara ITP. Tes ini diambil dari materi tes ITP yang telah di-disclose oleh Education Testing Service. Tes yang kemudian dikenal dengan istilah TOEFL-like ini lazim dipakai oleh perguruan tinggi di Indonesia sebagai persyaratan wajib untuk mengikuti program pascasarjana. Jenis tes yang dipakai untuk maksud penelitian ini adalah paper-based TOEFL yang telah dibuka (disclosed) untuk umum. Tes dimaksud untuk mendapatkan subjek penelitian dengan

jenjang skor terendah sampai yang tertinggi dan mengelompokkannya sesuai dengan skor yang mereka capai.

1.8.2.2 Tes Listening versi A dan versi B Tes ini menggunakan bahan tes ITP TOEFL, khusus bagian listening. Untuk maksud penelitian ini tes dibuat dalam dua versi. Versi pertama (Versi A) adalah tes Listening Comprehension yang lazim digunakan dalam TOEFL. Dalam hal ini peserta tes akan mendengarkan soal lewat pemutar kaset (CD Player) dan dalam buku tes hanya tersedia pilihan jawaban saja tanpa adanya transkrip soal. Versi kedua

(Versi B) berupa tes Listening

Comprehension yang diberi transkrip bacaan untuk setiap soalnya sehingga disamping melihat pilihan jawaban, subyek juga dapat membaca kalimat yang diucapkan narator. Dalam tes yang sesungguhnya transkrip kalimat yang diperdengarkan tidak pernah disertakan dalam soal Listening. Disertakannya transkrip kalimat dalam penelitian ini dimaksud untuk melihat signifikansi perbedaan antara tes listening murni (versi A) dan tes listening yang telah diberi intervensi berupa teks kalimat yang dibacakan narator (versi B).

1.8.2.3 Tes Persepsi Bunyi Ujaran ‘Tes Persepsi Bunyi Ujaran’ adalah tes kemampuan mendeteksi bunyi-bunyi ujaran bahasa Inggris yang dimaksud untuk mengetahui seberapa akurat seseorang dapat menangkap bunyi-bunyi ujaran yang diucapkan oleh penutur asli dengan kecepatan normal. Tes dirancang dengan menghadirkan 8 kalimat, dan didiktekan oleh native speaker dalam bentuk rekaman kaset kepada para subyek penelitian.

Ke delapan kalimat ini diambilkan dari latihan

mendengarkan short statement yang lazim diperdengarkan dalam tes TOEFL versi paper based sebelum tahun 1998. Alasan dipilihnya 8 kalimat yang berasal dari latihan mendengarkan short

statement dari buku Cambridge Preparation for the TOEFL ini adalah karena kalimat-kalimat ini dirancang untuk menguji kecermatan pendengar, dalam hal ini tekanan kata atau suku kata, bunyi-bunyi yang tereduksi, asimilasi, elisi, ucapan yang cepat (fast speech), dan tone group. Berikut adalah kalimat-kalimat yang digunakan dalam penelitian untuk disertasi ini: 1. 2. 3. 2 3 4 5 6

Our new coffee table is made of copper. This history book is no longer up to date. She hasn’t paid her share of the rent. There will be no rent increase this year. Is this the line for purchasing tickets? She must not have found a job yet. That is the show I’d like to see. I called her to explain the details.

(Gear dan Gear, 1996: 27)

1.8.3 Validitas dan realibilitas instrumen penelitian. Penelitian sosial menempatkan validitas dan realibilitas sebagai bagian penting dari mekanisme kontrol terhadap data yang digunakan agar variabel data dapat dikuantifikasikan dengan benar. Tanpa validitas dan realibilitas data, hasil sebuah penelitian akan sulit dipercaya kebenarannya. Satu hal yang dianggap sulit dalam penelitian sosial adalah bagaimana memperoleh data yang akurat dan objektif. Menurut Azwar (2012) sulitnya mendapatkan data yang akurat dan obyektif adalah karena konsep mengenai variabel laten yang lazim dipakai dalam penelitian sosial tidak mudah dioperasionalkan.

Seandainya operasionalisasi atribut dan variabel yang

hendak diteliti sudah dapat disiapkan pun, instrumen ukur dan prosedur pengukurannya masih memerlukan perlakuan yang hati-hati karena kualitas instrumen ukur menjadi penentu utama apakah informasi yang dihasilkan tepat dan dapat dipercaya atau tidak” (hal 1).

Dalam penelitian untuk disertasi ini digunakan tiga jenis instrumen yang diadopsi dari sumber yang sama, yakni TOEFL. Instrumen pertama yang digunakan adalah TOEFL. TOEFL ini digunakan untuk screening, menyeleksi subyek penelitian agar didapat sampel populasi dengan rentang skor yang diinginkan, yakni dari skor terendah, dalam rentangan (310 – 400) sampai skor tertinggi (610 – 667). Instrumen kedua juga disarikan dari TOEFL, yakni dengan cara mengambil bagian listening saja. Instrumen ini digunakan untuk menguji apakah terdapat perbedaan signifikan antara tes listening sebagaimana lazimnya diujikan dalam TOEFL dan tes listening yang diberi transkrip. Instrumen ke-tiga yang digunakan dalam penelitian ini adalah tes akurasi mendengarkan kalimat yang dibacakan narator dari penutur asli, dengan kalimat-kalimat yang diseleksi dari latihan mendengarkan (Gear dan Gear, 1996), berisi latihan akurasi mendengarkan kalimat yang disusun berdasarkan kesulitan dalam hal mengidentifikasi bunyibunyi ujaran yang berkaitan dengan elisi, reduksi vokal, pelesapan bunyi-bunyi tertentu, kata bertekanan lemah dan kuat, frasa intonasi. Uji validitas dan realibilitas untuk ketiga instrumen ini tidak dilakukan secara langsung dalam penelitian ini. Oleh karena materi TOEFL dalam penelitian ini diambilkan dari tes resmi yang telah di-disclosed oleh pihak ETS, validitas dan realibilitas telah teruji dengan baik. Bukti bahwa TOEFL telah diujikan secara berkala semenjak tahun 1963 dengan jumlah peserta tes yang lebih dari 23 juta (ETS, 2012) memberikan gambaran tingkat kepercayaan yang tinggi pada tes ini. Dari beberapa penelitian yang telah dilakukan oleh Salinas (2008), Wait dan Gressel (2009), dan ETS (2012), didapatkan simpulan bahwa TOEFL adalah tes bahasa Inggris sebagai bahasa asing yang valid dan reliable untuk mengukur kemampuan reseptif bahasa Inggris orang dewasa yang berlatar belakang non-bahasa Inggris (non-English speaking background adults).

Menurut Salinas (2008) TOEFL merupakan alat ukur yang handal sebagai instrumen untuk memprediksi keberhasilan belajar di tingkat universitas bagi mahasiswa internasional yang belajar di Texas A&M University-Kingsville. Dalam penelitiannya, Salinas (2008) melibatkan 36 mahasiswa internasional yang mengambil program studi di A&M University-Kigville di tahun 2003-2005. Peneliti lain, yakni Wait dan Gressel (2009) juga menyimpulkan bahwa TOEFL merupakan tes bahasa Inggris sebagai bahasa asing yang valid dan reliable untuk mengukur kemampuan bahasa Inggris orang dewasa berlatar belakang non-bahasa Inggris. Validitas dan realibilitas TOEFL ini lebih jauh diungkap oleh Educational Testing Services, ETS Amerika Serikat. Dengan jumlah peserta tes yang telah mencapai 23 juta mahasiswa dari 8.500 perguruan tinggi di 130 negara di dunia, TOEFL menjadikan dirinya sebagai sebuah tes penguasaan bahasa Inggris untuk orang asing yang telah digunakan secara berkala semenjak tahun 1968 (ETS, 2012). Secara lengkap ETS (2012) mengungkapkan bahwa TOEFL memiliki kelebihan-kelebihan seperti: (1) menjadi instrumen yang memiliki realibilitas sangat tinggi untuk mengukur kemampuan bahasa Inggris sebagai bahasa asing, (2) di-desain berdasarkan penelitian lebih dari 40 tahun , (3) memiliki metoda pensekoran paling obyektif, (4) di-desain berdasarkan standar psikometri yang tinggi.

1.8.4 Prosedur Penelitian Penelitian ini melibatkan 30

orang Indonesia dewasa berusia 20 – 40 tahun sebagai

subjek penelitian yang diseleksi dengan menggunakan tes ITP TOEFL. Dasar pengambilan sampel dilakukan dengan melihat skor ITP TOEFL yang bervariasi dari skor 310 – 667. Dalam penelitian ini jenis kelamin dan lama tinggal subjek di negara berbahasa pengantar bahasa Inggris diabaikan karena fokus penelitian ini adalah pada aspek miko dan bersifat bottom-up, lebih mempertimbangkan satuan-satuan bahasa sebagai acuan inferensial dalam proses

pemahaman ujaran bahasa Inggris sebagai bahasa asing di Indonesia. Sebelum penelitian dilakukan, peneliti terlebih dahulu menghubungi para ‘calon’ subJek penelitian seraya memberitahu mereka bahwa dalam rangka membantu mengurai kesulitan para mahasiswa yang sering mengeluh tentang sulitnya listening comprehension dalam tes TOEFL, peneliti mengundang mereka untuk dilibatkan dalam proyek penelitian ini. Para ‘calon’ subjek penelitian ini diberi gambaran mengenai pentingnya manfaat langsung yang dapat mereka petik dari penelitian ini dan manfaat ke depan bagi mereka kelak dalam rangka membenahi cara belajar Listening, juga manfaat lebih jauh bagi perkembangan kajian Listening. Dengan mengetahui manfaatnya yang besar bagi mereka dan bagi perkembangan ilmu, diharapkan mereka dapat berpartisipasi penuh dalam penelitian ini hingga selesai. Pada proses awal penelitian, sejumlah

‘calon’ subjek penelitian dilibatkan dalam tes

TOEFL untuk menjaring subjek penelitian yang diperlukan, yakni mereka yang meraih skor 310 - 667. Oleh karena dalam screening test awal ini jumlah ‘calon’ subjek penelitian yang memenuhi syarat belum terpenuhi, terutama untuk skor di atas 550, dilakukan tes lagi sampai didapatkan hasil yang diperlukan, yaitu 30 subjek dengan rentang skor skor 310 – 667. Setelah didapatkan 30 subjek penelitian dengan rentang skor 310 – 667, para subjek ini diundang untuk diikutkan dalam tahapan penelitian berikutnya. Kepada mereka diberikan tes listening dua versi. Masing-masing tes berisi 50 butir pertanyaan. Tes versi pertama adalah tes Listening Comprehension yang lazim diujikan dalam tes TOEFL; sementara tes Listening Comprehension versi kedua adalah tes yang formatnya sama dengan versi pertama, hanya dalam versi kedua, setiap soal diberi transkrip kalimatnya, sehingga saat mendengar soal para calon dapat membaca pula transkrip kalimatnya. Tes listening dengan dua versi ini dimaksud untuk menguji apakah para calon subjek penelitian sebenarnya lebih bermasalah dengan keterbatasan

kosakatanya secara umum atau kesulitan menangkap bunyi ujaran. Selanjutnya, tes persepsi bunyi ujaran dilakukan untuk melihat seberapa akurat subjek mampu mempersepsi bunyi ujaran bahasa Inggris yang didengarkannya. Dalam tes ini para subjek penelitian ditugasi mendengarkan delapan butir kalimat dengan ragam tekanan yang lazimnya digunakan dalam tes TOEFL, yang mengandung tekanan silaba, tekanan kata, bentukbentuk connected speech, fast speech, tone group, dan aspek-aspek fonologi lainnya. Para subjek penelitian diberi instruksi untuk menulis kalimat yang mereka dengarkan, termasuk jika mereka hanya mampu mendengar satu atau dua patah kata saja. Kalimat-kalimat yang mereka tulis dijadikan data yang merefleksikan kemampuan subjek dalam mempersepsi bunyi ujaran bahasa Inggris, terutama pada elemen-elemen mikro seperti proclitic, onset, interval clitic, middle tonic, tonic, dan enclitic.

1.8.5 Cara Analisis Semua data yang telah terkumpul, baik data hasil tes TOEFL, tes Listening dua versi, dan tes persepsi bunyi ujaran dianalisis dengan menggunakan cara analisis yang disesuaikan dengan fungsi data dalam penelitian ini. Analisis data itu sendiri dimaksud untuk membantu menjawab pertanyaan-pertanyaan yang diajukan dalam penelitian ini. Analisis data pertama, yakni hasil tes TOEFL dilakukan dengan cara koreksi manual yang dilakukan oleh tim koreksi resmi dari Pusat Pelatihan Bahasa UGM. Hasil koreksi manual dikirim ke pusat data skor di PPB untuk kemudian dimasukkan dalam tabel hasil skor. Dari tabel skor inilah, data penelitian dianalisis dan diambil sesuai dengan kebutuhan penelitian. Data diambil dengan mempertimbangkan rentang skor yang telah ditentukan, yakni dari limit skor terendah (31) sampai limit skor tertinggi (68), yang kemudian dikelompokkan berdasarkan rentang skor sebagai berikut: kelompok A (31 – 40),

kelompok B (41 – 45), kelompok C (46 – 50), kelompok D (51 – 55), kelompok E (56 – 60), dan kelompok F (61 – 68). Data kedua, yakni hasil tes Listening versi A (tes Listening yang menggunakan format TOEFL seperti aslinya) dan versi B (tes Listening yang menggunakan format TOEFL dengan penambahan transkrip teks bacaan pada buku soal) dianalisis dengan menggunakan uji statistik uji t berpasangan. Uji t berpasangan ini dimaksud untuk mengetahui perbandingan secara teliti antara tes versi A dan B. Data ketiga, hasil perception test, dilakukan dengan analisis persepsi dengan menggunakan pendekatan fonologis sebagai acuannya. Dasar dari analisis fonologis yang digunakan dalam disertasi ini adalah matriks Cauldwell yang meliputi unsur proclitic, onset, middle tonic, enterval, tonic, dan enclitic. Adapun analisis matriks Cauldwell ini dimaksud untuk mengetahui apakah para subjek penelitian mampu mempersepsi kalimat dengan baik atau tidak. Di samping itu matriks Cauldwell juga digunakan untuk mengidentifikasi terjadi tidaknya mispersepsi pada diri subjek penelitian terhadap stimulus yang diberikan kepada mereka berupa kalimat-kalimat yang dibacakan oleh penutur asli bahasa Inggris. Dengan demikian perhatian pada aspek prosodi seperti keras lemahnya tekanan, perubahan kualitas suara baik pada tataran fonem, morfem, suku kata, kata atau pun frasa dapat diidentifikasi dengan jelas baik sebagai akibat dari terjadinya proses asimiliasi, elisi, reduksi vokal, keras lemah bunyi, atau pun cepat lambatnya tempo ucapan. 1.9 Sistematika Penulisan Disertasi Disertasi ini ditulis dengan sistematika sebagai berikut: Bab I Pendahuluan dimaksud untuk memberikan gambaran tentang peta disertasi.

Bab ini memuat latar belakang

permasalahan, rumusan permasalahan, tujuan penelitian, kegunaan penelitian, metode penelitian,

lingkup penelitian disertasi. Bab ini memuat pula tinjauan pustaka dan kerangka teori. Dalam tinjauan pustaka, penelitian-penelitian tentang persepsi ujaran dalam menyimak bahasa Inggris sebagai bahasa asing yang telah dilakukan di berbagai negara dengan latar belakang non penutur bahasa Inggris disajikan secara ringkas untuk melihat sejauh mana penelitian tentang menyimak dan epersepsi ujaran telah dilakukan. Sementara dalam bagian landasan teori dijelaskan tentang bagaimana proses menyimak itu berlangsung; faktor apa saja yang berpengaruh dalam proses pemahaman tuturan bahasa Inggris ini. Diuraikan pula dalam bab ini pentingnya persepsi bunyi sebagai faktor determinan yang sebelumnya belum banyak mendapat perhatian dari peneliti menyimak bahasa Inggris sebagai bahasa asing. Bab II membahas kesulitan-kesulitan dalam proses mendengarkan ujaran bahasa Inggris yang dilengkapi sajian data terkait bukti-bukti kesulitan dalam proses memahami bunyi ujaran. Data diperoleh dari instrumen-instrumen yang digunakan dalam penelitian ini, yang meliputi hasil tes listening dua versi dan data hasil tes persepsi bunyi ujaran. Bab III

menjelaskan penyebab terjadinya kesulitan-kesulitan dalam

persepsi bunyi ujaran yang berujung pada terjadinya peristiwa mispersepsi. Secara rinci, bab ini membahas lokasi terjadinya mispersepsi pada elemen-elemen frasa intonasi, sekaligus membahas dinamika clitic dan tonic, tonisitas dan tonalitas sebagai faktor yang berpengaruh dalam proses persepsi ujaran bahasa Inggris. Dalam bab ini Model Cauldwell (2002) digunakan sebagai dasar analisis dilengkapi dengan spectrogram yang digunakan untuk melihat dinamika clitic dan tonic. Digunakannya data spectrogram dalam disertasi ini tidak hanya mengikuti kecenderungan yang berkembang saat ini bahwa analisis persepsi bunyi ujaran akan lebih komprehensif dilakukan dengan menggunakan analisis akustik dengan dukungan spectrogram (Lodge, 2000: 189) Tidak seperti penelitian fonetik akustik berbasis spectogram pada umumnya, yang hanya menggunakan satu sampel vokal atau konsonan atau gabungan dari vokal dan konsonan, dalam bab ini

ditampilkan analisis-analisis terjadinya mispersepsi terhadap kalimat-kalimat yang dipersepsi 30 subyek penelitian. Untuk maksud analisis persepsi ini sebanyak 8 kalimat telah dipilih secara acak untuk diurai berdasarkan ‘tone unit’ dengan melihat elemen-elemen yang mengalami mispersepsi. Pembahasan disertasi ditutup dengan simpulan pada bab IV.

BAB I PENDAHULUAN. mendengarkan. Entah kapan bayi mulai dapat mendengar suara, yang pasti ibu atau bapaknya,

Recommend Documents