Pengaplikasian Riset Bambang Dwi Wijanarko Tentang Model Encoder Decoder dengan Mekanisme Atensi Berbasis Long Shortterm Memory untuk Pembangkit Pertanyaan dalam Dunia Pendidikan
Bambang Dwi Wijanarko merupakan mahasiswa program Doktor di BINUS University dengan Program Studi Computer Science. Beliau telah menyelesaikan studi tersebut dengan dilaksanakannya Sidang Promosi Doctor of Computer Science (DCS) BINUS University pada Desember 2020 di Ruang B0303 Kampus Alam Sutera BINUS University.
Dalam riset yang dikerjakannya selama tiga tahun tersebut, beliau mengusung judul disertasi “Model Encoder Decoder Dengan Mekanisme Atensi Berbasis Long Short Term Memory Untuk Pembangkit Pertanyaan”. Di mana dari risetnya diketahui bahwa LSTM mampu memberikan performa yang lebih bagus.
Alasan Pemilihan Mekanisme Atensi Di Dalam Riset Dan Penggunaan Noun Phrase
Di dalam riset yang dilakukan oleh Bambang Dwi Wijanarko, beliau memilih untuk menggunakan mekanisme atensi. Dalam hal ini beliau pun mengilustrasikan ketika seorang manusia yang matanya tertutup sedang berada di ruang yang gelap dan saat itulah orang tersebut tidak bisa melihat hal apapun. Kemudian secara perlahan mata akan terbuka dan akan memperhatikan segala hal yang ada di sekelilingnya.
Secara sedikit demi sedikit, maka sekitar orang tersebut akan terbuka. Hal ini juga berlaku di dalam mendeteksi sebuah frase. Pada awalnya diambil secara probability, kata-kata apa saja dan akhirnya akan mengarahkan kepada kata-kata tertentu yang paling dominan dan di dalam teknik lainnya dikatakan sebagai topik. Sedangkan dalam hal ini beliau menyebutnya sebagai key phrases.
Dalam riset ini beliau mencari non phrases atau kata benda dan bukan verb atau kata kerja. Diketahui bahwa di dalam sebuah kalimat terdapat subjek, predikat, dan objek. Predikat adalah kata kerja yang biasanya berupa perintah atau pekerjaan. Sementara yang diperintah adalah subjek dan ada sesuatu yang menjadi objeknya. Bagian yang penting adalah subjek dan objek yang dalam hal ini adalah noun atau kata benda atau sesuatu yang dibendakan.
Sedangkan untuk kebutuhan kata kerja, maka akan digunakan kata kerja yang berasal dari taxonomy bloom. Dan ini sudah sangat related dengan kebutuhan pembelajaran dan sesuai dengan level-level yang dibutuhkan. Sehingga pada saat melakukan key phrases identification, dipilihlah kata benda atau noun dan bukannya kata kerja atau verb.
LSTM Mampu Men-generate Kata-Kata Baru Atau Kalimat Baru
Diketahui dalam riset yang dilakukan oleh Bambang Dwi Wijanarko bahwa LSTM mampu memberikan performa yang lebih bagus. Beliau mengibaratkan bahwa kata di dalam model embedding seperti menempati sebuah ruangan. Setiap kata tersebut memiliki koordinat dan dengan LSTM, masih mampu untuk mengingatnya. Inilah yang menjadi kelebihan dari LSTM untuk bisa mengingat kata-kata yang koordinatnya jauh.
Untuk kata yang dekat, beliau mengambil contoh kata “BINUS” yang pastinya lebih dekat dengan “universitas”. Kata-kata semacam itu bagi GRU masih mampu untuk dideteksi. Tetapi LSTM akan lebih mampu untuk mengingat kata-kata yang lebih jauh dari kata tersebut. Atau bahkan yang tidak pernah berdekatan dengan kata “BINUS” itu sendiri.
Sehingga dengan menggunakan LSTM, LSTM ini mampu untuk men-generate kata-kata yang baru atau kalimat baru yang menurut data tidak ada tetapi dia akan men-generate sendiri berdasarkan set dari data tersebut. Bahkan selama beliau mengeksplor kembali risetnya, diketahui model ini tidak hanya
bergantung kepada Bahasa Inggris saja. Ketika dicoba dengan menggunakan Bahasa Indonesia juga mampu untuk menghasilkan pertanyaan.
Artinya, konteks bahasa apa yang menjadi dataset ini tidak akan menjadi masalah. Apapun bahasanya asal jelas struktur kalimat dan bisa dideteksi frasenya, maka dia akan bisa menjadi kalimat pertanyaan.
Pengaplikasian Di Dalam Pembelajaran
Pengaplikasian riset ini sebelumnya sudah pernah diuji coba terlebih dahulu oleh Bambang Dwi Wijanarko. Beliau men-generate pertanyaan dan pada minggu ke-9 yang dirasa dalam forum tersebut sudah banyak materialnya. Kemudian dijadikan data lalu diolah menjadi data set.
Dari data set itulah digunakan untuk mentraining dan dijadikan soal. Hasilnya adalah sekitar 300 soal esai. Untuk menghasilkan soal esai, maka dibutuhkan waktu sekitar satu jam. Tetapi untuk mentraining akan membutuhkan waktu sekitar 12 jam. Hal tersebut berlaku untuk satu mata kuliah saja.
Keberadaan question generator mampu untuk memperkaya soal, memperkaya pertanyaan, dan pertanyaan tersebut bisa digunakan untuk membantu dosen dan mahasiswa. Yakni untuk memprediksi apa yang harus diketahui, apa yang belum diketahui, dan apa yang sudah diketahui di awal. Jadi, selama periode belajar berjalan, di minggu pertama dosen sudah memiliki semuanya untuk tugas, ujian, latihan, dan kuis.
Lalu untuk sepanjang semester, dosen akan memotivasi, menjadi mentor, dan menjadi problem solver, sehingga tidak sekedar mendikte saja. Materi sudah dimiliki oleh mahasiswa, begitupun dosen juga sudah memilikinya. Secara singkat, dosen hanya sebagai pendamping belajar para mahasiswanya. Walaupun awalnya sudah bekerja di depan dan dibantu oleh otomatisasi sistem ini.
Pengetahuan dosen bisa didistribusikan sebagai sumber materi untuk men-generate soal ini dan nantinya soal yang banyak bisa digunakan untuk meng-custom mahasiswa mana yang perlu mendapatkan soal yang mana. Jadi tidak perlu semuanya harus sama.
Untuk evaluasi kualitatif, hal ini diasumsikan sesuai dengan level taksonomi. Jadi, di dalam satu kelas bisa jadi mendapat mahasiswa yang tidak homogen. Mahasiswa ada yang memiliki pengalaman bagus, ada yang baru belajar, dan ada yang sedang. Maka perataannya sudah diketahui level taksonominya.
Untuk mahasiswa yang perlu mengulang, belajar dengan cara mengulang-ulang, maka bisa diberi level yang lebih rendah terlebih dahulu dan terus ditingkatkan levelnya hingga akhirnya sama. Meskipun masa belajarnya tidaklah sama.
Kendala Dalam Pengimplementasian Riset
Diketahui bahwa sekarang aplikasi ini dijalankan dalam mode prototipe yang dilakukan oleh Bambang Dwi Wijanarko selaku peneliti. Untuk menjadikannya sebagai sebuah aplikasi, maka tidaklah mudah jika kondisinya tidak difasilitasi. Tetapi ini akan menjadi mudah jika difasilitasi. Sehingga, hal ini hanya bergantung pada fasilitasnya saja.
Ketika dilakukan generate pertanyaan atau mentraining, maka membutuhkan resources komputer yang besar. Di mana harus ada GPU (Graphics Processing Unit) dan di dalam penelitiannya, beliau menggunakan Cloud dengan training yang dilakukan bisa selama berjam-jam bahkan hingga sehari.
Tetapi jika hal ini difasilitasi, maka bisa lebih mudah untuk kendala tersebut dihilangkan. Jadi, hanya institusi besarlah yang mampu mengadakannya. Sedangkan secara teknik dan algoritma tidak ada masalah, begitu juga dengan sumber daya yang juga cukup tersedia.
Untuk pengimplementasian dari segi fasilitas, maka peralatan yang dibutuhkan adalah mesin berupa komputer dan GPU. Ini lebih mudah secara implementasi dan secara prosedural. Bahkan beliau juga telah membayangkan tentang LMS (Learning Management System) di BINUS University.
Di mana mahasiswa yang pertama login, maka akan langsung menunjukkan fungsinya mengenai topik-topik apa yang harus dipelajari yang sifatnya adalah memberikan rekomendasi.
Setelah belajar, secara otomatis ada soal-soal yang muncul, bagian mana yang dibaca dan untuk penguatan evaluasi akan ditanyakan secara otomatis. Sehingga hanya membutuhkan prosedural saja dan itu sangat mudah jika misalnya saja embed menjadi sebuah modul fungsi kemudian embedding di LMS. Sehingga sejak hari pertama, LMS sudah ada pertanyaan yang berdasarkan topik-topik yang ada di minggu ini. Secara otomatis, forum akan berjalan dan interaksi akan bekerja.
Melalui serangkaian riset panjangnya itulah, Bambang Dwi Wijanarko sukses menyelesaikan program doktornya dan lulus dengan predikat summa cumlaude. Kelulusan ini, ybs menjadi doktor ke-20 dari program Doctor of Computer Science BINUS University