Monday, 23 April 2012

Algoritma Learning


'Ini merupakan penugasan kelompok yang pertama untuk machine learning dan penugasan pertama yang ditolak. Sebagai pembelajaran dari dosen yang mengatakan, "Selesaikanlah sebelum deadline waktu pengumpulan. TEPAT WAKTU! Terlambat beberapa detik pun, saya tidak akan terima."
Itulah budaya Indonesia, padahal ini juga kerja kelompok harusnya bisa lebih cepat selesai. Lumayan dapat pematik di pagi - pagi. Maaf ya pak, terima kasih ..'
***

Sejauh ini, learning memiliki makna memilih representasi terbaik, misalkan decision tree yang terbaik atau nilai untuk parameter dalam NN yang paling baik. atau memprediksi nilai target feature dari sebuah kasus yang baru dari database kasus" sebelumnya. Namun ada ide lain yang berbeda tentang learning. yaitu learning sebagai proses menentukan formula dari hipotesis yang konsisten dengan  training example. dibandingkan untuk memilih sebuah hipotesis, tujuan proses ini lebih pada menemukan hipotesis-hipotesis yang konsisten. proses investigasi ini akan menjelaskan peran dari bias dan menyediakan mekanisme analisis teoritis mengenai masalah learning.
Pendekatan yang dapat dilakukan adalah menggunakan algoritma candidate  elimination. algoritma ini bekerja dengan menjaga agar representasi sekumpulan hipotesis  konsisten dengan training examples.
Algoritma learning candidate-elimination mengkomputasi version space (subset dari semua  hipotesis yang konsisten dengan semua training example yang diamati). 

Dimulai dengan menginisialisasi version space dalam set G yang merupakan hipotesis paling umum (general)
Go ß {(?, ?, ?, ?, ?, ?)}

Dan menginisialisasinya dalam set S yang merupakan hipotesis paling spesifik
So ß {(ᴓ, ᴓ, ᴓ, ᴓ, ᴓ, ᴓ)}


Dua batasan ini, G dan S, memberikan batasan diantara space hipotesis, karena setiap hipotesis dalam H lebih general dari  So dan lebih spesifik dari Go. Setiap training example dicek, S dan G digeneralisasi dan dispesifikasi dan sebaliknya untuk mengeliminasi hipotesis yang tidak konsisten pada training example yang baru. Setelah semua training example diproses, didapatkan hipotesis yang konsisten.
Algoritma CE telah diterapan pada permasalahan learning regularities dalam spektrokopi kimia masal (MItchel 1979) dan learning control rules untuk heuristic search (Mitchell et al 1983). namun keterbatasan dari CE (dan find-S juga) adalah kinerjanya  buruk ketika  diberikan data training yang ada noisenya.
Apa yang terjadi ketika training data mengendung eror? misalkan training example yang kedua salah dalam representasinya, seharusnya positive example, bukan negative example. maka lagoritma ini akan menghapus correct target concept dari version space.  dikarenakan ia akan meremove setiap hipotesis yang tidak konsisten dengan dengan  training example, ia akan mengeliminasi true target concept dari version space segera setelah negative example yang salah ini masuk. ketika diberi tambahan training data maka ka terdeteksi adanya ketidakkonsistenan dengan terjadinya konvergensi pada S dan G menghasilkan version space kosong. adanya empty space mngindikasikan bahwa tidak ada hipotesis dalam H yang konsisten dengan semua training example yang diobservasi.

>> Seperti apa training example yang di-request learner selanjutnya?
Sampai di poin ini, kita dapat mengasumsikan bahwa training examples yang diberikan learner oleh beberapa external teacher. Anggaplah learner diperbolehkan untuk memimpin experiment yang memilih instance selanjutnya, kemudian mendapatkan klasifikasi yang benar untuk instance ini dari external oracle.
Skenario ini meliputi situasi yang seorang learner dapat melakukan percobaan dalam alam (seperti membangun jembatan baru dan mengikuti alam untuk mengklasifikasikan apakah jembatan tersebut stabil atau tidak), atau seorang guru yang menyediakan klasifikasi yang benar (seperti mengusulkan jembatan baru dan mengikuti seorang guru yang menyarankan apakah itu akan stabil atau tidak). Kita menggunakan istilah query untuk merujuk beberapa instance dibangun oleh learner yang diklasifikasikan oleh external oracle.
Pertimbangkan lagi version space dipelajari dari empat training example dari konsep Enjoy Sport dan diilustrasikan pada gambar 1.1.

Gambar 1.1
Oleh karena itu, bagaimana query yang baik bagi learner sesuai pada poin di atas? Apakah strategi umum query yang baik? Learner seharusnya dapat memebedakan anternatif hipotesis dalam version space. Oleh karena itu , learner harus memilih sebuah instance yang akan diklasifikasikan positif dari beberapa hipotesis tetapi negatif untuk yang lain.
                Kita perhatikan bahwa instance diatas memenuhi tiga dari enam hipotesis dalam version space yang sekarang. Jika trainer menngklsifikasikan instance ini sebagai example positive, S dalam version space dapat digeneralisasikan. Namun jika trainer mengindikasikan instance ini negative, maka G akan dispesifikkan atau dispesialisasikan. Dengan demikian,  learner berhasil mempelajari lebih banyak mengenai true identity target konsep, mengurangi  version space menjadi setengahnya.

Referensi:
Artificial Intelligence, 2010, David Poole and Alan Mackworth
Tom Mitchell, 1997, Machine Learning

No comments:

Post a Comment