Selasa, 17 Maret 2015

Tugas 3

Nama/NIM : I Made Novi Dharma Jaya/1204505021
Jurusan/Fakultas/Perguruan Tinggi : Teknologi Informasi, Fakultas Teknik, Universitas Udayana
Mata Kuliah : Sistem Temu Kembali Informasi
Dosen : I Putu Agus Eka Pratama

Sistem Temu Kembali Informasi (Information Retrieval) adalah metode yang digunakan untuk menemukan kembali informasi-informasi yang relevan terhadap kebutuhan pengguna (user) dari suatu kumpulan informasi secara otomatis.

Sistem temu kembali informasi akan menentukan hasil detail dalam pencarian suatu dokumen.
Hasil dari Sistem temu kembali informasi dapat diperoleh melalui representasi dokumen maupun query, fungsi pencarian (retrieval function) dan notasi kesesuaian (relevance notation) dokumen terhadap query. Salah satu model sistem temu kembali informasi yang paling awal digunakan adalah model boolean. Model boolean mempresentasikan dokumen sebagai suatu himpunan kata-kunci (set of keywords), sedangkan query direpresentasikan sebagai ekspresi boolean. Query dalam ekspresi boolean merupakan kumpulan kata kunci yang saling dihubungkan melalui operator boolean seperti AND, OR dan NOT serta menggunakan tanda kurung untuk menentukan scope operator.

Berikut merupakan metode yang biasa digunakan untuk melakukan Information Retrieval.

Model Boolean : Metode yang digunakan untuk mendefinisikan pencarian dengan menyertakan persyaratan mengenai apa yang ingin dicari dan apa yang tidak ingin ditampilkan secara jelas.
Model Boolean memberikan pengguna (user) kemungkinan kualifikasi hubungan antara istilah pencarian oleh operator Boolean seperti AND (hubungannya), OR (disjungsi) atau NOT (negasi).

        R = T1 T2 AND NO T3

Dalam kasus di atas akan membuat sistem mengambil semua dokumen yang mengandung istilah pencarian T1 dan T2, namun tidak termasuk yang mengandung salah satu dari kedua istilah maupun yang mengandung T3.


Kelemahan Model Boolean adalah tidak adanya relevansi antara data yang diinginkan pengguna dan data yang dihasilkan.

Model Vector Space : model aljabar untuk dokumen teks untuk menggambarkan dokumen (dan setiap objek) sebagai vektor pengenal (identifier). Hal ini digunakan dalam penyaringan informasi, pencarian informasi, pengindeksan dan peringkat relevansi. 

Dokumen dan query direpresentasikan sebagai vektor.

dj = (W1,j, W2,j, …, Wt,j)
q = (W1,q, W2q, …, Wt,q)




















Vektor tersebut dikenakan operasi perkalian titik dan hasilnya menjadi acuan dalam menentukan relevansi masukan pengguna (query) terhadap kumpulan dokumen.
Definisi dari istilah tergantung pada aplikasi. Biasanya istilah adalah kata-kata tunggal, kata kunci, atau frase lagi. Jika kata-kata yang dipilih menjadi persyaratan, dimensi dari vektor adalah jumlah kata dalam kosa kata. 
Operasi vektor dapat digunakan untuk membandingkan dokumen dengan permintaan.
  
Kesamaan antara dokumen dan query diukur berdasarkan sudut cosinus dari vector dokumen dan vector query (cosine measure)
Cosine measure merupakan dot product vector dibagi dengan perkalian dari panjang kedua vector.
Similarity atau sim(d,q) = 1 jika d = q, sebaliknya sim(d,q) = 0 jika d dan q tidak memiliki kesamaan sama sekali, sudut 900.


Daftar Pustaka


Selasa, 03 Maret 2015

Sistem Temu Kembali Informasi

Menurut Kochen yang dikutip oleh Pendit (2008) dalam kamus bahasa inggris, kata retrieve berhubungan dengan 2 hal yaitu upaya untuk mengingat dan upaya mencari sesuatu untuk dipakai kembali. Kochen juga menjelaskan, kata retreve yang dikaitkan dengan IR (Information retrieval) yaitu upaya membantu pengguna sistem komputer menemukan dokumen yang dicari. Kemampuan komputer tersebut dikaitakan dengan recall (mengingat). Pendit (2008) menambahkan, dalam bahasa indonesia kata retrieve diterjemahkan menjadi temu kembali. Jadi kata Information Retrieval diterjemahkan sebagai temu kembali informasi.

ODLIS mendefinisikan bahwa Temu Kembali informasi (IR) adalah Proses, metode, dan prosedur yang digunakan untuk menyeleksi informasi yang relevan yang tersimpan dalam database. Dalam perpustakaan dan arsip, temu kembali informasi biasanya untuk dokumen ynag diketahui atau untuk informasi mengenai subyek tertentu, dan file biasanya katalog atau indeks, atau penyimpanan informasi berbasis komputer dan sistem pencarian, seperti katalog online atau Database bibliografi. Dalam merancang sistem tersebut, keseimbangan harus dicapai antara kecepatan, akurasi, biaya, kenyamanan, dan efektivitas.

Sedangkan dalam wikipedia dijelaskan bahwa Sistem Temu Kembali Informasi (Information Retrieval) digunakan untuk menemukan kembali informasi-informasi yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis. Salah satu aplikasi umum dari sistem temu kembali informasi adalah search-engine atau mesin pencarian yang terdapat pada jaringan internet. Pengguna dapat mencari halaman-halaman Web yang dibutuhkannya melalui mesin tersebut.

Chowdhury mendefinisikan fungsi utama sistem temu kembali informasi sebagai berikut :

  1. Untuk menganalisis isi sumber informasi suatu dokumen.
  2. Merepresentasikan isi sumber informasi dengan cara tertentu yang memungkinkan untuk dipertemukan dengan pernyataan (query pengguna).
  3. Merepresentasikan pernyataan (query) pengguna dengan cara tertentu yang memungkinkan untuk dipertemukan dengan sumber informasi yang terdapat dalam basis data perpustakaan.
  4. Mempertemukan pernyataan pencarian dengan data yang tersimpan dalam basis data.
  5. Menemu-kembalikan informasi yang relevan.
  6. Menyempurnakan untuk kerja sistem berdasarkan umpan balik yang diberikan oleh pengguna.
Tujuannya adalah untuk mempelajari proses temu kembali, membentuk, membangun dan mengevaluasi sistem temu kembali yang dapat memberikan informasi yang diinginkan secara efektif antara pengarang dan pemakai. Sehingga fungsi yang utama dari suatu sistem temu kembali informasi adalah sebagai berikut:
  1. Untuk mengidentifikasi informasi yang relevan kepada masyarakat pemakai.
  2. Untuk meneliti muatan/indeks dari dokumen
  3. Untuk menghadirkan muatan/indeks dari sumber yang diteliti dengan pemakai.
  4. Untuk meneliti query pemakai dan untuk menghadirkannya didalam suatu format yang akan menghasilkan temuan dokumen yang sesuai pada basisdata.
  5. Untuk memenuhi statemen pencarian dengan database yang disimpan.