1 / 20

Representasi Dokumen

Representasi Dokumen. Mata Kuliah: Pemrosesan Teks dan Sistem Temu Kembali Informasi Universitas Dian Nuswantoro , 200 9. Tujuan Sesi Ini. Memahami apa yang dimaksud dengan representasi dokumen . Memahami tujuan dan fungsi dari representasi dokumen (Kode, Indeks, Abstrak) .

milly
Télécharger la présentation

Representasi Dokumen

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. RepresentasiDokumen Mata Kuliah: Pemrosesan Teks dan Sistem Temu Kembali Informasi Universitas Dian Nuswantoro, 2009

  2. Tujuan Sesi Ini Memahamiapa yang dimaksuddenganrepresentasidokumen. Memahamitujuandanfungsidarirepresentasidokumen (Kode, Indeks, Abstrak). Memahamisifatdankarakteristikdarimasing-masing representasidokumen.

  3. RepresentasiIsiDokumen Representasiisidimaksudkanuntukmemberikangambaranmengenaiinformasi yang terkandungdalamsuatudokumen, sehinggadokumen yang bersangkutandapatdiidentifikasiberdasarkaninformasi yang terkandungdidalamnya. Informasi yang terkandung dalam suatu dokumen dapat direpresentasikan dalam berbagai bentuk. Bentuk yang lazim dipergunakan adalah kode klasifikasi, indeks, dan abstrak.

  4. Karakteristik Representasi Dokumen • Mempunyai dayapembeda (discriminating power): kemampuanuntukmembedakansatuentitidarientiti yang lain. • Bentukrepresentasiinformasiharusdapatmembedakansatudokumendengandokumen lain berdasarkaninformasi yang terkandungdidalamnya. • Identifikasisimilaritas (identification of similarity): kemampuanuntukmenunjukkankesamaan (similarity) • Identifikasiperbedaan (dissimilarity) antaraentiti-entiti: menunjukkandokumen-dokumen yang berbeda

  5. Lanjutan… • Daya deskripsi (descriptive power): kemampuan untuk menunjukkan suatu entiti • Bentuk representasi informasi harus dapat memberikan gambaran mengenai informasi yang terkandung dalam suatu dokumen • Unik (uniqueness): mempunyai arti yang unik dan terhindar dari arti ganda (ambiguity). • Ringkas (conciseness): dinyatakan dalam notasi yang ringkas sehingga mudah diingat.

  6. Standard Representasi Fisik Dokumen • International Standard Bibliographic Descriptions (ISBD) • International Federation of Library Association (IFLA) mengembangkan standard deskripsi bibliografi untuk berbagai materi tercetak: • ISBD(M) untuk monograf • ISBD(S) untuk serial • ISBD(PM) untuk musik tercetak • ISBD(CM) untuk materi kartografis • ISBD(NBM) untuk materi non buku • ISBD(CF) untuk file komputer • ISBD(A) untuk buku-buku langka.

  7. PenyusunanBibliographi DokumenBerbasisKomputer • Library of CongressdanBritish Librarymengembangkan format Machine Readable Catalogue (MARC) • Beberapaproduser basis data mempunyaipedomansendiridalammembuatdeskripsibibliografi • Tujuannyaadalahuntukmendapatkantingkatkonsistensi yang tinggidalampendeskripsianbibliografipada basis data yang dihasilkan. • SebagaicontohadalahBadanTenaga Atom Internasional (International Atomic Energy Agency) sebagaiprodusen basis data dalambidangsainsdanteknologinuklirInternational Nuclear Information System (INIS) mempunyaiGuide to Bibliographic Descriptionssebagaipedoman yang digunakanolehsemuanegaraanggota INIS dalammembuatdeskripsibibliografidokumen yang dimasukkankedalam basis data tersebut.

  8. KomponenDeskripsiFisik Bibliographi • Judul dan kepengarangan: komponen mencakup elemen data yang brkaitan dengan judul dan kepengarangan. • Edisi: komponen ini mencakup elemen data yang berkaitan dengan dokumen yang diterbitkan dalam beberapa edisi atau revisi. • Tipe publikasi secara spesifik: komponen ini mencakup elemen data yang berhubungan dengan tipe publikasi tertentu. • Publikasi dan distribusi: komponen ini mencakup elemen data yang berkaitan dengan publikasi dan distribusi dokumen, misalnya nama penerbit, tempat terbit, tanggal penerbitan, dan lain-lain. • Deskripsi fisik: komponen ini mencakup elemen data yang berkaitan dengan keadaan fisik dokumen, misalnya jumlah halaman, halaman awal dan halaman akhir, ilustrasi, ukuran, dan lain-lain.

  9. Serial: komponen ini mencakup elemen data yang berkaitan dengan dokumen yang diterbitkan secara serial, antara lain judul seri, penanggung jawab dalam penerbitan serial (editor seri), dan lain-lain. • Catatan: komponen ini mencakup elemen data tambahan yang berkaitan dengan suatu dokumen secara spesifik antara lain hubungan dokumen yang bersangkutan dengan dokumen lain, bahasa, dan lain-lain. • Nomor standard: komponen ini mencakup elemen data yang berkaitan dengan nomor standard internasional seperti International Standard Book Number (ISBN) atau International Standard Serial Number (ISSN).

  10. KodeKlasifikasi • Kode klasifikasi adalah notasi yang digunakan untuk menunjukkan subjek suatu dokumen berdasarkan skema klasifikasi tertentu. • Dalam skema klasifikasi, klas utama menunjukkan pembidangan pengetahuan secara luas dimana selanjutnya akan dianalisis secara mendalam menjadi klas yang spesifik. • Setiap klas utama harus mencakup semua subjek yang ditemui pada literatur dimana skema klasifikasi diterapkan. • Tujuan pemberian kode klasifikasi pada suatu dokumen adalah untuk mengidentifikasi subjek dokumen dan menempatkan dokumen pada pada urutan subjek yang ada dalam suatu disiplin. • Kode klasifikasi terdiri dari beberapa karakter numerik atau alfanumerik. • Kode klasifikasi yang terdiri dari karakter numerik adalah seperti pada skema klasifikasi Dewey Decimal Classification (DDC) dan Universal Decimal Classification (UDC). • Adapun kode klasifikasi yang terdiri dari karakter alfanumerik adalah seperti pada skema klasifikasi Library of Congress (LC), International Nuclear Information System (INIS), dan Energy Technology Data Exchange (ETDE).

  11. Indeks • Indeks merupakan notasi yang menunjuk pada unsur tertentu dalam suatu susunan unsur-unsur. • Secara umum indeks adalah petunjuk yang sistematik kepada satuan-satuan yang terkandung di dalam, atau konsep yang diturunkan dari koleksi entitas atau basis data. • Pengertian praktis indeks juga dapat didefinisikan sebagai daftar referensi secara alfabetis yang biasanya terdapat pada bagian akhir sebuah buku. • Dalam ilmu perpustakaan indeks mempunyai arti yang luas, yang secara umum dapat diartikan sebagai catatan mengenai nilai-nilai dari berbagai atribut yang diharapkan dapat digunakan sebagai dasar pencarian informasi. • Atribut yang dimaksud adalah subjek maka bentuk catatan tersebut adalah indeks subjek, dan apabila atribut yang dimaksud adalah pengarang maka bentuk catatan tersebut adalah indeks pengarang. • Secara tradisional, sebagian besar upaya pengindeksan merupakan pengindeksan subjek.

  12. Fungsi Indeks • Memberikan kemudahan dalam menemukan dokumen berdasarkan subjek; • Mengidentifikasi topik suatu dokumen sehingga dapat dihubungkan dengan dokumen lain; • Memprediksi relevansi suatu dokumen dengan kebutuhan informasi tertentu.

  13. Sifat Indeks • Spesifisitas (specificity): indeks harus merupakan istilah spesifik yang berkaitan dengan subjek dokumen. • Mendalam (exhaustivity): indeks yang diberikan pada suatu dokumen harus didasarkan pada analisis subjek yang mendalam. • Terhindar dari kesalahan (error): indeks yang diberikan pada suatu dokumen harus terhindar dari kesalahan interpretasi dan intervensi manusia.

  14. JenisIndeks • Indeks KWIC (Keyword In Context). Indeks KWIC adalahindeks yang secaralangsungditurunkandarikatakunci (keyword) yang terdapatdalamjuduldokumendengansusunansepertiaslinya. Katakunciadalahkata-kata yang digunakandalampenulisandokumendandianggapmempunyaiartipenting. • Indeks KWIC dibuatdenganmembuangsemuakata yang tidakmempunyaiarti (stop word) yang terdapatdalamjuduldokumen. • Kata-kata yang tertinggaladalahkata-katakunci yang tersusunsesuaidengansusunandalamjudulaslinya. • Format indek KWIC sangat terbatas, hanya satu baris dengan jumlah karakter tertentu. • Indek KWOC (Keyword Out of Context). • Kata-kata kunci yang menyusun indeks KWOC sama dengan indeks KWIC, perbedaan hanya terletak pada susunan dan tampilannya. Setiap kata kunci yang diekstrak dari judul disusun sebagai tajuk dan di bawah masing-masing tajuk tersebut diberikan judul lengkap dan referensi sumbernya. • Disamping jenis-jenis indeks tersebut di atas, terdapat satu jenis indeks yang relatif lebih rumit dalam pembuatannya yaitu yang disebut sebagai deskriptor. • Deskriptor yaitu istilah indeks yang berupa istilah-istilah standard atau biasa disebut sebagai kosa kata terkendali (controlled vocabulary). • Dalam penentuan deskriptor, kata-kata kunci yang diekstrak dari dokumen ditranslasikan ke dalam istilah-istilah atau kosa kata standard yang terdapat dalam bahasa indeks alfabetis seperti tesaurus atau skema klasifikasi.

  15. Abstrak • Abstrak adalah representasi yang singkat dan tepat dari kandungan dokumen yang mencakup semua hal yang penting dari dokumen asli, dan biasanya mengikuti gaya dan susunan seperti pada dokumen asli. • Tujuan abstrak adalah untuk menangkap isi dokumen yang esensial sehingga dalam waktu yang singkat pembaca dapat mengetahui informasi yang terkandung dalam dokumen. • Keringkasan (conciseness) dan keberartian (significance) merupakan dua konsep penting dalam pengabstrakan. • Abstrak harus ditulis secara jelas, tepat, komprehensif, tidak terikat (independent) dan tidak dimaksudkan untuk memberikan kritik terhadap dokumen. • Pembuatan abstrak dapat dilakukan oleh penulis (author) atau oleh pengabstrak (abstractor). • Penulis merupakan orang yang paling mengetahui isi dokumen sehingga diharapkan dapat memilih bagian-bagian terpenting dalam dokumen yang harus dituangkan dalam abstrak. • Adapun yang dapat bertindak sebagai pengabstrak adalah orang yang mempunyai pengetahuan yang memadai tentang subjek dokumen yang akan dibuatkan abstraknya dan memahami metode pembuatan abstrak.

  16. FungsiAbstrak • Sebagai miniatur dokumen, abstrak berfungsi sebagai petunjuk kepada isi dokumen. Dengan membaca abstrak pembaca dapat mengetahui cakupan isi dokumen dalam waktu yang relatif singkat, • Abstrak memungkinkan pembaca untuk membaca literatur dalam jumlah yang besar. Hal ini sangat bermanfaat untuk menghindari terjadinya duplikasi dalam penelitian dan pengembangan. • Layanan abstrak publikasi asing dapat menjadi titik akses untuk membantu mendapatkan informasi yang bersumber pada publikasi asing dengan relatif cepat dan mudah. • Layanan abstrak publikasi asing juga dapat berfungsi untuk menjembatani kendala bahasa. • Dalam sistem temu kembali informasi, abstrak berfungsi sebagai pintu masuk ke dalam dokumen. • Kata atau istilah yang digunakan dalam abstrak dapat digunakan sebagai istilah pencarian yang relatif mudah difahami oleh pengguna • Hal ini sangat bermanfaat dalam pencarian menggunakan bahasa alamiah (natural language).

  17. Sifat Abstrak • Ringkas: dinyatakan dengan kata atau kalimat yang ringkas dan terhindar dari ekspresi yang berlebihan (redundancy). • Jelas: menggunakan kata atau kalimat yang jelas dan terhindar dari arti ganda (ambiguity) • Tepat: menggunakan ekspresi yang tepat dan spesifik dalam menggambarkan isi dokumen. • Berdiri sendiri: deskripsi dari dokumen digambarkan secara lengkap dan dapat dimengerti sepenuhnya tanpa harus merujuk pada dokumen lain. • Objektif: terhindar dari interpretasi dan penilaian pribadi pengabstrak.

  18. Jenis Abstrak • Secara garis besar abstrak dapat dibedakan menjadi 2 (dua) yaitu abstrak indikatif dan abstrak informatif. • Abstrak indikatif berisi pernyataan umum yang menggambarkan tentang apa yang dibahas dalam suatu dokumen. • Abstrak indikatif biasanya relatif lebih singkat, terdiri antara 50-100 kata. • Abstrak informatif merupakan kondensasi informasi yang berisi tujuan, metode, data, hasil analisis, kesimpulan, dan rekomendasi yang terkandung dalam dokumen. • Abstrak informatif biasanya terdiri antara 100-500 kata. • Selain abstrak indikatif dan informatif terdapat jenis abstrak indikatif-informatif yang merupakan gabungan dari abstrak indikatif dan informatif. • Bagian-bagian abstrak ini ditulis secara informatif akan tetapi pokok-pokok yang kurang penting disajikan secara indikatif. • Abstrak jenis ini dapat memberikan informasi maksimum dengan panjang minimum.

  19. RingkasanDokumen Yang Lain • Disamping abstrak terdapat beberapa jenis ringkasan dokumen yang lain, antara lain anotasi (annotation), ekstrak (extract), ringkasan (summary), singkatan (abridgement), dan sinopsis (synopsis). Pengertianmasing-masingistilahtersebutadalahsebagaiberikut: • Anotasiadalahcatatan yang ditambahkanpada data bibliografiberupapenjelasan yang berkaitandenganisidokumen. • Ekstrakadalahbentukringkasandokumen yang terdiridarisatuataubeberapabagiandaridokumen yang menonjolsepertihasil, kesimpulan, ataurekomendasi yang bertujuanuntukmengidentifikasiisuutama yang tercakupdalamdokumen. • Ringkasanadalahpernyataanmengenaidokumen yang berisitemuandankesimpulan yang menonjoldengantujuanuntukmemberikanorientasipadaide yang signifikan yang terdapatdalamdokumen yang bersangkutan. • Singkatanadalahkondensasidokumen yang berisigagasanutama yang terdapatdalamdokumendenganmengabaikangagasan-gagasansekunder. • Sinopsisadalahikhtisar yang diberikanolehpengarangmengenaisuatupekerjaan.

  20. Latihan… Apa yang dimaksud dengan document surrogate ? Apa peran representasi dokumen di dalam IRS ? Sebutkan karakteristik representasi dokumen yang diperlukan dalam IRS ? Apa yang dimaksud representasi dokumen secara fisik dan secara isi? Sebutkan komponen informasi yang ada dalam bibliograpi. Apa yang dimaksud dengan Kode klasifikasi? Sebutkan sifat dari Kode klasifikasi. Apa yang dimaksud dengan indeks? Apa yang dimaksud dengan proses pengindeksan? Apa fungsi dan tujuan dari indeks? Sebutkan sifat-2 dari indeks? Apa yang dimaksud dengan KWIC dan KWOC? Apa fungsi dan tujuan dari abstrak? Sebutkan sifat-sifat yang seyogianya dimiliki oleh abstrak.

More Related