Geri Dön

Bilgi erişiminde tamlama temelli dizinleme

Phrase based indexing in information retrieval

  1. Tez No: 223888
  2. Yazar: MEHMET KIVANÇ TÜRKEEŞ
  3. Danışmanlar: PROF.DR. EŞREF ADALI
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Bilgi Erisimi, Doğal Dil ?sleme, Tamlama Temelli Dizinleme, Information Retrieval, Natural Language Processing, Phrase Based Indexing
  7. Yıl: 2007
  8. Dil: Türkçe
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 92

Özet

Bu tez kapsamında, Türkçe için doğal dil isleme destekli bir bilgi erisim sistemi tasarımı yapılmıstır. Bu bilgi erisim sistemi, Türkçe'nin özelliklerini ve yapısını göz önüne alarak, bilgi erisimindeki basarımı arttırmayı amaçlamaktadır. Tasarlanmıs olan bu sistemde Türkçenin biçimsel ve sözdizimsel farklılıkları ele alınmıs ve bu farklılıkların giderilmesinin bilgi erisimi üzerindeki etkileri irdelenmistir. Birimsel farklılıklar biçimbirimsel çözümlemeye dayanan gövdeleme, sözdizimsel farklılıklar ise tamlama analizi ile giderilmeye çalısılmıstır. Tamlama analizinde hem istatistiksel hem de dilbilimsel yaklasımlar incelenmis ve dilbilimsel tamlama analizi gerçeklenmistir. ?statistiksel yaklasımda, birbirini belirli sıklıklarla izleyen ve belge genelinde sıkça geçen sözcük öbekleri tamlama olarak kabul edilmis, dilbilimsel yaklasımda ise isim ve sıfat tamlamaları bulunmaya çalısılmıstır. ?statistiksel yaklasımda sözcükler arasındaki yakınlık ve sıklık iliskileri üzerinde durulurken dilbilimsel yaklasımda biçimbirimsel çözümleme de kullanılarak sözcük türleri ve sözcüklere gelen tamlama ekleri incelenip Türkçedeki isim ve sıfat tamlamaları sonlu durum makineleri ve düzenli ifadeler olarak temsil edilmistir. Tamlama analizi ile bulunan tamlamalar tek sözcüklerle beraber belgeleri temsil etmek için kullanılarak tamlama bazlı dizinleme gerçeklenmistir. Ayrıca sözcük bazlı dizinleme ile tamlama bazlı dizinleme karsılastırılarak bilgi erisimi ve basarımı üzerine etkileri arastırılmıstır.

Özet (Çeviri)

In this study, an Information Retrieval system supported by Natural Language Processing for Turkish is designed. This IR system aims at increasing performance in IR by considering features and structure of Turkish language. Designed IR system deals with morphological and syntactical variations of Turkish and studies of the effects on overcoming these variations on IR. Morphological variations are handled with stemming based on morphological analysis and syntactical variations with phrase analysis. For phrase analysis, both statistical and linguistic approaches are studied and linguistical phrase analysis is implemented. In statistical approach, words which follow each other and are frequently repeated in a document are considered as a phrase and terms of proximity and frequency for words are studied. In linguistic approach, noun and adjective phrases are analized. The type and suffix information for words are studied to find noun and adjective phrases in Turkish. Finite state machines and regular expressions are formed for the analysis of linguistic phrases. Phrases, which are determined by phrase analysis, are used for representing documents instead of single words. Phrase based indexing is implemented for this purpose. Comparison between phrase based indexing and term based indexing is done and their effect on IR are studied.

Benzer Tezler

  1. Tabu arama ve tavlama benzetimi algoritmalarıyla bilgisayar şebekelerinin topolojik optimizasyonu

    Topological optimization of computer networks using tabu search and simulated annelin algorithms

    ÇİĞDEM ALABAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    1999

    Endüstri ve Endüstri MühendisliğiGazi Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. BERNA DENGİZ

  2. Elektronik belgelerin ve elektronik belgelere ait işlem izlerinin arşiv imha uygulamaları bakımından incelenmesi

    Examination of electronic records and traces of electronic records in terms of archive destruction practices

    CEYHAN GÜLER

    Doktora

    Türkçe

    Türkçe

    2019

    Arşivİstanbul Üniversitesi

    Bilgi ve Belge Yönetimi Ana Bilim Dalı

    PROF. DR. MEHMET CANATAR

  3. Sosyal bilgiler öğretmenlerinin vatandaşlık algıları ve vatandaşlık eğitimi ile ilgili düşüncelerinin incelenmesi

    Investigation of social studies teachers' perceptions of citizenship and citizenship education

    İSKENDER İKİNCİ

    Doktora

    Türkçe

    Türkçe

    2016

    Eğitim ve ÖğretimDumlupınar Üniversitesi

    İlköğretim Ana Bilim Dalı

    YRD. DOÇ. DR. EMİN KILINÇ

  4. Orman amenajman planlarının hazırlanmasında konumsal yapının kombine optimizasyon teknikleri ile kontrolü: Konumsal planlama

    Contoroling spatial forest structure with meta-heuristics techniques in forest management planning: Spatial planning

    ALİ İHSAN KADIOĞULLARI

    Doktora

    Türkçe

    Türkçe

    2009

    Ormancılık ve Orman MühendisliğiKaradeniz Teknik Üniversitesi

    Orman Mühendisliği Ana Bilim Dalı

    PROF. DR. EMİN ZEKİ BAŞKENT