Geri Dön

Kavram tabanlı türkçe arama makinesi

Concept-based Turkish seach engine

  1. Tez No: 97893
  2. Yazar: FUAT AKAL
  3. Danışmanlar: DOÇ. DR. HAYRİ SEVER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2000
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 113

Özet

IV ÖZET Varolan bilgi erişim sistemlerinin büyük kısmı Boolean mantık altında çalışmaktadır. Gerçekleştiriminin kolay olmasına karşın, Boolean tabanlı sistemlerin kullanıcıları istediklerini ifade etmekte güçlükler çekmektedirler. Kullanıcılarla belge yazarları arasında zaten bulunmakta olan terminolojik uçurum bu güçlüğü iyice artırmaktadır. Ayrıca, yapılan sorgulamaların en iyileştirildikten sonra saklanıp, daha sonra ihtiyaç duyulduğunda yeniden kullanılabilmesi de önemli bir sorundur. Bu sorunların çözümü için yeni modeller aramak gerekmektedir. Kavram Tabanlı Bilgi Erişim Modeli {Concept-Based Information Retrieval Model) bu arayışlar sonucu ortaya çıkmıştır. Kavram Tabanlı Bilgi Erişim Modeliyle getirilen bilgi tabanı ve kural ağacı kavramlarıyla yapılan sorgu hesaplamalarının maliyeti yüksek olmaktadır. Bu nedenle yeni bir yaklaşıma ihtiyaç duyulmaktadır. Bu konudaki yeni bir yaklaşım En Küçük Terim Kümeleri, ETK {Minimal Term Sets, MTS) olarak adlandırılmaktadır. ETK modeli aracılığı ile kullanıcıya, var olan bir sorgu başlıkları kümesi içinden kullanıcının ihtiyacını en iyi biçimde karşılayacak olardan belirli bir sıradan seçmesine olanak tanınmaktır. Böylece, kural ağaçlarıyla gelen hesaplama maliyetinden kurtulmak mümkün olmaktadır. Tez kapsamında, Türkçe belgeleri (ya da İnternet kaynaklarını) işleyebilen arama makinelerine olan gereksinimi çözümlemek için, HTML, SGML ve RDF/DC gibi işaretleme dilleriyle tanımlanmış belgeleri işleyebilen Isite/Isearch sistemi yerelleştirilmiştir. Yerelleştirme işi Türkçe karakterlerin tanıtılması, gövdeleme modülünün eklenmesi ve CGI sorgu arayüzlerini içermektedir. Yerelleştirilmiş Isite/Isearch sistemi, bir Türkçe RDF/DC düzenleyicisi olan H-DCEdit ile oluşturulmuş bibliyografik kataloglar içeren çeşitli veri tabanları üzerinde sulanmıştır. ETK yaklaşımı Isite/Isearch üstünde ayrı bir katman olarak modellenmiştir. Özel olarak bu modellemeyle amaçlanan, RDF/DC üst veri takılan üzerinde sorgulama yapılabilmesine olanak sağlayan Isite/Isearch arama makinesi üzerinden kullanıcı bilgi ihtiyacını, farklı alternatifleri kısmi hesaplama tarzıyla göz önünde bulundurarak karşılayabilmektir. Isearch sisteminin betimsel düzeyden kavramsal düzeye taşınması için gerekli algoritmalar üzerinde çalışılmış, sistemin gerçekleştirimi başka bir çalışmaya bırakılmıştır. ANAHTAR KELİMELER : Kavram Tabanlı Bilgi Erişim, En Küçük Terim Kümeleri, Isite/Isearch

Özet (Çeviri)

ABSTRACT The most part of existing information retrieval systems works under Boolean logic. Although, it is simple to implement, the users of Boolean based systems have difficulties in expressing their needs. The terminological gap which already exists between users and document writers increases these difficulties. Also, it is an another important problem that storing queries after refining them to reuse when needed. To look for new models to address these problems is needed. Concept-Based Information Retrieval Model has occured as a result of these searchings. The cost of query evaluation made by rule base and rule tree concepts introduced with Concept-Based Information Retrieval Model is high. So, a new approach is needed. The new approach in this subject is called as Minimal Term Sets, MTS. By the MTS model it is provided to the user to select the ones by turn, which satisfy the need of him best, from the query topic sets which exist. By this way, it is possible to get rid of the computation cost which stems from rule trees. In this thesis, to address the need of search engines operating on Turkish documents (or Internet resources), Isite/Isearch engine that has capability of handling documents described by a mark-up language (e.g., HTML, RDF/DC, SGML, etc.) have been localized. Localization work includes incorporation of Turkish fonts, stemming and CGI programs for query interface. The localized Isite/Isearch engine has been tested on various databases including bibliographical catalogs created via H-DCEdit which is a Turkish RDF/DC editor. MTS approach was modelled on Isite/Isearch as a distinct layer. Especially the aim of this modelling is to respond to the information need of user by considering partial computation of different alternatives through the Isite/Isearch search machine which is capable of querying over RDF/DC meta tags. Algorithms needed to move the Isearch from descriptor level to conceptual level has been worked, the implementation of system has been left to another work. KEY WORDS : Concept-Based Information Retrieval, Minimal Term Sets, Isite/Isearch

Benzer Tezler

  1. Nötrozofik mantığın görüntü bölütleme ve örüntü tanıma alanlarındaki yeni uygulamaları

    Novel applications of neutrosophic logic in the fields of image segmentation and pattern recognition

    YAMAN AKBULUT

    Doktora

    Türkçe

    Türkçe

    2018

    Elektrik ve Elektronik MühendisliğiFırat Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ABDULKADİR ŞENGÜR

  2. Elektrik dağıtım sistemlerinde birey odaklı konfor öncelikli talep yönetimi için akıllı yöntem geliştirilmesi

    Developing an intelligent method for the user oriented comfort based demand response studies in the electricity distribution systems

    MEHMET ALİ SÖNMEZ

    Doktora

    Türkçe

    Türkçe

    2021

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektrik Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA BAĞRIYANIK

  3. Destek vektör regresyonu ile PID kontrolör tasarımı

    Design of PID controller via support vector regression

    KEMAL UÇAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. GÜLAY ÖKE

  4. Gödel makinelerinde öğrenme sorunu

    Learning problem in Gödel machines

    ABDULLAH HANZALE KORKMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Felsefeİstanbul Üniversitesi

    Sistematik Felsefe ve Mantık Ana Bilim Dalı

    PROF. DR. ÖZGÜÇ GÜVEN

  5. Marka sermayesinin oluşumu ve tüketici satınalma kararındaki etkisinin dayanıklı tüketim malları sektöründe incelenmesi

    Creation of brand equity and its effects on consumer interactions in the purchase of consumer durable goods

    BUKET BESEN

    Doktora

    Türkçe

    Türkçe

    2002

    Mühendislik Bilimleriİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    PROF.DR. SELİME SEZGİN