Kavram tabanlı türkçe arama makinesi
Concept-based Turkish seach engine
- Tez No: 97893
- Danışmanlar: DOÇ. DR. HAYRİ SEVER
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2000
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 113
Özet
IV ÖZET Varolan bilgi erişim sistemlerinin büyük kısmı Boolean mantık altında çalışmaktadır. Gerçekleştiriminin kolay olmasına karşın, Boolean tabanlı sistemlerin kullanıcıları istediklerini ifade etmekte güçlükler çekmektedirler. Kullanıcılarla belge yazarları arasında zaten bulunmakta olan terminolojik uçurum bu güçlüğü iyice artırmaktadır. Ayrıca, yapılan sorgulamaların en iyileştirildikten sonra saklanıp, daha sonra ihtiyaç duyulduğunda yeniden kullanılabilmesi de önemli bir sorundur. Bu sorunların çözümü için yeni modeller aramak gerekmektedir. Kavram Tabanlı Bilgi Erişim Modeli {Concept-Based Information Retrieval Model) bu arayışlar sonucu ortaya çıkmıştır. Kavram Tabanlı Bilgi Erişim Modeliyle getirilen bilgi tabanı ve kural ağacı kavramlarıyla yapılan sorgu hesaplamalarının maliyeti yüksek olmaktadır. Bu nedenle yeni bir yaklaşıma ihtiyaç duyulmaktadır. Bu konudaki yeni bir yaklaşım En Küçük Terim Kümeleri, ETK {Minimal Term Sets, MTS) olarak adlandırılmaktadır. ETK modeli aracılığı ile kullanıcıya, var olan bir sorgu başlıkları kümesi içinden kullanıcının ihtiyacını en iyi biçimde karşılayacak olardan belirli bir sıradan seçmesine olanak tanınmaktır. Böylece, kural ağaçlarıyla gelen hesaplama maliyetinden kurtulmak mümkün olmaktadır. Tez kapsamında, Türkçe belgeleri (ya da İnternet kaynaklarını) işleyebilen arama makinelerine olan gereksinimi çözümlemek için, HTML, SGML ve RDF/DC gibi işaretleme dilleriyle tanımlanmış belgeleri işleyebilen Isite/Isearch sistemi yerelleştirilmiştir. Yerelleştirme işi Türkçe karakterlerin tanıtılması, gövdeleme modülünün eklenmesi ve CGI sorgu arayüzlerini içermektedir. Yerelleştirilmiş Isite/Isearch sistemi, bir Türkçe RDF/DC düzenleyicisi olan H-DCEdit ile oluşturulmuş bibliyografik kataloglar içeren çeşitli veri tabanları üzerinde sulanmıştır. ETK yaklaşımı Isite/Isearch üstünde ayrı bir katman olarak modellenmiştir. Özel olarak bu modellemeyle amaçlanan, RDF/DC üst veri takılan üzerinde sorgulama yapılabilmesine olanak sağlayan Isite/Isearch arama makinesi üzerinden kullanıcı bilgi ihtiyacını, farklı alternatifleri kısmi hesaplama tarzıyla göz önünde bulundurarak karşılayabilmektir. Isearch sisteminin betimsel düzeyden kavramsal düzeye taşınması için gerekli algoritmalar üzerinde çalışılmış, sistemin gerçekleştirimi başka bir çalışmaya bırakılmıştır. ANAHTAR KELİMELER : Kavram Tabanlı Bilgi Erişim, En Küçük Terim Kümeleri, Isite/Isearch
Özet (Çeviri)
ABSTRACT The most part of existing information retrieval systems works under Boolean logic. Although, it is simple to implement, the users of Boolean based systems have difficulties in expressing their needs. The terminological gap which already exists between users and document writers increases these difficulties. Also, it is an another important problem that storing queries after refining them to reuse when needed. To look for new models to address these problems is needed. Concept-Based Information Retrieval Model has occured as a result of these searchings. The cost of query evaluation made by rule base and rule tree concepts introduced with Concept-Based Information Retrieval Model is high. So, a new approach is needed. The new approach in this subject is called as Minimal Term Sets, MTS. By the MTS model it is provided to the user to select the ones by turn, which satisfy the need of him best, from the query topic sets which exist. By this way, it is possible to get rid of the computation cost which stems from rule trees. In this thesis, to address the need of search engines operating on Turkish documents (or Internet resources), Isite/Isearch engine that has capability of handling documents described by a mark-up language (e.g., HTML, RDF/DC, SGML, etc.) have been localized. Localization work includes incorporation of Turkish fonts, stemming and CGI programs for query interface. The localized Isite/Isearch engine has been tested on various databases including bibliographical catalogs created via H-DCEdit which is a Turkish RDF/DC editor. MTS approach was modelled on Isite/Isearch as a distinct layer. Especially the aim of this modelling is to respond to the information need of user by considering partial computation of different alternatives through the Isite/Isearch search machine which is capable of querying over RDF/DC meta tags. Algorithms needed to move the Isearch from descriptor level to conceptual level has been worked, the implementation of system has been left to another work. KEY WORDS : Concept-Based Information Retrieval, Minimal Term Sets, Isite/Isearch
Benzer Tezler
- Nötrozofik mantığın görüntü bölütleme ve örüntü tanıma alanlarındaki yeni uygulamaları
Novel applications of neutrosophic logic in the fields of image segmentation and pattern recognition
YAMAN AKBULUT
Doktora
Türkçe
2018
Elektrik ve Elektronik MühendisliğiFırat ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ABDULKADİR ŞENGÜR
- Elektrik dağıtım sistemlerinde birey odaklı konfor öncelikli talep yönetimi için akıllı yöntem geliştirilmesi
Developing an intelligent method for the user oriented comfort based demand response studies in the electricity distribution systems
MEHMET ALİ SÖNMEZ
Doktora
Türkçe
2021
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektrik Mühendisliği Ana Bilim Dalı
PROF. DR. MUSTAFA BAĞRIYANIK
- Destek vektör regresyonu ile PID kontrolör tasarımı
Design of PID controller via support vector regression
KEMAL UÇAK
Yüksek Lisans
Türkçe
2012
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. GÜLAY ÖKE
- Gödel makinelerinde öğrenme sorunu
Learning problem in Gödel machines
ABDULLAH HANZALE KORKMAZ
Yüksek Lisans
Türkçe
2024
Felsefeİstanbul ÜniversitesiSistematik Felsefe ve Mantık Ana Bilim Dalı
PROF. DR. ÖZGÜÇ GÜVEN
- Marka sermayesinin oluşumu ve tüketici satınalma kararındaki etkisinin dayanıklı tüketim malları sektöründe incelenmesi
Creation of brand equity and its effects on consumer interactions in the purchase of consumer durable goods
BUKET BESEN
Doktora
Türkçe
2002
Mühendislik Bilimleriİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
PROF.DR. SELİME SEZGİN