News information retrieval over Albanian language documents
Arnavutça dilinde haber arama ve erişim sistemi
- Tez No: 510588
- Danışmanlar: DOÇ. DR. ÖZGÜR YILMAZEL
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: İngilizce
- Üniversite: Anadolu Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 47
Özet
Bu araştırmada Arnavutça Dilini ve toplumun gelişmesi için belirli bir dilde bilgi edinme ve sistem uyarlamalarına erişme ilkeleri incelenmiştir. Serbest metin aramalarının dil kullanımına bağlı olduğu bilinmektedir. Sonuç olarak, Standart Analizör'ün içine Arnavutça Dilinin bağlaçları eklenmiş ve standart analizörde değişiklik yapılmıştır. Bu bağlaçlar eklendikten sonra, tam metin indeksleme imkanı sunan Lucene adlı açık kaynak kodlu bir metin kütüphanesi kullanılarak veriler indekslenmiştir. Lucene kullanılarak değişiklik yapılmış standart analizörün üç farklı analizörle karşılaştırılması yapılmıştır. Verileri indekslemek için Arnavutça konuşulan üç farklı ülkedeki çok okunan beş farklı gazeteden elli farklı konuyu içeren ve belirli bir zaman aralığında toplanan verilerle test edilmiştir. Toplanmış verilerden edilen sonuçlara göre her bir analizör doğruluk düzeyine göre sıralanmış ve değerlendirilmiştir. Arnavutça dökümanlardan elde edilen verilere dayanarak çıkarılan sonuclara göre, bu dildeki bağlaçlar eklendiğinde sistemin daha iyi sonuç verdiği ve Arnavutça verilerini diğer dillerle karşılaştırarak elde ettiğimiz verilere göre İtalyan analizörün en iyi performansı gösterdiği sonucuna varılmıştır. Bu araştırmayla ilgili veri kümesi, başlıklar ve diğer tüm ilgili konulara https://github.com/berruqazimi/InformationRetrivealInAlbanian adresinden erişilebilir.
Özet (Çeviri)
Throughout the examination of thesis we screened the Albanian language and its principles to permit information retrieval for community development and adaption of system in a specific language. We already know free text searches are highly dependent in use of language. As an outcome we modified Standard Analyzer for Albanian language where all Albanian stopwords were added inside the analyzer. We accomplished the objective by using open source text retrieval library named Lucene which requires full text indexing afterwards, searching capability. Exploiting Lucene, the distinction of modified standard analyzer with three different analyzers were made. For indexing data we exploited our collection of data which is collected by five different most frequented newspapers in Albanian speaking countries at specific time period followed by fifty topics. As a result of retrieval, each analyzer were judged by relevance and later were evaluated. We marked that retrieved relevant documents for Albanian results, are getting improved by adding stopword list in that language, besides we noticed that Italian analyzer performed better for retrieving Albanian documents compared with other languages. Dataset, topics, qrels and other stuff related to this research are available at this link https://github.com/berruqazimi/InformationRetrivealInAlbanian.
Benzer Tezler
- New event detection and tracking in Turkish
Türkçe'de yeni olay belirleme ve izleme
SÜLEYMAN KARDAŞ
Yüksek Lisans
İngilizce
2009
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Bölümü
PROF. DR. FAZLI CAN
YRD. DOÇ. DR. SEYİT KOÇBERBER
- Novelty detection in topic tracking
Konu izlemede yenilik bulma
CEM AKSOY
Yüksek Lisans
İngilizce
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. FAZLI CAN
YRD. DOÇ. DR. SEYİT KOÇBERBER
- Developing tools to support the search needs of news readers and news writers
Haber okuyucuları ve yazarlarının haber arama ihtiyaçları için araçlar geliştirilmesi
KENAN FAYOUMİ
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ REYYAN YENİTERZİ
- Türkçe zamansal ifadelerin etiketlenmesi ve normalleştirilmesi
Başlık çevirisi yok
AYŞENUR GENÇ
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET CÜNEYD TANTUĞ
- On-line new event detection and tracking in a multi-resource environment
Çok kanallı kaynak ortamında çevrim içi yeni olay belirleme ve takibi
HAKAN KURT
Yüksek Lisans
İngilizce
2001
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HALİL ALTAY GÜVENİR