Geri Dön

News information retrieval over Albanian language documents

Arnavutça dilinde haber arama ve erişim sistemi

  1. Tez No: 510588
  2. Yazar: BERRU KJAZIMI
  3. Danışmanlar: DOÇ. DR. ÖZGÜR YILMAZEL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: İngilizce
  9. Üniversite: Anadolu Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 47

Özet

Bu araştırmada Arnavutça Dilini ve toplumun gelişmesi için belirli bir dilde bilgi edinme ve sistem uyarlamalarına erişme ilkeleri incelenmiştir. Serbest metin aramalarının dil kullanımına bağlı olduğu bilinmektedir. Sonuç olarak, Standart Analizör'ün içine Arnavutça Dilinin bağlaçları eklenmiş ve standart analizörde değişiklik yapılmıştır. Bu bağlaçlar eklendikten sonra, tam metin indeksleme imkanı sunan Lucene adlı açık kaynak kodlu bir metin kütüphanesi kullanılarak veriler indekslenmiştir. Lucene kullanılarak değişiklik yapılmış standart analizörün üç farklı analizörle karşılaştırılması yapılmıştır. Verileri indekslemek için Arnavutça konuşulan üç farklı ülkedeki çok okunan beş farklı gazeteden elli farklı konuyu içeren ve belirli bir zaman aralığında toplanan verilerle test edilmiştir. Toplanmış verilerden edilen sonuçlara göre her bir analizör doğruluk düzeyine göre sıralanmış ve değerlendirilmiştir. Arnavutça dökümanlardan elde edilen verilere dayanarak çıkarılan sonuclara göre, bu dildeki bağlaçlar eklendiğinde sistemin daha iyi sonuç verdiği ve Arnavutça verilerini diğer dillerle karşılaştırarak elde ettiğimiz verilere göre İtalyan analizörün en iyi performansı gösterdiği sonucuna varılmıştır. Bu araştırmayla ilgili veri kümesi, başlıklar ve diğer tüm ilgili konulara https://github.com/berruqazimi/InformationRetrivealInAlbanian adresinden erişilebilir.

Özet (Çeviri)

Throughout the examination of thesis we screened the Albanian language and its principles to permit information retrieval for community development and adaption of system in a specific language. We already know free text searches are highly dependent in use of language. As an outcome we modified Standard Analyzer for Albanian language where all Albanian stopwords were added inside the analyzer. We accomplished the objective by using open source text retrieval library named Lucene which requires full text indexing afterwards, searching capability. Exploiting Lucene, the distinction of modified standard analyzer with three different analyzers were made. For indexing data we exploited our collection of data which is collected by five different most frequented newspapers in Albanian speaking countries at specific time period followed by fifty topics. As a result of retrieval, each analyzer were judged by relevance and later were evaluated. We marked that retrieved relevant documents for Albanian results, are getting improved by adding stopword list in that language, besides we noticed that Italian analyzer performed better for retrieving Albanian documents compared with other languages. Dataset, topics, qrels and other stuff related to this research are available at this link https://github.com/berruqazimi/InformationRetrivealInAlbanian.

Benzer Tezler

  1. New event detection and tracking in Turkish

    Türkçe'de yeni olay belirleme ve izleme

    SÜLEYMAN KARDAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2009

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Bölümü

    PROF. DR. FAZLI CAN

    YRD. DOÇ. DR. SEYİT KOÇBERBER

  2. Novelty detection in topic tracking

    Konu izlemede yenilik bulma

    CEM AKSOY

    Yüksek Lisans

    İngilizce

    İngilizce

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. FAZLI CAN

    YRD. DOÇ. DR. SEYİT KOÇBERBER

  3. Developing tools to support the search needs of news readers and news writers

    Haber okuyucuları ve yazarlarının haber arama ihtiyaçları için araçlar geliştirilmesi

    KENAN FAYOUMİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ REYYAN YENİTERZİ

  4. Türkçe zamansal ifadelerin etiketlenmesi ve normalleştirilmesi

    Başlık çevirisi yok

    AYŞENUR GENÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET CÜNEYD TANTUĞ

  5. On-line new event detection and tracking in a multi-resource environment

    Çok kanallı kaynak ortamında çevrim içi yeni olay belirleme ve takibi

    HAKAN KURT

    Yüksek Lisans

    İngilizce

    İngilizce

    2001

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HALİL ALTAY GÜVENİR