Geri Dön

New event detection and tracking in Turkish

Türkçe'de yeni olay belirleme ve izleme

  1. Tez No: 246585
  2. Yazar: SÜLEYMAN KARDAŞ
  3. Danışmanlar: PROF. DR. FAZLI CAN, YRD. DOÇ. DR. SEYİT KOÇBERBER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2009
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
  12. Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  13. Sayfa Sayısı: 92

Özet

Son on yılda internet üzerindeki bilgi kaynakları sürekli artmaktadır ve buna bağlı olarak Web üzerinde bilginin büyüklüğü de hızla çoğalmaktadır. Bu, çevrimiçi haber ve haber kaynakları için de geçerlidir. Haber okuyucuları, daha çok ilgi duydukları konular hakkındaki haberleri okumayı tercih ederler. Yeni olay belirlemeve izleme (YOBİ) uygulamaları zaman sırasıyla gelmekte olan bir haber dizisinde yeni olaylara karşılık gelen ilk haberleri bulmayı ve bu ilk haberlerin tanımlamış olduğu konular ile ilgili haberleri kümelemeyi hedefler. Literatürde YOBİ daha çok konu tanıma ve izleme (KTİ) adıyla bilinmektedir. Bu tezde, çok sayıda Türkçe Web haber kaynağından sağlanan haberler kullanılarak anında yeni olay belirleme ve izleme problemleri Türkçe icin geliştirilmiş bu konuyla ilgili ilk büyük deney derlemi (BilCol2005) kullanılarak araştırılmıştır. Bu deney derlemi 2005 yılı 209,305 adet haberden oluşmuş olup 80 adet tekil konu ve ilgili hikayeleri ile birlikte insanlar tarafından etiketlenmiştir. Çalışmada Türkçe YOBİ işlemlerinde bazı benzerlik hesaplama katsayıları için her bir kelimenin ilk 5-6 harfin o kelimenin kökü olarak kullanmanın dilin morfolojik yapısını kullanan karmaşık bir kök bulma yaklaşım ile yarışabildiği gösterilmiştir. Aynı zamanda kelime durma listesi kullanımının sistem başarımını kayda değer düzeyde etkilediği ve iki farklı benzerlik hesaplama yönteminin sağladığı güvenlik skorlarının sade bir yaklaşımla birleştirerek sistem etkinliğinin yükseltilebileceği gösterilmektedir.

Özet (Çeviri)

The amount of information and the number of information resources on the Internet have been growing rapidly for over a decade. This is also true for on-line news and news providers. To overcome information overload news consumers prefer to track the topics that they are interested in. Topic detection and tracking (TDT) applications aim to organize the temporally ordered stories of a news stream according to the events. Two major problems in TDT are new event detection (NED) and topic tracking (TT). These problems respectively focus on finding the first stories of previously unseen new events and all subsequent stories on a certain topic defined by a small number of initial stories. In this thesis, the NED and TT problems are investigated in detail using the first large-scale test collection (BilCol2005) developed by Bilkent Information Retrieval Group. The collection contains 209,305 documents from the entire year of 2005 and involves several events in which eighty of them are annotated by humans. The experimental results show that a simple word truncation stemming method can statistically compete with a sophisticated stemming approach that pays attention to the morphological structure of the language. Our statistical findings illustrate that word stopping and the contents of the associated stopword list are important and removing the stopwords from content can significantly improve the system performance. We demonstrate that the confidence scores of two different similarity measures can be combined in a straightforward manner for improving the effectiveness.

Benzer Tezler

  1. On-line new event detection and tracking in a multi-resource environment

    Çok kanallı kaynak ortamında çevrim içi yeni olay belirleme ve takibi

    HAKAN KURT

    Yüksek Lisans

    İngilizce

    İngilizce

    2001

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HALİL ALTAY GÜVENİR

  2. Novelty detection in topic tracking

    Konu izlemede yenilik bulma

    CEM AKSOY

    Yüksek Lisans

    İngilizce

    İngilizce

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. FAZLI CAN

    YRD. DOÇ. DR. SEYİT KOÇBERBER

  3. Online new event detection and clustering using the concepts of the cover coefficient-based clustering methodology

    Kaplama katsayısı tabanlı küme oluşturma metodolojisi kullanarak anında yeni olay belirleme ve küme oluşturma

    AHMET VURAL

    Yüksek Lisans

    İngilizce

    İngilizce

    2002

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. FAZLI CAN

  4. Bilkent news portal: A system with new event detection and tracking capabilities

    Bilkent haber portalı: Yeni olay belirleme ve izleme yetenekleri olan bir sistem

    HÜSEYİN ÇAĞDAŞ ÖCALAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2009

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Bölümü

    PROF. DR. FAZLI CAN

    YRD. DOÇ. SEYİT KOÇBERBER

  5. Türkçe metinlerden anlamsal bilgi çıkarımı için bir veri madenciliği uygulaması

    A data mining application for extracting semantic information from Turkish texts

    ABDULLAH ALPHAN ARSLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBaşkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HASAN OĞUL