Geri Dön

Varlık isimlerinin bağlı veriler (lınked data) kullanılarak anlamlandırılması

Named entity disambiguation using linked open data

  1. Tez No: 350357
  2. Yazar: ŞERZOD HAKİMOV
  3. Danışmanlar: DOÇ. DR. ERDOĞAN DOĞDU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilim ve Teknoloji, Science and Technology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2013
  8. Dil: İngilizce
  9. Üniversite: TOBB Ekonomi ve Teknoloji Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 60

Özet

Doğal dilde yazılmış metinlerde geçen kişi, kuruluş, yer ve benzeri isimlerin belirlenmesi varlık isimlerinin tespit edilmesi (named entity recognition) olarak adlandırılır. Benzer veya aynı isme sahip farklı türde varlık isimlerinin olması belirsizlik oluşturur. Belirsizliğin çözülmesi için aday varlık isimlerinin içinden doğru olanı seçilmelidir yani anlamlandırılmalıdır. İnsanlar bu problemi çözerken okudukları metnin içeriğinden yararlanarak doğru kararı verirler. Yazılımlarla çözüm üretmek için metnin içeriğinin anlaşılması gerekir. Varlık isimlerinin anlamlandırılması (named entity disambiguation) için birçok araştırma yapılmış ve devam etmektedir. Son zamanlarda Wikipedia gibi ansiklopedi verilerinin kullanıldığı projelerin bu alan için elde ettikleri başarı oranı yüksektir. DBpedia, YAGO, Freebase gibi semantic veritabanlarının bu alan için katkı sağlayacağı üzerine araştırmalar yürütülmektedir. Bu tezde kapsamında, varlık ismi anlamlandırılması için bağlı veri (linked data) ve çizge merkezlilik algoritması kullanarak geliştirdiğimiz bir teknik sunulmaktadır. Geliştirdiğimiz sistemin adı NERSO?dur. Bu sistem açık veri kümeleri ile test edilerek değerlendirilmiş, ayrıca diğer varlık ismi tespiti ve anlamlandırılması projeleri ile karşılaştırılmış ve sonuçlar bu tezde sunulmuştur. Elde ettiğimiz sonuçlara göre NERSO diğer araçlara benzer ve daha iyi sonuçlar vermektedir.

Özet (Çeviri)

Named entity recognition is the task of identifying named entities such as persons, organizations and locations in natural language texts. One of the problems in named entity recognition is that different entities having the same or similar names, that is the ambiguity problem. This problem requires a decision on choosing the right entity among a number of possible entities with the same or similar names. Human readers do this naturally when reading a text, because they are aware of the context. But, for the software to do this, a ?named entity disambiguation? task needs to be executed to decide about the right entities. There are many techniques developed for named entity recognition and disambiguation tasks in the literature. A recent approach in these tasks is using open knowledge bases such as Wikipedia, and more recently the structured linked data counterparts that are derived from Wikipedia and similar knowledge bases, such as DBpedia, YAGO, and Freebase. In this thesis, we present a named entity disambiguation technique that is based on using Linked Open Data and a graph centrality algorithm for disambiguation. The system we developed is called NERSO. We evaluated our system using publicly available data sets, and compare its performance with other named entity recognition and disambiguation (or annotation) tools, and present the results in this thesis. Our results show that NERSO performs either similar or better than the other tools.

Benzer Tezler

  1. Varlık isimleri arasındaki ilişkiler kullanılarak haberlerin öbeklenmesi

    News clustering using relations between named entities

    SALİH ATILAY OTO

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTOBB Ekonomi ve Teknoloji Üniversitesi

    Bilişim Sistemleri Ana Bilim Dalı

    DOÇ. DR. ERDOĞAN DOĞDU

  2. Un regard sur l'image du corps dans la littérature française des XXe et XXIe siècles

    20. ve 21. yüzyıl Fransız edebiyatında beden imgesine bir bakış

    KAMAR ARARAT KALPAKÇİYAN

    Yüksek Lisans

    Fransızca

    Fransızca

    2012

    Fransız Dili ve EdebiyatıGalatasaray Üniversitesi

    Fransız Dili ve Edebiyatı Ana Bilim Dalı

    YRD. DOÇ. DR. SEZA YILANCIOĞLU

  3. Türkiye'de azınlık gazeteleri: Apoyevmatini-Agos-Şalom

    The minoritys newspaper in Turkey: Apoyevmatini-Agos-Şalom

    ALPER URUŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2003

    GazetecilikAnadolu Üniversitesi

    Basın ve Yayın Ana Bilim Dalı

    DOÇ. DR. ALİ MURAT VURAL

  4. Named entity recognition in turkish using deep learning methods and joint learning

    Türkçe varlık isimlerinin tanınması için derin öğrenme ve birlikte öğrenme

    ARDA AKDEMİR

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. TUNGA GÜNGÖR

  5. Otomatik veri etiketleme ile varlık ismi tanıma

    Turkish named entity recognition automatically annotated data

    MUSTAFA KESKİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. BANU DİRİ