Geri Dön

Türkçe alt kategorili varlık ismi tanıma ile otomatik etiketleme

Automatic tagging with Turkish fine-grained named entity recognition

  1. Tez No: 882655
  2. Yazar: LOLA KHUDOYBERDIEVA
  3. Danışmanlar: PROF. DR. BANU DİRİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 63

Özet

Varlık İsmi Tanıma, metin içerisindeki varlık isimlerini bulma ve etiketleme işlemidir. İlişki çıkarma, bilgi tabanı oluşturma ve soru cevaplama gibi farklı uygulama alanlarında varlıkların alt kategorilerinin de kullanılması ayrıca önemlidir. Ancak, bu kapsamda Türkçe çalışmalar yetersiz kalmaktadır. Bu eksikliği gidermek adına çalışmamızda Türkçe için büyük ölçekli 23 farklı alt kategoriye sahip bir veri kümesi oluşturulmuştur. Bu alt kategoriler kişi, kurum ve yer varlıklarının alt kırılımlarından oluşmaktadır. Çalışmada Türkçe ile eğitilen dönüştürücü tabanlı modeller ile denemeler yapılmış ve üst varlık isimlerinin tespit edilmesinde 93,34 F1 puanı alınmıştır. Bu puan Türkçe alınmış başarılara yakın bir sonuçken, alt kırılımlı kategoriler için başarı performansı 79,82 olmuştur.

Özet (Çeviri)

Named Entity Recognition is the process of finding and labelling entity names in a text. It is also important to use fine-grained entities in different application areas such as relation extraction, knowledge base building and question answering. However, studies in Turkish are insufficient for this context. In order to overcome this deficiency, we created a large-scale dataset with 23 different fine-grained entities for Turkish. These fine-grained entities consist of subcategories of people, institutions and place entities. In this study, experiments were conducted with the transformer-based models in Turkish. While a F1 score of 93.34, which is close to the state-of-the-art for Turkish, was obtained for general entity names, the performance for subcategories was 79.82.

Benzer Tezler

  1. A hybrid method for toponym recognition on informal Turkish text

    Gündelik Türkçe metinlerde hibrit yöntemle yer isimlerini tanıma

    MERYEM KILINÇ

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. PINAR KARAGÖZ

  2. Fatih Erdoğan'ın 'Sihirli Kitaplar' serisinin duyarlık eğitimi bağlamında incelenmesi

    The examination of Fatih Erdogan's 'Magic Books' series in the context of sensivity education

    AYSUN BARAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Eğitim ve ÖğretimKırşehir Ahi Evran Üniversitesi

    Türkçe ve Sosyal Bilimler Eğitimi Ana Bilim Dalı

    DOÇ. DR. MUSTAFA TÜRKYILMAZ

  3. Milli görüş gençliğinin siyasal toplumsallaşma süreci

    Political socialization process of milli görüş youth

    EBUBEKİR SIDDIK UĞUZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Siyasal BilimlerSelçuk Üniversitesi

    Sosyoloji Ana Bilim Dalı

    PROF. DR. ERTAN ÖZENSEL

  4. Eski Anadolu Türkçesinde epistemik kiplik: Kısas-ı Enbiya örneği

    Epistemic modality in old Anatolian Turkish: The case of Kısas-i Enbiya

    MELİKE ÜZÜM

    Doktora

    Türkçe

    Türkçe

    2017

    DilbilimHacettepe Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    PROF. DR. NURETTİN DEMİR

  5. Lisans ve yüksek lisans öğrencilerinin ideal liderlik algılamaları ve buna yönelik bir uygulama

    Ideal leadership perception of undergraduate and graduate students: An application

    NESİM MİZRAHİTOKATLI

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    İşletmeİstanbul Aydın Üniversitesi

    İşletme Ana Bilim Dalı

    YRD. DOÇ. DR. NEŞE SAĞLAM