Türkçe alt kategorili varlık ismi tanıma ile otomatik etiketleme
Automatic tagging with Turkish fine-grained named entity recognition
- Tez No: 882655
- Danışmanlar: PROF. DR. BANU DİRİ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 63
Özet
Varlık İsmi Tanıma, metin içerisindeki varlık isimlerini bulma ve etiketleme işlemidir. İlişki çıkarma, bilgi tabanı oluşturma ve soru cevaplama gibi farklı uygulama alanlarında varlıkların alt kategorilerinin de kullanılması ayrıca önemlidir. Ancak, bu kapsamda Türkçe çalışmalar yetersiz kalmaktadır. Bu eksikliği gidermek adına çalışmamızda Türkçe için büyük ölçekli 23 farklı alt kategoriye sahip bir veri kümesi oluşturulmuştur. Bu alt kategoriler kişi, kurum ve yer varlıklarının alt kırılımlarından oluşmaktadır. Çalışmada Türkçe ile eğitilen dönüştürücü tabanlı modeller ile denemeler yapılmış ve üst varlık isimlerinin tespit edilmesinde 93,34 F1 puanı alınmıştır. Bu puan Türkçe alınmış başarılara yakın bir sonuçken, alt kırılımlı kategoriler için başarı performansı 79,82 olmuştur.
Özet (Çeviri)
Named Entity Recognition is the process of finding and labelling entity names in a text. It is also important to use fine-grained entities in different application areas such as relation extraction, knowledge base building and question answering. However, studies in Turkish are insufficient for this context. In order to overcome this deficiency, we created a large-scale dataset with 23 different fine-grained entities for Turkish. These fine-grained entities consist of subcategories of people, institutions and place entities. In this study, experiments were conducted with the transformer-based models in Turkish. While a F1 score of 93.34, which is close to the state-of-the-art for Turkish, was obtained for general entity names, the performance for subcategories was 79.82.
Benzer Tezler
- A hybrid method for toponym recognition on informal Turkish text
Gündelik Türkçe metinlerde hibrit yöntemle yer isimlerini tanıma
MERYEM KILINÇ
Yüksek Lisans
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. PINAR KARAGÖZ
- Fatih Erdoğan'ın 'Sihirli Kitaplar' serisinin duyarlık eğitimi bağlamında incelenmesi
The examination of Fatih Erdogan's 'Magic Books' series in the context of sensivity education
AYSUN BARAN
Yüksek Lisans
Türkçe
2022
Eğitim ve ÖğretimKırşehir Ahi Evran ÜniversitesiTürkçe ve Sosyal Bilimler Eğitimi Ana Bilim Dalı
DOÇ. DR. MUSTAFA TÜRKYILMAZ
- Milli görüş gençliğinin siyasal toplumsallaşma süreci
Political socialization process of milli görüş youth
EBUBEKİR SIDDIK UĞUZ
Yüksek Lisans
Türkçe
2019
Siyasal BilimlerSelçuk ÜniversitesiSosyoloji Ana Bilim Dalı
PROF. DR. ERTAN ÖZENSEL
- Eski Anadolu Türkçesinde epistemik kiplik: Kısas-ı Enbiya örneği
Epistemic modality in old Anatolian Turkish: The case of Kısas-i Enbiya
MELİKE ÜZÜM
Doktora
Türkçe
2017
DilbilimHacettepe ÜniversitesiTürk Dili ve Edebiyatı Ana Bilim Dalı
PROF. DR. NURETTİN DEMİR
- Lisans ve yüksek lisans öğrencilerinin ideal liderlik algılamaları ve buna yönelik bir uygulama
Ideal leadership perception of undergraduate and graduate students: An application
NESİM MİZRAHİTOKATLI
Yüksek Lisans
Türkçe
2016
İşletmeİstanbul Aydın Üniversitesiİşletme Ana Bilim Dalı
YRD. DOÇ. DR. NEŞE SAĞLAM