Derin öğrenme yöntemleri ile ilişkisel doküman sınıflandırılması
Relational document classification with deep learning methods
- Tez No: 877743
- Danışmanlar: PROF. DR. AHMET SERTBAŞ
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: İstanbul Üniversitesi-Cerrahpaşa
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 106
Özet
Metin sınıflandırması, geniş ve karmaşık metin havuzlarından anlamlı bilgiler çıkarmak ve bu metinleri otomatik olarak kategorilere ayırmak için kullanılan doğal dil işleme (NLP) uygulamalarından biridir. Ancak, zengin morfolojik yapıya sahip dillerde ve çeşitli veri kaynaklarında bu yöntemler yetersiz kalabilir. Bu sorunu ele almak için, bu çalışma Named Entity Recognition (NER) modelleri ve ön eğitimli BERT tabanlı modeller ile Wikidata'dan elde edilen varlık-ilişki bilgilerinin metinlere entegrasyonunu araştırmaktadır. Türkçe ve İngilizce metin veri setleri üzerinde yapılan değerlendirmeler, çeşitli makine ve derin öğrenme sınıflandırma algoritmalarının performansını incelemiştir. Bulgular, varlık-ilişki bilgilerinin metinlere eklenmesi ile algoritmaların başarımını önemli ölçüde artırdığını göstermektedir. Özellikle BBC-News ve TTC-4900 veri setlerinde, ilişkisel bilgi entegrasyonu sınıflandırma başarısını belirgin şekilde iyileştirmiştir. Türkçe metinlerin zengin yapılarını etkin bir şekilde işleyebilmek için TRT-Haber web sayfasından elde edilen veri seti üzerinde graf tabanlı derin öğrenme teknikleri uygulanmış, bu tekniklerle dikkate değer bir doğruluk oranı elde edilmiştir. Araştırmanın sonuçları, ilişkisel bilginin eklenmesinin metin sınıflandırmasında etkinliğini ve potansiyelini göstermekte olup, Türkçe metinlerin daha iyi anlaşılmasına katkıda bulunmaktadır. Bu çalışma, ilişkisel metin sınıflandırma sistemlerinin geliştirilmesine önemli katkılar sağlamış ve gelecek araştırmalar için önemli bir referans noktası oluşturmuştur.
Özet (Çeviri)
Text classification, used to extract meaningful information from vast and complex pools of text and to categorically organize it automatically, is one of the applications of natural language processing (NLP). However, these methods can be insufficient for languages with rich morphological structures and diverse data sources. To address this issue, this study investigates the integration of entity-relation information from Wikidata into texts using Named Entity Recognition (NER) models and pre-trained BERT-based models. Evaluations conducted on Turkish and English text datasets have examined the performance of various machine learning and deep learning classification algorithms. Findings indicate that the addition of entity-relation information significantly enhances the performance of algorithms. Particularly, the integration of relational information has notably improved classification success in the BBC-News and TTC-4900 datasets. For effectively processing the complex structures of Turkish texts, graph-based deep learning techniques have been applied to a dataset obtained from the TRT-News website, achieving a noteworthy accuracy rate. The results demonstrate the efficacy and potential of adding relational information in text classification, contributing to a better understanding of Turkish texts. This research has made significant contributions to the development of relational text classification systems and has established an important reference point for future studies.
Benzer Tezler
- Çocuk kalp damar cerrahisi yoğun bakım ünitesinde postoperatif kavşak kaynaklı ektopik taşikardi; sıklık ve risk faktörleri
Junctional ectopic tachycardia after pediatric cardiac surgery; incidence and outcome
NESLİHAN KIPLAPINAR
Tıpta Yan Dal Uzmanlık
Türkçe
2013
Göğüs Kalp ve Damar CerrahisiSağlık BakanlığıÇocuk Sağlığı ve Hastalıkları Ana Bilim Dalı
DOÇ. DR. ENDER ÖDEMİŞ
- 8 haftalık futbol antrenmanının 14-16 yaş grubundaki öğrencilerin fiziksel ve fizyolojik özellikleri üzerine etkileri
The effects of an eight weeks football workout on the physical and physiological features of students in the 14-16 age group
METİN KOCADAĞ
Yüksek Lisans
Türkçe
2014
SporHarran ÜniversitesiBeden Eğitimi ve Spor Ana Bilim Dalı
YRD. DOÇ. DR. ŞEBNEM ŞARVAN CENGİZ
- Ege Üniversitesi Etnografya Müzesinde bulunan takıların teknik ve tasarım özelliklerinin incelenmesi
Ethnographic museum of the University of the Aegean jewellery found properties of technical and design
MÜJGAN EMRE EROĞLU
Yüksek Lisans
Türkçe
2013
Güzel SanatlarDokuz Eylül ÜniversitesiTekstil ve Moda Tasarımı Ana Sanat Dalı
YRD. DOÇ. DR. FÜSUN ÖZPULAT
- Yavuz Sultan Selim Dönemi Kültür ve Edebiyatı
The Culture and Literature in the era of Yavuz Sultan Selim
ÖMER GÖKHAN YAĞCI
Doktora
Türkçe
2014
Türk Dili ve EdebiyatıKırıkkale ÜniversitesiTürk Dili ve Edebiyatı Ana Bilim Dalı
PROF. DR. MUHİTTİN ELİAÇIK
- Deri ve yumuşak doku enfeksiyonu etkeni olan toplum ve hastane kaynaklı staphylococcus aureus izolatlarının antimikrobiyal duyarlılık durumlarının ve panton valentıne leukocıdın toksini sıklığının araştırılması
Investigation of panton valentine leukocidin toxin frequency and antimicrobial susceptibilities of community and hospital acquired staphylococcus aureus isolates related with skin and soft tissue infections
TÜLİN DEMİR
Tıpta Uzmanlık
Türkçe
2008
MikrobiyolojiSağlık BakanlığıTıbbi Mikrobiyoloji Ana Bilim Dalı
DR. NİLAY ÇÖPLÜ