Derin öğrenme yöntemleri ile ilişkisel doküman sınıflandırılması
Relational document classification with deep learning methods
- Tez No: 877743
- Danışmanlar: PROF. DR. AHMET SERTBAŞ
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: İstanbul Üniversitesi-Cerrahpaşa
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 106
Özet
Metin sınıflandırması, geniş ve karmaşık metin havuzlarından anlamlı bilgiler çıkarmak ve bu metinleri otomatik olarak kategorilere ayırmak için kullanılan doğal dil işleme (NLP) uygulamalarından biridir. Ancak, zengin morfolojik yapıya sahip dillerde ve çeşitli veri kaynaklarında bu yöntemler yetersiz kalabilir. Bu sorunu ele almak için, bu çalışma Named Entity Recognition (NER) modelleri ve ön eğitimli BERT tabanlı modeller ile Wikidata'dan elde edilen varlık-ilişki bilgilerinin metinlere entegrasyonunu araştırmaktadır. Türkçe ve İngilizce metin veri setleri üzerinde yapılan değerlendirmeler, çeşitli makine ve derin öğrenme sınıflandırma algoritmalarının performansını incelemiştir. Bulgular, varlık-ilişki bilgilerinin metinlere eklenmesi ile algoritmaların başarımını önemli ölçüde artırdığını göstermektedir. Özellikle BBC-News ve TTC-4900 veri setlerinde, ilişkisel bilgi entegrasyonu sınıflandırma başarısını belirgin şekilde iyileştirmiştir. Türkçe metinlerin zengin yapılarını etkin bir şekilde işleyebilmek için TRT-Haber web sayfasından elde edilen veri seti üzerinde graf tabanlı derin öğrenme teknikleri uygulanmış, bu tekniklerle dikkate değer bir doğruluk oranı elde edilmiştir. Araştırmanın sonuçları, ilişkisel bilginin eklenmesinin metin sınıflandırmasında etkinliğini ve potansiyelini göstermekte olup, Türkçe metinlerin daha iyi anlaşılmasına katkıda bulunmaktadır. Bu çalışma, ilişkisel metin sınıflandırma sistemlerinin geliştirilmesine önemli katkılar sağlamış ve gelecek araştırmalar için önemli bir referans noktası oluşturmuştur.
Özet (Çeviri)
Text classification, used to extract meaningful information from vast and complex pools of text and to categorically organize it automatically, is one of the applications of natural language processing (NLP). However, these methods can be insufficient for languages with rich morphological structures and diverse data sources. To address this issue, this study investigates the integration of entity-relation information from Wikidata into texts using Named Entity Recognition (NER) models and pre-trained BERT-based models. Evaluations conducted on Turkish and English text datasets have examined the performance of various machine learning and deep learning classification algorithms. Findings indicate that the addition of entity-relation information significantly enhances the performance of algorithms. Particularly, the integration of relational information has notably improved classification success in the BBC-News and TTC-4900 datasets. For effectively processing the complex structures of Turkish texts, graph-based deep learning techniques have been applied to a dataset obtained from the TRT-News website, achieving a noteworthy accuracy rate. The results demonstrate the efficacy and potential of adding relational information in text classification, contributing to a better understanding of Turkish texts. This research has made significant contributions to the development of relational text classification systems and has established an important reference point for future studies.
Benzer Tezler
- Örgüt topluluklarında yeni örgüt formlarının oluşumu: Türkiye ve Avrupa bağlamında bir araştırma
Formation of new organizational forms in organizational populations: A study in the context of Türkiye and Europe
SENCER ÖZEL
Doktora
Türkçe
2024
İşletmeGalatasaray Üniversitesiİşletme Ana Bilim Dalı
PROF. DR. NACİYE AYLİN ATAAY SAYBAŞILI
- A multilayer network analysis of agendas in different realms of architecture
Mimarlık gündeminin çok katmanlı ağ analizi yöntemi ile değerlendirilmesi
MELİS BALOĞLU
Doktora
İngilizce
2024
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
PROF. DR. YÜKSEL DEMİR
- Disiplinlerarası yaklaşım temelli geliştirilen öğretim programı tasarımının fen eğitiminde eleştirel düşünme becerilerine, sorgulayıcı öğrenme becerileri algısına, derse yönelik tutumlarına ve akademik başarılarına etkisinin incelenmesi
Examining the effect of interdisciplinary approach based developed curriculum design on critical thinking skills, inquiry learning skills perception, attitudes and academic achievements in science education
HALİL İBRAHİM ÖZTÜRK
Doktora
Türkçe
2019
Eğitim ve ÖğretimÇukurova ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BİRSEL AYBEK
- Bilimsel makalelerin anlamsal ilişki tabanlı özetlenmesi
Semantic relations-based summarizing of scientific articles
MEHTAP ÜLKER
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET BEDRİ ÖZER
- Network attack classification with few-shot learning methods
Az atışlı öğrenme yöntemleri kullanarak ağ saldırı sınıflandırılması
İSMAİL TÜZÜN
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. PELİN ANGIN