Geri Dön

Derin öğrenme yöntemleri ile ilişkisel doküman sınıflandırılması

Relational document classification with deep learning methods

  1. Tez No: 877743
  2. Yazar: HALİL İBRAHİM OKUR
  3. Danışmanlar: PROF. DR. AHMET SERTBAŞ
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: İstanbul Üniversitesi-Cerrahpaşa
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 106

Özet

Metin sınıflandırması, geniş ve karmaşık metin havuzlarından anlamlı bilgiler çıkarmak ve bu metinleri otomatik olarak kategorilere ayırmak için kullanılan doğal dil işleme (NLP) uygulamalarından biridir. Ancak, zengin morfolojik yapıya sahip dillerde ve çeşitli veri kaynaklarında bu yöntemler yetersiz kalabilir. Bu sorunu ele almak için, bu çalışma Named Entity Recognition (NER) modelleri ve ön eğitimli BERT tabanlı modeller ile Wikidata'dan elde edilen varlık-ilişki bilgilerinin metinlere entegrasyonunu araştırmaktadır. Türkçe ve İngilizce metin veri setleri üzerinde yapılan değerlendirmeler, çeşitli makine ve derin öğrenme sınıflandırma algoritmalarının performansını incelemiştir. Bulgular, varlık-ilişki bilgilerinin metinlere eklenmesi ile algoritmaların başarımını önemli ölçüde artırdığını göstermektedir. Özellikle BBC-News ve TTC-4900 veri setlerinde, ilişkisel bilgi entegrasyonu sınıflandırma başarısını belirgin şekilde iyileştirmiştir. Türkçe metinlerin zengin yapılarını etkin bir şekilde işleyebilmek için TRT-Haber web sayfasından elde edilen veri seti üzerinde graf tabanlı derin öğrenme teknikleri uygulanmış, bu tekniklerle dikkate değer bir doğruluk oranı elde edilmiştir. Araştırmanın sonuçları, ilişkisel bilginin eklenmesinin metin sınıflandırmasında etkinliğini ve potansiyelini göstermekte olup, Türkçe metinlerin daha iyi anlaşılmasına katkıda bulunmaktadır. Bu çalışma, ilişkisel metin sınıflandırma sistemlerinin geliştirilmesine önemli katkılar sağlamış ve gelecek araştırmalar için önemli bir referans noktası oluşturmuştur.

Özet (Çeviri)

Text classification, used to extract meaningful information from vast and complex pools of text and to categorically organize it automatically, is one of the applications of natural language processing (NLP). However, these methods can be insufficient for languages with rich morphological structures and diverse data sources. To address this issue, this study investigates the integration of entity-relation information from Wikidata into texts using Named Entity Recognition (NER) models and pre-trained BERT-based models. Evaluations conducted on Turkish and English text datasets have examined the performance of various machine learning and deep learning classification algorithms. Findings indicate that the addition of entity-relation information significantly enhances the performance of algorithms. Particularly, the integration of relational information has notably improved classification success in the BBC-News and TTC-4900 datasets. For effectively processing the complex structures of Turkish texts, graph-based deep learning techniques have been applied to a dataset obtained from the TRT-News website, achieving a noteworthy accuracy rate. The results demonstrate the efficacy and potential of adding relational information in text classification, contributing to a better understanding of Turkish texts. This research has made significant contributions to the development of relational text classification systems and has established an important reference point for future studies.

Benzer Tezler

  1. Çocuk kalp damar cerrahisi yoğun bakım ünitesinde postoperatif kavşak kaynaklı ektopik taşikardi; sıklık ve risk faktörleri

    Junctional ectopic tachycardia after pediatric cardiac surgery; incidence and outcome

    NESLİHAN KIPLAPINAR

    Tıpta Yan Dal Uzmanlık

    Türkçe

    Türkçe

    2013

    Göğüs Kalp ve Damar CerrahisiSağlık Bakanlığı

    Çocuk Sağlığı ve Hastalıkları Ana Bilim Dalı

    DOÇ. DR. ENDER ÖDEMİŞ

  2. 8 haftalık futbol antrenmanının 14-16 yaş grubundaki öğrencilerin fiziksel ve fizyolojik özellikleri üzerine etkileri

    The effects of an eight weeks football workout on the physical and physiological features of students in the 14-16 age group

    METİN KOCADAĞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    SporHarran Üniversitesi

    Beden Eğitimi ve Spor Ana Bilim Dalı

    YRD. DOÇ. DR. ŞEBNEM ŞARVAN CENGİZ

  3. Ege Üniversitesi Etnografya Müzesinde bulunan takıların teknik ve tasarım özelliklerinin incelenmesi

    Ethnographic museum of the University of the Aegean jewellery found properties of technical and design

    MÜJGAN EMRE EROĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Güzel SanatlarDokuz Eylül Üniversitesi

    Tekstil ve Moda Tasarımı Ana Sanat Dalı

    YRD. DOÇ. DR. FÜSUN ÖZPULAT

  4. Yavuz Sultan Selim Dönemi Kültür ve Edebiyatı

    The Culture and Literature in the era of Yavuz Sultan Selim

    ÖMER GÖKHAN YAĞCI

    Doktora

    Türkçe

    Türkçe

    2014

    Türk Dili ve EdebiyatıKırıkkale Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    PROF. DR. MUHİTTİN ELİAÇIK

  5. Deri ve yumuşak doku enfeksiyonu etkeni olan toplum ve hastane kaynaklı staphylococcus aureus izolatlarının antimikrobiyal duyarlılık durumlarının ve panton valentıne leukocıdın toksini sıklığının araştırılması

    Investigation of panton valentine leukocidin toxin frequency and antimicrobial susceptibilities of community and hospital acquired staphylococcus aureus isolates related with skin and soft tissue infections

    TÜLİN DEMİR

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2008

    MikrobiyolojiSağlık Bakanlığı

    Tıbbi Mikrobiyoloji Ana Bilim Dalı

    DR. NİLAY ÇÖPLÜ