Geri Dön

Türkçe dizi etiketleme için sinir ağ modelleri

Neural models for Turkish sequence labeling

  1. Tez No: 590746
  2. Yazar: YASİN EŞREF
  3. Danışmanlar: DR. ÖĞR. ÜYESİ BURCU CAN BUĞLALILAR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 88

Özet

Türkçe gibi sondan eklemeli dillerde aynı kökten birçok kelimenin türetilmesinden dolayı kelimelerin bir bütün olarak modellenmesi seyreklik problemini de beraberinde getirmektedir. Bundan ötürü, kelimeyi bir bütün olarak ele almaktansa karakterleri üzerinden bir kelimeyi ifade etmek ya da morfem ve morfemin etiket bilgisini hesaba katmak kelime hakkında daha detaylı bilgi vermekte ve seyreklik problemini de azaltmaktadır. Bu çalışmada Türkçede kelime dizilerini etiketleme problemleri için derin sinir ağlarını kullanan bir model önerilmiştir. Seyreklik problemini çözmek için kelimelerin karakter ve morfem bilgilerin dizi etiketleme problemi kapsamındaki etkisi incelenmiştir. Bu çalışmada literatürdeki güncel derin öğrenme modelleri Türkçe için farklı kelime veya alt-kelime düzeyinde gösterimler kullanılarak Varlık İsmi Tanıma ve Sözcük Türü İşaretleme problemleri için uygulanmıştır. Sonuçlar, kelimelerin morfem bilgisinin kullanılmasının Türkçede dizi etiketlemeyi iyileştirdiğini göstermektedir. Ayrıca kelime dizilerinin etiketlerini bulurken komşu kelimelerin bilgilerinden de yararlanılarak doğruluğu daha yüksek sonuçlar elde edilmiştir

Özet (Çeviri)

Because of the inflection of many word forms from the same root in agglutinative languages such as Turkish, modeling the words as a whole causes sparsity problem. Therefore, rather than handling the word as a whole, expressing a word through its characters or considering the morpheme and morpheme label information gives more detailed information about the word and therefore mitigates the sparsity problem. In this study, a model using deep neural networks is proposed for the sequence labeling task in Turkish. To cope with the sparsity problem, character and morpheme information is used and the effect of this information on sequence labeling problem is examined. The existing deep learning models are applied using different word or sub-word representations for Named Entity Recognition (NER) and Part-of-Speech Tagging (POS Tagging) in Turkish. The results show that using morpheme information improves the sequence labelling in Turkish. Moreover, more accurate results are obtained by using the contextual information in the model.

Benzer Tezler

  1. Identification of verbal multiword expressions using deep learning architectures and representation learning methods

    Çok sözcüklü fiil ifadelerinin derin öğrenme mimarileri ve gösterim öğrenme metotları ile saptanması

    BERNA ERDEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. TUNGA GÜNGÖR

  2. Üniversite kampüsündeki araç plaka tanıma ve takibi için matematik ve algoritmik ilkeler

    University campus vehicles number plate recognition and following mathematical and algorithmic principles

    AHMED AMİR KHAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKahramanmaraş Sütçü İmam Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MAHİT GÜNEŞ

  3. Osmanlıca el yazması belgeler için derin öğrenme tabanlı karakter tanıma yöntemi

    Deep learning based character recognition method for Ottoman manuscript documents

    ALİ ALPER DEMİR

    Doktora

    Türkçe

    Türkçe

    2024

    Elektrik ve Elektronik MühendisliğiSüleyman Demirel Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ UFUK ÖZKAYA

  4. Neural named entity recognition for morphologically rich languages

    Biçimbilimsel açıdan zengin dillerde sinir ağı tabanlı varlık ismi tanıma

    ONUR GÜNGÖR

    Doktora

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. TUNGA GÜNGÖR

    ÖĞR. GÖR. SUZAN ÜSKÜDARLI

  5. Avrupa'daki depozito yönetim sistemi uygulamalarının incelenmesi ve zorunlu depozito yönetim sisteminin Türkiye'de uygulanmasına yönelik öneriler

    Examination of deposit management system applications in Europe and suggestions for the implementation of mandatory deposit management system in Türkiye

    AYBİKE MISIR

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Çevre Mühendisliğiİstanbul Teknik Üniversitesi

    Çevre Mühendisliği Ana Bilim Dalı

    PROF. DR. OSMAN ATİLLA ARIKAN