Geri Dön

Supertagging with combinatory categorial grammar for dependency parsing

Bağlılık ayrıştırması için birleşenli ulamsal gramer ile süper etiıketleme

  1. Tez No: 383375
  2. Yazar: BURAK KERİM AKKUŞ
  3. Danışmanlar: DR. RUKET ÇAKICI
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Dilbilim, Computer Engineering and Computer Science and Control, Linguistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2014
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 71

Özet

Birleşenli Ulamsal Gramer'in sınıfları söz dizimi ve anlamıyla ilgili bilgiler içerir. CCG türeme ağaçları eksiksiz bağlılık yapıları oluşturmak için gerekli bilgileri, kısmi bağlılık yapılarınu kullanarak oluşturabilirler. Bu nedenle CCG kategorileri süper etiketler olarak da adlandırılırlar. Süper etiketlerin içerdiği bilgiler oldukça başarılı ve hızlı ayrıştırıcılar oluşturmayı olası kılar. Bu başarı süper etiketlemenin aynı zamanda ``neredeyse ayrıştırma'' olarak da adlandırılmasına neden olmuştur. Bu tezde, maksimum entropi tabanlı bir sözcük türü etiketleyicisi süper etiketleme başarısı arttırmak için sunulmakta ve yine bir maksimum entropi modeli, süper etiketleme için yeni özelliklerle uygulanmaktadır. Türkçe gibi eklemeli bir dile ait sözcüklerin biçim bilgileriyle ilgili özellikleri sözcük türü ve CCG kategori etiketleme işlemlerinin başarılarını arttırmak için kullanılmıştır. Bu sözcük kategorileriyle biçimsel kategorilerin ilgisini gösterir. Geliştirilen süper etiketleyiciyi kullanmanın etkileri süper etiketleri zengin sözcük türü bilgileri olarak kullanarak test edilmektedir. Ek olarak, sözcüklere birden fazla etiket atayan sözcük türü etiketleyicileri süper etiketleyicileri geliştirmek için olası bir yöntem olarak önerilmektedir.

Özet (Çeviri)

Combinatory Categorial Grammar (CCG) categories contain syntactic and semantic information. CCG derivation trees can be used in extracting partial dependency structures by providing the missing information in order to build complete dependency structures. Therefore, CCG categories are sometimes referred to as supertags. The amount of information encoded in supertags makes it possible to create very accurate and fast parsers as supertagging is considered ``almost parsing''. In this thesis, a maximum entropy based part of speech tagger is presented to improve the performance of CCG supertagging and another maximum entropy classifier is implemented with additional features for supertagging. Morphological features of words of an agglutinative language such as Turkish are used in order to improve the accuracy of POS tagging and supertagging processes. This indicates direct relationships between morphemes and lexical categories. The effects of using the improved supertagger are tested on dependency parsers by means of using supertags as rich parts of speech tags. Additionally, using POS taggers that assign multiple part of speech tags to the ambiguous words is suggested as another potential improvement for supertaggers.

Benzer Tezler

  1. Cross-level typing the logical form for open-domain semantic parsing

    Açık alan anlambilimsel ayrıştırma için mantıksal forma düzeyler arası tür atanması

    İSMET ADNAN ÖZTÜREL

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilişsel Bilim Ana Bilim Dalı

    PROF. DR. HÜSEYİN CEM BOZŞAHİN