Geri Dön

Self-trained discriminative constituency parser with hierarchical joint learning approach

Hiyerarşik birlikte öğrenme yöntemiyle kendi kendini eğiten ayrıdedici sözdizim çözümleyicisi

  1. Tez No: 325525
  2. Yazar: ARDA ÇELEBİ
  3. Danışmanlar: YRD. DOÇ. ARZUCAN ÖZGÜR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgi ve Belge Yönetimi, Dilbilim, Dokümantasyon ve Enformasyon, Information and Records Management, Linguistics, Documentation and Information
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2012
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 90

Özet

Cümlede geçen kelimelerin dilbilgisi kurallarına uygun olarak o cümleyi nasıl meydana getirdiklerini bulmak o cümleyi anlamak için en önemli adımlardan biridir. Sözdizim çözümleyicisi ile elde edeceğimiz bu bilgiyle örneğin cümle içinden istenilen bilgileri çıkartabilir veya o cümleyi başka bir dile çevirebiliriz. Bundandır ki sözdizim çözümleyicileri doğal dil işleme alanında en çok çalışılan konulardandır. Bugün en iyi çözümleyiciler denetimli istatistiksel yöntemleri kullanarak %90 başarı seviyelerini aşsalar da, kendi kendisini eğitebilen yarı-denetimli modelle çalışan çözümleyiciler ile yapılan başarılı çalışma sayısı çok azdır. Bu tür çözümleyiciler eğitim verilerini kendi çıktıları ile genişletip kendi kendilerine öğrenerek daha iyi sonuç almaya çalışırlar. Bu tezde amacımız daha önce literatürde yapılmamış birçok öznitelik kullanarak kendi kendisini eğitebilen ayırtedici sözdizim çözümleyicisi geliştirmektir. Bunu yapmak için çözümleyicinin çıktı olarak verdiği sözdizim ağacının tamamının doğru olmadığı fakat bazı parçalarının, ki biz bunlara n-gram ağaçları diyoruz, doğru olabileceğini varsayıyoruz. Buna göre hipotezimiz ise bu parçalar ile çözümleyicinin kendi kendisini eğitebilmesiyle daha iyi sonuç alabileceğimizdir. n-gram'ların çözümlemesini buna özgü n-gram çözümleyicisi ile yapacağımızdan, asıl çözümleyicinin kendi kendisini eğitmesi yerine n-gram çözümleyicisi asıl çözümleyicinin çıktısı ile eğitilecektir. Bu esnada da bu iki çözümleyicinin hiyerarşik birlikte öğrenme yöntemiyle birbirlerine öğrendiklerini aktarmaları sağlanarak asıl çözümleyicinin beraberce kendi kendisine öğrenmesi sağlanır. Sadece gerçek eğitim verileri ile yapılan deneylerde asıl çözümleyicinin başarısının n-gram çözümleyici ile eğitildiğinde arttığı, eğitim verisine asıl çözümleyicinin çıktıları eklendiğinde ise beraberce kendi kendisini eğitemediği gözlemlenmiştir.

Özet (Çeviri)

Determining the syntactic structure of a sentence is a fundamental step towards understanding what is conveyed in that sentence. The syntactic parse tree of a sentence can be used in several tasks such as information extraction, machine translation, summarization and question answering. Therefore, syntactic parsing has been one of the most studied topics in the literature. Today's top performing parsers employ statistical approaches and achieve over 90\% accuracy. While statistical approaches reach their highs in supervised settings, semi-supervised approaches like self-training of parsers is starting to emerge as a next challenge. Such parsers train on their own outputs with the goal of achieving better results by learning on their own. However, only a small number of self-trained parsers have met this goal so far. In this thesis, we tackle the problem of self-training a feature-rich discriminative constituency parser, which to our knowledge has never been studied before. We approach the self-training problem with the assumption that we can't expect the whole parse tree given by a parser to be completely correct but, rather, some parts of it are more likely to be. We hypothesize that instead of feeding the parser the whole guessed parse trees of its own, we can break them down into smaller ones, namely n-gram trees, and perform self-training on them. We thus have an n-gram parser and transfer the distinct expertise of the $n$-gram parser to the full sentence parser by using the Hierarchical Joint Learning (HJL) approach. The resulting parser is called a jointly self-trained parser. We first study joint learning in completely supervised setting and observe slight improvement of the jointly trained parser over the baseline. When the real n-gram trees are replaced with guessed ones, the resulting jointly self-trained parser performs no differently than the baseline.

Benzer Tezler

  1. Öz denetimli yöntemlerle görsel özellik ayrıştırma

    Visual attribute disentanglement using self-supervision

    ABDURRAHMAN AKIN AKTAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. İMAN ASKERBEYLİ

    DOÇ. DR. HACER YALIM KELEŞ

  2. Understanding actions in instructional videos

    Eğitici videolardaki eylemleri anlamak

    ÖZGE YALÇINKAYA ŞİMŞEK

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. PINAR DUYGULU ŞAHİN

  3. Psikiyatri rotasyonu alan ve almayan tam zamanlı ve sözleşmeli aile hekimliği asistan hekimlerinde psikiyatrik hastaya yerleşimde öz yeterliliğin değerlendirilmesi

    Evaluation of self-efficiency in placement with psychiatric patient in full-time and contracted family medicine assistant who registered and nonregi̇stered with psychiatric rotation

    GÖKNUR ERTÜRK

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2023

    Aile HekimliğiSağlık Bilimleri Üniversitesi

    Aile Hekimliği Ana Bilim Dalı

    PROF. DR. MUSTAFA REŞAT DABAK

    DR. CEYHUN DİKMEN BATMAZ

  4. Okul öncesinde mental aritmetik eğitiminin öğrencilerin görsel algı düzeylerine ve okul olgunluk düzeylerine etkisinin incelenmesi

    Investigating the effect of pre-school mental arithmetic education on the visual perception and school matureness level of the students

    ABDULLAH KALKAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Eğitim ve ÖğretimGaziosmanpaşa Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    PROF. DR. MEHMET ARSLAN

  5. BGA malzemelerin x-ışını görüntülerindeki lehim hatalarının derin sinir ağı kullanarak tespiti

    Detection of BGA solder defects from x-ray images using deep neural network

    CEREN TÜRER AKDENİZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. ZÜMRAY ÖLMEZ