Geri Dön

Frequency-driven late fusion-based word decomposition approach on the phrase-based statistical machine translation systems

Tümce tabanlı istatistiksel otomatik çeviri sistemlerinde frekansa dayalı geç birleşim tabanlı kelime parçalama yaklaşımı

  1. Tez No: 368831
  2. Yazar: MEHMET TATLICIOĞLU
  3. Danışmanlar: PROF. DR. ADNAN YAZICI
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2013
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 91

Özet

Makine çeviri sistemleri, belirli bir doğal dilde yazılmış metni bilgisayarlar aracılığıyla otomatik olarak bir başka doğal dile çeviren sistemlerdir. Bu sistemler genellikle dilbilimsel tabanlı, istatistiksel ya da bu iki yaklaşımın birleşimi şeklinde üretilebilmektedirler. Bu çalışmada Türkçeden İngilizceye baraşımı daha yüksek otomatik çeviri sistemleri inşa edebilmek için, frekansa dayalı geç birleşim tabanlı kelime parçalama yaklaşımı tanıtılmıştır. Bu geç birleşim yöntemi farklı boyuttaki eğitim verileri kullanılarak istatistiksel ve kural tabanlı yöntemlerle karşılaştırılmıştır. Bu çalışmanın önceki çalışmalardan en büyük farkı, otomatik çeviri sistemlerinde ilk kez kullanılan geç birleşim tabanlı kelime parçalama yöntemi ile daha yüksek BLEU sonucu elde edebilmesidir. Mevcut çalışmalarda en yüksek 25.22 BLEU sonucunu elde edilmişken, tanıtılan geç birleşim tabanlı sistem 26.22 BLEU sonucunu doğurmaktadır. Tanıtılan sistem kural tabanlı ve istatistiksel yaklaşımları bir araya getirmektedir. Türkçe dilinin sondan eklemeli doğası gereğince, bu çalışmadaki sonuçlar sondan eklemeli diğer diller için de genişletilebilir.

Özet (Çeviri)

Machine translation is the process of translating texts from a natural language to another by computers based on linguistic motivations, statistical approaches, or the combination of them. In this study, the frequency-driven late fusion-based word decomposition approach is introduced to improve the translation quality of the phrase-based statistical machine translation system from Turkish to English. This late fusion-based approach is compared with the standalone statistical and rule-based word decomposition approaches when the corpus size changes. This study differs from others by introducing the novel frequency-driven late fusion-based word decomposition method to boost the BLEU score. While the benchmark study in the literature reports a 25.22 BLEU score, the proposed late fusion-based system boosts the accuracy up to a 26.22 BLEU score. This novel approach fuses both of the rule-based and stochastic word decomposition methods. Because of the agglutinative nature of Turkish language, the results can be extended to the other agglutinative languages as well.

Benzer Tezler

  1. Sistemik skleroz hastalarında interstisyel akciğer hastalığında klinik özellikler, ilerleyici seyirli pulmoner fibrozis sıklığı ve ilişkili risk faktörlerinin araştırılması

    Investigation of clinical characteristics, frequency of progressive pulmonary fibrosis, and associated risk factors with interstitial lung disease in systemic sclerosis

    BURAK GÜLTEKİN

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2024

    Romatolojiİstanbul Üniversitesi

    İç Hastalıkları Ana Bilim Dalı

    DOÇ. YASEMİN YALÇINKAYA

  2. İki kanallı EKG monitörü

    Two channels ECG monitor

    SERVET MOLAK

    Yüksek Lisans

    Türkçe

    Türkçe

    1991

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    PROF.DR. ERTUĞRUL YAZGAN

  3. FDDI ve FDDI şebekeleri performans analizi

    Başlık çevirisi yok

    HİLMİ ŞENER

    Yüksek Lisans

    Türkçe

    Türkçe

    1995

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    PROF.DR. GÜNSEL DURUSOY

  4. Sincap kafesli asenkron makinenin rotor alan yönlendirmeli kontrolü

    Rotor field-orientation control of a squirrel cage induction machine

    SAFFET ALTAY

    Yüksek Lisans

    Türkçe

    Türkçe

    1995

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    PROF.DR. M. EMİN TACER

  5. İki dönüştürücülü ultrasonik temizleme sistemi tasarımı

    Desing and analysis of an ultrasonic cleaning system with two transducers

    MEHMET EMİN ŞAHİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. METİN HÜNER