Frequency-driven late fusion-based word decomposition approach on the phrase-based statistical machine translation systems
Tümce tabanlı istatistiksel otomatik çeviri sistemlerinde frekansa dayalı geç birleşim tabanlı kelime parçalama yaklaşımı
- Tez No: 368831
- Danışmanlar: PROF. DR. ADNAN YAZICI
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2013
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 91
Özet
Makine çeviri sistemleri, belirli bir doğal dilde yazılmış metni bilgisayarlar aracılığıyla otomatik olarak bir başka doğal dile çeviren sistemlerdir. Bu sistemler genellikle dilbilimsel tabanlı, istatistiksel ya da bu iki yaklaşımın birleşimi şeklinde üretilebilmektedirler. Bu çalışmada Türkçeden İngilizceye baraşımı daha yüksek otomatik çeviri sistemleri inşa edebilmek için, frekansa dayalı geç birleşim tabanlı kelime parçalama yaklaşımı tanıtılmıştır. Bu geç birleşim yöntemi farklı boyuttaki eğitim verileri kullanılarak istatistiksel ve kural tabanlı yöntemlerle karşılaştırılmıştır. Bu çalışmanın önceki çalışmalardan en büyük farkı, otomatik çeviri sistemlerinde ilk kez kullanılan geç birleşim tabanlı kelime parçalama yöntemi ile daha yüksek BLEU sonucu elde edebilmesidir. Mevcut çalışmalarda en yüksek 25.22 BLEU sonucunu elde edilmişken, tanıtılan geç birleşim tabanlı sistem 26.22 BLEU sonucunu doğurmaktadır. Tanıtılan sistem kural tabanlı ve istatistiksel yaklaşımları bir araya getirmektedir. Türkçe dilinin sondan eklemeli doğası gereğince, bu çalışmadaki sonuçlar sondan eklemeli diğer diller için de genişletilebilir.
Özet (Çeviri)
Machine translation is the process of translating texts from a natural language to another by computers based on linguistic motivations, statistical approaches, or the combination of them. In this study, the frequency-driven late fusion-based word decomposition approach is introduced to improve the translation quality of the phrase-based statistical machine translation system from Turkish to English. This late fusion-based approach is compared with the standalone statistical and rule-based word decomposition approaches when the corpus size changes. This study differs from others by introducing the novel frequency-driven late fusion-based word decomposition method to boost the BLEU score. While the benchmark study in the literature reports a 25.22 BLEU score, the proposed late fusion-based system boosts the accuracy up to a 26.22 BLEU score. This novel approach fuses both of the rule-based and stochastic word decomposition methods. Because of the agglutinative nature of Turkish language, the results can be extended to the other agglutinative languages as well.
Benzer Tezler
- Sistemik skleroz hastalarında interstisyel akciğer hastalığında klinik özellikler, ilerleyici seyirli pulmoner fibrozis sıklığı ve ilişkili risk faktörlerinin araştırılması
Investigation of clinical characteristics, frequency of progressive pulmonary fibrosis, and associated risk factors with interstitial lung disease in systemic sclerosis
BURAK GÜLTEKİN
Tıpta Uzmanlık
Türkçe
2024
Romatolojiİstanbul Üniversitesiİç Hastalıkları Ana Bilim Dalı
DOÇ. YASEMİN YALÇINKAYA
- İki kanallı EKG monitörü
Two channels ECG monitor
SERVET MOLAK
Yüksek Lisans
Türkçe
1991
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiPROF.DR. ERTUĞRUL YAZGAN
- FDDI ve FDDI şebekeleri performans analizi
Başlık çevirisi yok
HİLMİ ŞENER
Yüksek Lisans
Türkçe
1995
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiPROF.DR. GÜNSEL DURUSOY
- Sincap kafesli asenkron makinenin rotor alan yönlendirmeli kontrolü
Rotor field-orientation control of a squirrel cage induction machine
SAFFET ALTAY
Yüksek Lisans
Türkçe
1995
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiPROF.DR. M. EMİN TACER
- İki dönüştürücülü ultrasonik temizleme sistemi tasarımı
Desing and analysis of an ultrasonic cleaning system with two transducers
MEHMET EMİN ŞAHİN
Yüksek Lisans
Türkçe
2014
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. METİN HÜNER