The regression model of machine translation

Otomatik çeviride regresyon modeli

PDF İndir

Tez No: 305811
Yazar: MEHMET ERGUN BİÇİCİ
Danışmanlar: YRD. DOÇ. DR. DENİZ YURET
Tez Türü: Doktora
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Dilbilim, Elektrik ve Elektronik Mühendisliği, Computer Engineering and Computer Science and Control, Linguistics, Electrical and Electronics Engineering
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2011
Dil: İngilizce
Üniversite: Koç Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 189

Özet

Regresyon tabanlı otomatik çeviri (RegMT) yaklaşımı otomatik çeviriye öğrenme modellerini, öğrenme örnekleri seçimini, özellik gösterimini, ve çeviriyi yaratmayı ayıran bir ögrenme platformu sağlar. Transdüktif öğrenme platformu RegMT yaklaşımını sayısal olarak daha hesaplanabilir yapar ve her test cümlesi için bağımsız olarak model kurar. Geliştirdiğimiz öğrenme örnekleri seçim algoritmaları RegMT yaklaşımını sayısal olarak daha hesaplanabilir yapmanın yanında standart SMT sistemlerinin performansını arttırır. Paralel öğrenme cümlelerinden önceki işlerden daha iyi cümle seçme metodları geliştirerek daha doğru RegMT modellerini daha az öğrenme cümlesi kullanarak elde edebiliyoruz.Otomatik çeviri için L1 düzenli regresyon tekniğini L2 düzenli regresyon tekniğinden daha iyi bir model olarak sunuyoruz. Elde ettiğimiz sonuçlar seyrek regresyon modellerinin L2 düzenli regresyon modelinden hedef özellikleri tahmin ederken, kelime eşleşmelerini bulurken, kelime dizimi tabloları oluştururken, ve çeviri yaratırken daha iyi olduğunu göstermektedir. RegMT modelinin performansını ve çevirilerin kalitesini ölçmek için iyi ölçüm teknikleri gelistirdik. İngilizceye çevirileri ölçerken insanlar tarafından performansı iyi bulunan F1 ölçüsünü kullanıyoruz. F1 bizim RegMT modellerinin performansını hedef özellik tahmin vektörlerini veya öğrenilen katsayı matrislerini veya verilen bir SMT modelini kendi kelime dizimi tablolarını kullanarak, hesaplaması pahalı olabilen çeviri adımını uygulamadan ölçmemize olanak sağlar.Seyrek L1 düzenli regresyonun L2 düzenli regresyondan Almanca-İngilizce ve küçük öğrenme kümeleri kullanırken İspanyolca-İngilizce çevirisinde daha iyi olduğunu gösteriyoruz. Grafik tabanlı çeviri kelime dizimi tabanlı çeviriye az kelime hazineli çeviri işlerinde alternatif olabilir.

Özet (Çeviri)

Regression based machine translation (RegMT) approach provides a learning framework for machine translation, separating learning models for training, training instance selection, feature representation, and decoding. We use transductive learning framework for making RegMT computationally more scalable and consider model building step independently for each test sentence. We develop better training instance selection techniques than previous work from given parallel training sentences for achieving more accurate RegMT models using less training instances.We introduce L1 regularized regression as a better model than L2 regularized regression for statistical machine translation. Our results demonstrate that sparse regression models are better than L2 regularized regression for statistical machine translation in predicting target features, estimating word alignments, creating phrase tables, and generating translation outputs. We develop good evaluation techniques for measuring the performance of the RegMT model and the quality of the translations. F1 allows us to evaluate the performance of RegMT models without performing the decoding step, which can be computationally expensive.We use graph decoding on the prediction vectors represented in n-gram counts space or we decode using Moses after transforming the learned weight matrix representing the mappings between the source and target features to a phrase table that can be used by Moses during decoding. We demonstrate that sparse L1 regularized regression performs better than L2 regularized regression in German-English translation task and in Spanish-English translation task when using small sized training sets. Graph based decoding can provide an alternative to phrase-based decoding in translation domains having low vocabulary.

Benzer Tezler

Tez No
820158
Machine learning models for microbiome-based classification of axolotl limb regeneration phases
Aksolotl uzuv rejenerasyon aşamalarının mikrobiyoma dayalı sınıflandırılması için makıne öğrenimi modellerı
ABDULLAH HÜSEYİN KÖSEOĞLU
Yüksek Lisans
İngilizce
2023
Biyoistatistik İstanbul Medipol Üniversitesi
Biyomedikal Mühendisliği ve Biyoenformatik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ KIVANÇ KÖK
Tez No
608103
Rule-weight learning for Kazakh-Turkish machine translation
Başlık çevirisi yok
SEWALE MUSADAQ TAHA
Doktora
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Altınbaş Üniversitesi
Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SEFER KURNAZ
DR. ÖĞR. ÜYESİ FRANCIS M. TYERS
Tez No
806483
Prediction of breast cancer using artificial intelligence
Başlık çevirisi yok
ALI SALIM MOHAMMED AL-QAZZAZ
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Altınbaş Üniversitesi
Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ HASAN ABDULKADER
Tez No
527809
Learning to rank web data using multivariate adaptive regression splines
Çok değişkenli uyarlanabilir regresyon eğrileri ile web verilerini sıralamayı öğrenme
GÜLŞAH ALTINOK
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Orta Doğu Teknik Üniversitesi
İstatistik Ana Bilim Dalı
PROF. DR. İNCİ BATMAZ
PROF. DR. PINAR KARAGÖZ
Tez No
46165
Elastomerlerin zamana bağlı kayma davranışı
Başlık çevirisi yok
ALİ RAİF SAĞLAM
Yüksek Lisans
Türkçe
1995
İnşaat Mühendisliği İstanbul Teknik Üniversitesi
DOÇ.DR. HULUSİ ÖZKUL

Geri Dön