Machine translation using transformers for Turkish to Russian
Transformers kullanarak Türkçe'den Rusça'ya makine çevirisi
- Tez No: 915704
- Danışmanlar: DR. ÖĞR. ÜYESİ YASİN ORTAKCI
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Karabük Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 72
Özet
Makine çevirisi (MT), sürekli gelişim gösteren, doğal dil işleme alanında kilit bir konu olarak öne çıkmaktadır. Attention mekanizmasını kullanan transformer mimarisi, verimlilik ve bellek kullanımı açısından Tekrarlayan Sinir Ağları (RNN'ler) ve Çift Yönlü Uzun Kısa Süreli Bellek (BiLSTM) gibi popüler sinirsel modelleri geride bırakmıştır. Bu araştırma, Türkçe-Rusça için bir sinirsel makine çeviri modelinde Transformer mimarisinin uygulanmasını incelemektedir. Sinirsel model 476 bin Türkçe-Rusça paralel cümle çifti içeren AuroraDataset verisetini kullanılarak eğitilmiştir. Transformer modelimiz, attention mekanizmasına sahip her biri sekiz multi-head ve altı encoder ve altı decoder'den oluşmaktadır. Model, 30 epoch eğitimden sonra 0.4903 BLEU puanı, 0.2915 WER ve 0.3935 CER sonuçlarına ulaşmıştır. Bu sonuçlar transformer mimarisinin Türkçe ile Rusça arasındaki dil farklılıkları ve dilbilgisel karmaşıklıkları göz önüne alındığında, Türkçe'den Rusça'ya çevirideki potansiyelini ortaya koymaktadır. Bu makale, modelin mimarisi ve uygulamasına dair ayrıntılı bir analiz sunmaktadır. Bulgular, sınırlı metin derlemine sahip diller, örneğin Türkçe için Transformer tabanlı MT sistemlerinin anlaşılmasına katkıda bulunmaktadır.
Özet (Çeviri)
Machine translation (MT) represents a pivotal area in the field of natural language processing, continuously striving for advancements. The transformer architecture, which employs the аttention mechanism, hаs surpassed popular neurаl modеls such аs Recurrеnt Nеurаl Nеtwоrks (RNNs) and Bіdіrеctіоnаl Lоng Shоrt-Tеrm Mеmоrу (BіLSТМ) in terms of mеmоrу usage and еffіcіеncу. This research investigates the application of the transformer in a neural MT model for Turkish to Russian. The neural model was trained using the AuroraDataset, which comprising 476K Turkish-to- Russian parallel sentence pairs. Our transformer model consists of six encoders and six decoders, each with eight multi-head self-attention mechanisms. After training over 30 epochs, the model achieved a BLЕU scоrе of 0.4903, a WER of 0.2915, and a CER of 0.3935. These results underscore the potential of the transformer architecture in addressing the complexities of Turkish-to-Russian translation, particularly considering the linguistic disparities and grammatical intricacies between the two languages. This paper presents a comprehensive analysis оf thе mоdеl's architecture and implementation. The findings contribute to the understanding of transformer-based MT systems and their applicability to languages with limited text corpora, such as Turkish.
Benzer Tezler
- Doğal dil işleme ve makine öğrenimi ; yöntem ve uygulama araştırması
Natural language processing and machine learning ; method and applied research
MELİSA CEREN ÇİMİLİ
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÜsküdar ÜniversitesiNörobilim Ana Bilim Dalı
PROF. DR. TÜRKER TEKİN ERGÜZEL
- Makine çevirisi için tıbbi ingilizce – türkçe paralel derlem oluşturma
Building medical english–turkish parallel corpus for machine translation
ZELİHA DEMİRCAN
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Katip Çelebi ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ EMRE ŞATIR
- Abstractive text summarization using deep learning
Soyutlayıcı metin özetlemesi derin öğrenme kullanarak
HANAN WAHHAB ABBAS ABBAS
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtılım ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BEYTULLAH YILDIZ
- Continuous sign language translation on the new educational Turkish sign language dataset (E-TSL) using neural machine translation methods
Yeni eğitimsel Türk işaret dili veri kümesi (E-TSL) kullanarak nöral makine dönüşümü yöntemleri ile sürekli işaret dili çevirisi
ŞÜKRÜ ÖZTÜRK
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HACER YALIM KELEŞ
- Developing morphology disambiguation and named entity recognition for amharic
Amharca morfolojik belirsizliği giderme ve adlandırılmış varlık tanıma geliştirilmesi
EBRAHIM CHEKOL JIBRIL
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET CÜNEYD TANTUĞ