Geri Dön

Machine translation using transformers for Turkish to Russian

Transformers kullanarak Türkçe'den Rusça'ya makine çevirisi

  1. Tez No: 915704
  2. Yazar: NURZHAN AMANTAY
  3. Danışmanlar: DR. ÖĞR. ÜYESİ YASİN ORTAKCI
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Karabük Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 72

Özet

Makine çevirisi (MT), sürekli gelişim gösteren, doğal dil işleme alanında kilit bir konu olarak öne çıkmaktadır. Attention mekanizmasını kullanan transformer mimarisi, verimlilik ve bellek kullanımı açısından Tekrarlayan Sinir Ağları (RNN'ler) ve Çift Yönlü Uzun Kısa Süreli Bellek (BiLSTM) gibi popüler sinirsel modelleri geride bırakmıştır. Bu araştırma, Türkçe-Rusça için bir sinirsel makine çeviri modelinde Transformer mimarisinin uygulanmasını incelemektedir. Sinirsel model 476 bin Türkçe-Rusça paralel cümle çifti içeren AuroraDataset verisetini kullanılarak eğitilmiştir. Transformer modelimiz, attention mekanizmasına sahip her biri sekiz multi-head ve altı encoder ve altı decoder'den oluşmaktadır. Model, 30 epoch eğitimden sonra 0.4903 BLEU puanı, 0.2915 WER ve 0.3935 CER sonuçlarına ulaşmıştır. Bu sonuçlar transformer mimarisinin Türkçe ile Rusça arasındaki dil farklılıkları ve dilbilgisel karmaşıklıkları göz önüne alındığında, Türkçe'den Rusça'ya çevirideki potansiyelini ortaya koymaktadır. Bu makale, modelin mimarisi ve uygulamasına dair ayrıntılı bir analiz sunmaktadır. Bulgular, sınırlı metin derlemine sahip diller, örneğin Türkçe için Transformer tabanlı MT sistemlerinin anlaşılmasına katkıda bulunmaktadır.

Özet (Çeviri)

Machine translation (MT) represents a pivotal area in the field of natural language processing, continuously striving for advancements. The transformer architecture, which employs the аttention mechanism, hаs surpassed popular neurаl modеls such аs Recurrеnt Nеurаl Nеtwоrks (RNNs) and Bіdіrеctіоnаl Lоng Shоrt-Tеrm Mеmоrу (BіLSТМ) in terms of mеmоrу usage and еffіcіеncу. This research investigates the application of the transformer in a neural MT model for Turkish to Russian. The neural model was trained using the AuroraDataset, which comprising 476K Turkish-to- Russian parallel sentence pairs. Our transformer model consists of six encoders and six decoders, each with eight multi-head self-attention mechanisms. After training over 30 epochs, the model achieved a BLЕU scоrе of 0.4903, a WER of 0.2915, and a CER of 0.3935. These results underscore the potential of the transformer architecture in addressing the complexities of Turkish-to-Russian translation, particularly considering the linguistic disparities and grammatical intricacies between the two languages. This paper presents a comprehensive analysis оf thе mоdеl's architecture and implementation. The findings contribute to the understanding of transformer-based MT systems and their applicability to languages with limited text corpora, such as Turkish.

Benzer Tezler

  1. Doğal dil işleme ve makine öğrenimi ; yöntem ve uygulama araştırması

    Natural language processing and machine learning ; method and applied research

    MELİSA CEREN ÇİMİLİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÜsküdar Üniversitesi

    Nörobilim Ana Bilim Dalı

    PROF. DR. TÜRKER TEKİN ERGÜZEL

  2. Makine çevirisi için tıbbi ingilizce – türkçe paralel derlem oluşturma

    Building medical english–turkish parallel corpus for machine translation

    ZELİHA DEMİRCAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Katip Çelebi Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ EMRE ŞATIR

  3. Abstractive text summarization using deep learning

    Soyutlayıcı metin özetlemesi derin öğrenme kullanarak

    HANAN WAHHAB ABBAS ABBAS

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtılım Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BEYTULLAH YILDIZ

  4. Continuous sign language translation on the new educational Turkish sign language dataset (E-TSL) using neural machine translation methods

    Yeni eğitimsel Türk işaret dili veri kümesi (E-TSL) kullanarak nöral makine dönüşümü yöntemleri ile sürekli işaret dili çevirisi

    ŞÜKRÜ ÖZTÜRK

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HACER YALIM KELEŞ

  5. Developing morphology disambiguation and named entity recognition for amharic

    Amharca morfolojik belirsizliği giderme ve adlandırılmış varlık tanıma geliştirilmesi

    EBRAHIM CHEKOL JIBRIL

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET CÜNEYD TANTUĞ