Geri Dön

Machine transliteration of Ottoman Turkish texts to modern Turkish

Osmanlı Türkçesi metinlerinin günümüz Türkçesi'ne otomatik aktarılması

  1. Tez No: 318594
  2. Yazar: ESMA FATIMA BİLGİN
  3. Danışmanlar: YRD. DOÇ. DR. ATAKAN KURT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2012
  8. Dil: İngilizce
  9. Üniversite: Fatih Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 56

Özet

Osmanlı Türkçesi 13.yy başından 20.yy'a kadar kullanılan Türkçenin yazı dildir. Osmanlı Türkçesi alfabesi 28 harfli Arap alfabesinin genişletilmiş bir çeşididir. Osmanlı Türkçesi ile yazılmış çok sayıda metin vardır. Bu metinlerin okunabilmesi için Latin alfabeli günümüz Türkçesi'ne aktarılması gerekir. Her iki yazı sistemi de aynı dil için kullanılmıştır yani kelimelerin telaffuzları her iki sistemde de aynıdır. Bu yüzden transliterasyon problemi Osmanlı Türkçesi ile yazılmış kelimelerin seslendirilmesi şeklinde düşünülebilir. Osmanlı Türkçesi transliterasyonunun temel problemi Osmanlı yazısında standart bir imlanın olmayışıdır. Problem karmaşık ve çok katmanlı olduğundan iki yazı sistemi arasında harf eşleştirmesi gibi basit bir çözüm yeterli değildir; DDİ tekniklerinin birlikte kullanılması gerekir. Bu çalışma Osmanlı Türkçesi metinlerin modern Türkçeye otomatik transliterasyonunu yapacak bir sistem geliştirilmesini hedeflemiştir. Bu çalışmanın katkıları (a) Osmanlı Türkçesi imlasının tarif edilmesi, (b) Osmanlı Türkçesi imlasındaki problemli noktaların, zorlukların, istisnaların ve ihtilafların tespit edilmesi, (c) transliterasyon için bir taslak oluşturarak halen geliştirilmesi devam eden otomatik transliterasyon sisteminin yapısının ortaya konması olarak sıralanabilir.

Özet (Çeviri)

The Ottoman script is a writing system of the Turkish language which was in use from the early the 13th century until the 20th century. Its alphabet is an extended version of the 28-letter Arabic alphabet. The transliteration of Ottoman script to Latin-based modern Turkish script is necessary in order to make a huge collection of text available to readers. Both scripts are used for the same language and the pronunciation of words remains the same. Thus, the transliteration problem can be reduced to pronunciation generation in Turkish for the Ottoman script. The main problem of the transliteration is the lack of a regular of orthography in the Ottoman script. The complexity of the problem requires a combination of NLP techniques beyond simple character mappings. This study is focused towards building a system for the automatic transcription of texts from Ottoman to modern Turkish script. Our contributions in this study are the followings: (a) to describe the Ottoman orthography for regular cases; (b) to report problems, difficulties, exceptions and variations in Ottoman orthography;(c) to give an outline of the transliteration framework, and present the architecture of an automatic transliteration system currently under development.

Benzer Tezler

  1. A deep learning based translation system from Ottoman Turkish to Modern Turkish

    Osmanlı Türkçesinden modern Türkçeye derin öğrenme tabanlı çeviri sistemi

    ABDULLAH BAKIRCI

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGebze Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. YUSUF SİNAN AKGÜL

  2. Natural language processing (NLP) of languages that use Arabic alphabet

    Arap alfabesi kullanılan dillerin doğal dil işlenmesi (NLP)

    ASHTI JAF

    Doktora

    İngilizce

    İngilizce

    2022

    Elektrik ve Elektronik MühendisliğiGaziantep Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. SEMA KAYHAN

  3. Transliterating Urdu to Roman Urdu using neural network

    Neural ağ kullanarak Urdu'dan Römence Urdu'ya dönüştürme

    WAJAHATULLAH KHAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolIşık Üniversitesi

    Bilgi Teknolojileri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÜLSÜM ÇİĞDEM ÇAVDAROĞLU AKKOÇ

  4. İngilizce'den Türkçe'ye istatistiksel bilgisayarlı çeviri sistemlerinde alan uyarlaması ile başarının artırılması

    Evaluation of domain adaptation approaches on English-to-Turkish statistical machine translation systems

    EZGİ YILDIRIM

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ

  5. Dokuma işletmelerinde makine girişim probleminin çözümü için simülasyon yaklaşımı

    Simulation approach for solution of machine interference problem in weaving mills

    ADNAN YILDIZ

    Yüksek Lisans

    Türkçe

    Türkçe

    1999

    Endüstri ve Endüstri MühendisliğiÇukurova Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. FUNDA YILDIRIM