Machine transliteration of Ottoman Turkish texts to modern Turkish
Osmanlı Türkçesi metinlerinin günümüz Türkçesi'ne otomatik aktarılması
- Tez No: 318594
- Danışmanlar: YRD. DOÇ. DR. ATAKAN KURT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2012
- Dil: İngilizce
- Üniversite: Fatih Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 56
Özet
Osmanlı Türkçesi 13.yy başından 20.yy'a kadar kullanılan Türkçenin yazı dildir. Osmanlı Türkçesi alfabesi 28 harfli Arap alfabesinin genişletilmiş bir çeşididir. Osmanlı Türkçesi ile yazılmış çok sayıda metin vardır. Bu metinlerin okunabilmesi için Latin alfabeli günümüz Türkçesi'ne aktarılması gerekir. Her iki yazı sistemi de aynı dil için kullanılmıştır yani kelimelerin telaffuzları her iki sistemde de aynıdır. Bu yüzden transliterasyon problemi Osmanlı Türkçesi ile yazılmış kelimelerin seslendirilmesi şeklinde düşünülebilir. Osmanlı Türkçesi transliterasyonunun temel problemi Osmanlı yazısında standart bir imlanın olmayışıdır. Problem karmaşık ve çok katmanlı olduğundan iki yazı sistemi arasında harf eşleştirmesi gibi basit bir çözüm yeterli değildir; DDİ tekniklerinin birlikte kullanılması gerekir. Bu çalışma Osmanlı Türkçesi metinlerin modern Türkçeye otomatik transliterasyonunu yapacak bir sistem geliştirilmesini hedeflemiştir. Bu çalışmanın katkıları (a) Osmanlı Türkçesi imlasının tarif edilmesi, (b) Osmanlı Türkçesi imlasındaki problemli noktaların, zorlukların, istisnaların ve ihtilafların tespit edilmesi, (c) transliterasyon için bir taslak oluşturarak halen geliştirilmesi devam eden otomatik transliterasyon sisteminin yapısının ortaya konması olarak sıralanabilir.
Özet (Çeviri)
The Ottoman script is a writing system of the Turkish language which was in use from the early the 13th century until the 20th century. Its alphabet is an extended version of the 28-letter Arabic alphabet. The transliteration of Ottoman script to Latin-based modern Turkish script is necessary in order to make a huge collection of text available to readers. Both scripts are used for the same language and the pronunciation of words remains the same. Thus, the transliteration problem can be reduced to pronunciation generation in Turkish for the Ottoman script. The main problem of the transliteration is the lack of a regular of orthography in the Ottoman script. The complexity of the problem requires a combination of NLP techniques beyond simple character mappings. This study is focused towards building a system for the automatic transcription of texts from Ottoman to modern Turkish script. Our contributions in this study are the followings: (a) to describe the Ottoman orthography for regular cases; (b) to report problems, difficulties, exceptions and variations in Ottoman orthography;(c) to give an outline of the transliteration framework, and present the architecture of an automatic transliteration system currently under development.
Benzer Tezler
- A deep learning based translation system from Ottoman Turkish to Modern Turkish
Osmanlı Türkçesinden modern Türkçeye derin öğrenme tabanlı çeviri sistemi
ABDULLAH BAKIRCI
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGebze Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. YUSUF SİNAN AKGÜL
- Natural language processing (NLP) of languages that use Arabic alphabet
Arap alfabesi kullanılan dillerin doğal dil işlenmesi (NLP)
ASHTI JAF
Doktora
İngilizce
2022
Elektrik ve Elektronik MühendisliğiGaziantep ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. SEMA KAYHAN
- Transliterating Urdu to Roman Urdu using neural network
Neural ağ kullanarak Urdu'dan Römence Urdu'ya dönüştürme
WAJAHATULLAH KHAN
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolIşık ÜniversitesiBilgi Teknolojileri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ GÜLSÜM ÇİĞDEM ÇAVDAROĞLU AKKOÇ
- İngilizce'den Türkçe'ye istatistiksel bilgisayarlı çeviri sistemlerinde alan uyarlaması ile başarının artırılması
Evaluation of domain adaptation approaches on English-to-Turkish statistical machine translation systems
EZGİ YILDIRIM
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Dokuma işletmelerinde makine girişim probleminin çözümü için simülasyon yaklaşımı
Simulation approach for solution of machine interference problem in weaving mills
ADNAN YILDIZ
Yüksek Lisans
Türkçe
1999
Endüstri ve Endüstri MühendisliğiÇukurova ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. FUNDA YILDIRIM