Extraction of grammar rules and recurring patterns in Turkish texts by using unsupervised learning algorithms
Türkçe metinlerdeki gramer kurallarının ve tekrarlı kalıpların öğreticisiz öğrenme algoritmaları yardımıyla çıkarılması
- Tez No: 244688
- Danışmanlar: YRD. DOÇ. DR. ZEYNEP ORHAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2009
- Dil: İngilizce
- Üniversite: Fatih Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
- Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Sayfa Sayısı: 72
Özet
Bu çalışma, Türkçe metinlerden öğreticisiz öğrenme algoritmalarını kullanarak otomatik gramer çıkarımı projesinin nasıl yapıldığını anlatmaktadır. En sık karşılaşılan içeriğe sahip olduğu görülen hikâye, dergi ve gazete makalelerinden alıntılar yapılarak, Türkçe metinler oluşturulmuştur.Oluşturulan bu metinlerin doğru gramer yapısına sahip olduğu varsayılmıştır. Öğreticisiz öğrenme algoritmaları kullanılarak, bu metinlerin gramer yapıları bilgisayara öğretilmiştir. Buna ek olarak, gruplama metodu kullanılarak, Türkçe dili için İçerikten Bağımsız Gramer ve Çözümleme Ağacı oluşturulmuştur.Test sonuçları gramer çıkarımında bazı hatalar olduğunu göstersede, yüksek doğruluk oranına sahip bir başarı elde edilmiştir. Bu çalışma Türkçe dili için ileride geliştirilebilecek projelere yardımcı olacak bir projedir.
Özet (Çeviri)
This study proposes the idea on building an automatic grammar extraction in Turkish Texts by using unsupervised learning algorithms. There are three types of text citation chosen to obtain a corpus in this study: stories, magazines and newspaper articles, which are found to be the most frequently encountered content.This corpus is assumed to contain Turkish sentences that are grammatically correct. By using unsupervised learning algorithms, the grammar structure of these sentences is taught to the computer. Additionally, by using grouping method, Context Free Grammar and Parse Tree of Turkish language is generated.Although testing results demonstrate that there are several problems with grammar extraction, high accuracy is achieved. This study should be an initial process for further applications dedicated for Turkish language.
Benzer Tezler
- حاشية إسحاق القرماني (ت 933) على تفسير القاضي البيضاوي(من أول سورة المنافقين إلى نهاية سورة الملك) (دراسةً وتحقيقًا(
(Cemâleddin Ishak b. Muhammed el-Karamânî'nin Beydâvî Haşiyesi (Münafikun Suresini başından Mülk Suresinin sonuna kadar): İnceleme ve tahkîk
DHARAR ABDALSALAM BDEWI AL-JANABI
Yüksek Lisans
Arapça
2023
DinÇankırı Karatekin ÜniversitesiTemel İslam Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ KUTAİBA FARHAT
- Türkçe eşgönderge çözümlemesi
Turkish coreference resolution
TUĞBA PAMAY
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ GÜLŞEN ERYİĞİT
- Yapay Zeka'nın robot görmesi üzerine uygulanması
An Application of robot vision in artificial intelligence
FUNDA PEHLİVAN
- Türkçe tümcelerin yüklem odaklı anlam ve dilbilgisi çözümlemesi
Grammatical and semantic analysis of turkish sentence based on predicate
İLKNUR DÖNMEZ
Doktora
Türkçe
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EŞREF ADALI
- Abstract meaning representation of Turkish
Türkçenin soyut anlam temsilleri
KADRİYE ELİF ORAL
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÜLŞEN ERYİĞİT