Gövde-Türk: Bir türkçe gövdeleme yöntemi
Gövde-Türk: A turkish stemming method
- Tez No: 527093
- Danışmanlar: DR. ÖĞR. ÜYESİ SAİT CAN YÜCEBAŞ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: Türkçe
- Üniversite: Çanakkale Onsekiz Mart Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 107
Özet
İlgili tez çalışmasında doğal dil işleme çalışmaları kapsamında Türkçe sözcüklerin sağdan sola taranarak tüm çekim eklerinin sonlu durum makineleri ile tanımlanan ekleme kurallarına ve en uzun eşleşme mantığına göre sözcük sonundan atılarak sözcüğün türemiş son halinin, gövdesinin, bulunmasını amaçlayan bir yöntem geliştirilmiştir. Geliştirilen Gövde-Türk Yöntemi, gelecek doğal dil işleme çalışmalarının temeli niteliğinde olup bu kapsamda farklı amaçlara hizmet edebilecek uygulamalarda bir araç olarak kullanılabilecektir. Önerilen yöntem, platform bağımsız Java programlama dilinde geliştirilmiş olup bu sayede ilgili yöntemin farklı uygulamalara kolayca entegre edilebilmesi sağlanmıştır. Sözlük veri yapısı olarak ise trie metin ağacı kullanılmış olup bu sayede ilgili yöntemin diğer yöntemlerden daha hızlı olması hedeflenmiştir. Yapılan analizler sonucunda geliştirilen Gövde-Türk gövdeleme yönteminin %97 oranında başarılı olduğu, yan ürün olarak geliştirilen etiketleme algoritmasının ise %93 oranında başarılı olduğu görülmüştür.
Özet (Çeviri)
Within the scope of natural language processing activities, this thesis study presents a stemming method for Turkish Language that searches inflectional suffixes at the end of the words and eliminate them according to the rules provided by finite state machines and longest match manner. The developed Gövde-Türk method is the basis of future natural language processing work and can be used as a tool in applications that can serve different purposes in this context. The proposed method has been developed in a platform independent Java programming language, so that the method can be easily integrated into different applications. The trie text tree is used as the dictionary data structure and the aim of this method is to be faster than the other methods. As a result of the analyzes, it was seen that the developed“Gövde-Türk”stemming method was 97% successful and the labeling algorithm developed as a byproduct was 93% successful.
Benzer Tezler
- Türk fındık (corylus avellana l.) çeşitlerinde mikropropagasyon ve agrobacterium spp. ile infeksiyon çalışmaları
The studies on micropropagation and agrobacterium spp.infection of turkish hazelnut (Corylus avellana L.) cultivars
BAKİ YAMAN
Yüksek Lisans
Türkçe
2023
Biyolojiİstanbul ÜniversitesiMoleküler Biyoloji ve Genetik Ana Bilim Dalı
PROF. DR. ŞULE ARI
- Türkiye Türkçesi, Azerbaycan Türkçesi, Türkmen Türkçesi ve Gagavuz Türkçesiyle karşılaştırmalı olarak Irak Türkmen Türkçesi (Ses bilgisi, fiil, metin, sözlük)
Iraqi turkmen Turkish in comparison with Turkey Turkish, Azerbaijani Turkishturkmen Turkish and Gagauzian Turkish (Phonetics, verb, text, dictionary)
KARWAN SHUKUR
Doktora
Türkçe
2019
DilbilimGazi ÜniversitesiÇağdaş Türk Lehçeleri Ana Bilim Dalı
PROF. DR. ZÜHAL YÜKSEL
- Özbek Türkçesinin leksikolojisi
Başlık çevirisi yok
SELAHİTTİN TOLKUN
Yüksek Lisans
Türkçe
1994
Türk Dili ve Edebiyatıİstanbul ÜniversitesiEski Türk Dili Ana Bilim Dalı
PROF. DR. NURİ YÜCE
- Otuz eserdeki isim türeten eklerin morfo-semantik işlevleri
The morpho-semantic functions of the suffixes in thirty works that make nouns
ÇİÇEK VAROL
Doktora
Türkçe
2022
DilbilimUşak ÜniversitesiTürk Dili ve Edebiyatı Ana Bilim Dalı
PROF. DR. AHMET AKÇATAŞ