Doğal dil işleme algoritması ile kalıplara dayanarak Arapça morfolojik analizin oluşturulması
Building Arabic morphological analysis with natural language processing algorithm based on patterns
- Tez No: 876999
- Danışmanlar: PROF. DR. AYBABA HANÇERLİOĞULLARI
- Tez Türü: Doktora
- Konular: Mühendislik Bilimleri, Engineering Sciences
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Kastamonu Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Malzeme Bilimi ve Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 83
Özet
Morfolojik analiz, metin kategorizasyonu, makine çevirisi, indeksleme, bilgi erişimi ve çok daha fazlasını içeren doğal dil İşleme uygulamalarının büyük çoğunluğunda gerekli bir adımdır. Arapça, karmaşık kelime yapısına sahip, türetme açısından zengin, derin anlamlara sahip bir dildir. Bu yüzden kelimeleri bileşenlerine ayırmak karmaşık ve yoğun bir çalışma gerektirir. Arapça kelimeler köklerden ve kalıplardan oluşur. Arapça, çekimleri çok olan ve karmaşık bir morfolojik yapıya sahip bir dildir, hemen hemen tüm kelimelerin köklerden kalıplarla türediği, çok zengin bir türetme morfolojisine sahip bir türetme dilidir. Dilin son derece spesifik kalıpları olmasına rağmen, her türlü Arapça kelimeyi barındıracak çok sayıda kalıp oluşturulmuş ve genişletilmiştir. Kökleri belirlemek için kalıplar kullanıldıktan sonra kelimelerin morfolojik yapıları belirlenebilir veya bu kalıplardan kelime veya kök oluşturulabilir. Bu morfolojik analiz yöntemi kökleri, isimleri, fiilleri ve her türlü çoğul ve tekili tanıyabilir ve ayrıca herhangi bir kelime için tüm çekimleri oluşturabilir. Bu tez çalışmasında iki algoritma yöntemi ilk kez uygulanmıştır. Birincisi, herhangi bir dil kuralına dayanmamasıdır, bu da orijinal harfler ile kelimeye eklenen harfler arasında herhangi bir karışıklık olasılığını ortadan kaldırır; ikincisi, tüm kelime ön eklerini, son eklerini ve ara eklerini korur, bu da işlem süresinin kısalmasını sağlar. Son olarak önerilen algoritmalar, performans metrikleri kullanılarak değerlendirilmiş ve doğruluk %95, geri çağırma %98 ve F1puanı %97 olarak elde edilmiştir.
Özet (Çeviri)
Morphological analysis is a necessary step in the great majority of Natural Language Processing (NLP) applications, including text categorization, machine translation, indexing, information retrieval, and many more. Arabic is a deep-meaning language with a complex word structure that is rich in derivatives. That's why it requires a lot of work to cope with. Arabic words are constructed from roots and patterns. Arabic is a language with a lot of inflections and a complicated morphological structure, it is a derivational language with a very rich derivational morphology, with nearly all words deriving from roots through patterns. We have created and extended numerous patterns to accommodate all kinds of Arabic words, even though the language has highly specific patterns. After patterns are used to identify roots, words' morphological structures can be ascertained, or words or stems can be formed from these patterns. This morphological analyzer can recognize roots, nouns, verbs, and all types of plurals and singulars, and it can also generate all inflections for any word. In this thesis proposed two methods; first, it does not rely on any linguistic rules, which eliminates any possibility of confusion between the original letters and the letters added to the word; second, it retains all word affixes, suffixes, and infixes, resulting in a shorter processing time. Finally, the algorithm was evaluated using performance metrics and 0.94 for Precision, 0.97 for Recall, 0.95 for F1-score, and 0.92 for Accuracy were obtained. This shows that the algorithm has a high level of performance.
Benzer Tezler
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- A holistic data analytics approach to ship inspection reporting
Gemi denetim raporlamasına bütünsel bir veri analitiği yaklaşımı
SAMET BİÇEN
Doktora
İngilizce
2023
Deniz Bilimleriİstanbul Teknik ÜniversitesiDeniz Ulaştırma Mühendisliği Ana Bilim Dalı
PROF. DR. METİN ÇELİK
- Car damage analysis for insurance market using convolutional neural networks
Sigorta sektörü için evrişimsel sinir ağları kullanarak araç hasarı analizi
CİHAT TOLGA ARTAN
Yüksek Lisans
İngilizce
2019
Mühendislik Bilimleriİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
DOÇ. DR. TOLGA KAYA
- Open domain factoid question answering system
Tek yanıtlı sorular için açık alanlı soru yanıtlama sistemi
FARHAD SOLEİMANİAN GHAREHCHOPOGH
Doktora
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. İLYAS ÇİÇEKLİ
- Aircraft detection using deep learning
Derin öğrenme kullanarak hava aracı tespiti
UTKU MUTLU
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesiİletişim Sistemleri Ana Bilim Dalı
PROF. DR. SEDEF KENT PINAR