A text processing and analysis tool for turkish
Türkçe için bir yazı işleme ve analiz programı
- Tez No: 216491
- Danışmanlar: Y.DOÇ.DR. ATAKAN KURT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Metin işleme ve analizi, Java, Türkçe, öğrenme, PCMEF, Text processing and analyzing, Java, Turkish, internalization, PCMEF
- Yıl: 2007
- Dil: İngilizce
- Üniversite: Fatih Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 71
Özet
Türkçe metinlerin analiz edilmesi, Türk dilinde, edebiyatında ve çok geniş bir spectrumda önemlidir. Metinlerdeki dil yapılarını elle saymak çok karmaşık bir iştir. Bu nedenle, Türkçe dökümanları ve sözlükleri işleyen ve analiz eden bir bilgisayar uygulaması gereklidir. Bu tezde, yazı işleme ve analiz etme aracı metinleri analiz etmek ve ses, hece, ek, kelime, kelime grubu, cümle, paragraf sıklıklarını hesaplamak için geliştirilmiştir. Geliştirilen metin işleme ve analiz etme aracı, Türkçe metinleri ses, hece, ek, kök gibi çeşitli dil elemanlarının sıklık dağılımlarını kullanarak analiz eder. Araç Java programlama dili ile geliştirilmiştir ve PCMEF yapısına göre tasarlarlanmıştır. Geliştirilen program yeni dillerin eklenmesi için kolaylıklar sağlar ve çeşitli Türkçe lehçelerini de aynı şekilde eklemek zor değildir.
Özet (Çeviri)
The analysis of Turkish texts is significant in Turkish language, literature and a wide spectrum of areas. It is a complicated task to count language structures in the texts manually. By the way, a computer application that processes and analyzes Turkish text documents or document sets (corpus) is beneficial. In this thesis, the text processing and analyzing tool is developed to analyze the texts and computes various phonetic, syllable, affix, stem, word, sentence frequencies. The text processing and analyzing tool developed can analyze Turkish texts using the frequency distributions of various language elements such as phonemes, syllables, affixes, words etc. The tool is developed with Java programming language and it is implemented according to PCMEF architecture. The program developed provides facilities for adding new languages and it is not difficult to extend to do the same for some Turkic dialects.
Benzer Tezler
- Türkçe metinlerde duygu analizi
Sentiment analysis in Turkish texts
CUMALİ TÜRKMENOĞLU
Yüksek Lisans
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Video based automatic affect analysis of a child and a therapist during play therapy
Bir çocuk ve bir terapistin oyun terapisi sırasındaki duygu durumunun videodan otomatik analizi
BATIKAN TÜRKMEN
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. LALE AKARUN ERSOY
DOÇ. DR. ALBERT ALİ SALAH
- Twitter verisi üzerinde Covid-19'a karşı etkili olan ilaçların doğal dil işleme kullanılarak analizi
Analysis of drugs effective against Covid-19 using natural language processing on Twitter data
ORHAN TALHA KUM
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SEFER BADAY
- İnsan gen yolaklarında ikâme modelleme ve makine öğrenmesi kullanarak varyant analizi
Variant analysis in human gene networks using surrogate modelling and machine learning
FURKAN AYDIN
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SÜHA TUNA