Türkçe'de hesaplamalı metin analizi
Computational text analysis in turkish
- Tez No: 285191
- Danışmanlar: PROF. DR. BAHAR KARAOĞLAN
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Computer Engineering and Computer Science and Control, Science and Technology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2011
- Dil: Türkçe
- Üniversite: Ege Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Uluslararası Bilgisayar Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 99
Özet
Metinler bilginin dil vasıtasıyla yazılı biçimde aktarımını ve saklanmasını sağlayan araçlardır. Bu tezde metnin taşıdığı anlamın, aktarmak istediği enformasyonun tespiti çalışmalarını destekleyen iki temel analiz çalışması sunulmaktadır: işlev kelimelerin ve eşdizimlerin tespiti.İşlev kelimeler metnin anlam bütünlüğüne katkısı olmayan ya da çok az olan kelimelerdir. Bu kelimeler sıklıkla gözlenmeleri sebebiyle metinde azımsanamayacak büyüklükte bir yer işgal ederler. Tez kapsamında işlev kelimelerin tespiti için dile ait farklı özelliklerin bir arada değerlendirilebileceği istatistiksel bir yöntem olan diskriminant analizinin kullanılması önerilmiştir. Önerilen yöntem Türkçe metinler üzerinde sınanmış ve sıklıkla kullanılan gözlenme sıklığı ve tf-idf gibi mevcut yöntemlerden daha başarılı sonuçlar ürettiği gösterilmiştir.Eşdizimler anlam bütünlüklerini tamamlamak veya güçlendirmek amacıyla birarada bulunan kelimelerin oluşturduğu kelime birlikleridir. Eşdizim oluşturan kelimelerin birbirlerini anımsattığı temelinden yola çıkarak tez kapsamında eşdizim eğilimi yöntemi geliştirilmiştir. Öncelikle literatürde yer alan bazı yöntemler Türkçe derlemler üzerinde uygulanmış ve gövdelemenin etkisi araştırılmıştır. Daha sonra önerilen yöntem mevcut yöntemlerin ürettiği temel veri kümesine tatbik edilerek, bu yöntemlerin duyarlılık ve anma değerlerindeki değişim incelenmiştir. Eşdizim eğilimi yönteminin tüm yöntemleri iyileştirdiği gözlenmiştir.
Özet (Çeviri)
Texts are language tools to transfer and store information in written form. In this thesis, two analysis methods: function word detection and collocation extraction which support the studies in extraction of meaning and measuring the amount of information are presented.Function words, playing grammatical roles, appear in high frequencies and rarely contribute to the meaning of the text. In this thesis, a statistical method, discriminant analysis, which merges several linguistic features, is proposed to discriminate function words. The proposed method is utilized on Turkish texts. The results show that the method brings a significant improvement in distinction compared to well known frequency of occurrence and tf-idf methods.Collocations are the groups of words which collocate to complete or enforce their meaning integrity. In this thesis, collocative tendency method which states that any word in a collocation must suggest or at least imply the following words composing the collocation is presented. Firstly, current collocation extraction methods are utilized on a Turkish corpora and the effect of stemming is investigated. Following, the proposed method is tested on a base data set extracted by some statistical techniques and it is evaluated by precision and recall measures. It is found that collocation tendency method gives a remarkable improvement in current techniques of collocation extraction.
Benzer Tezler
- Analitik sosyoloji perspektifinden hesaplamalı sosyal bilim yöntemleri: Twitter verilerinin metin analizi ve network modellemesi
Computational social science methods from an analytical sociology perspective: Text analysis and network modelling of Twitter data
TALİP AKÇELİK
Yüksek Lisans
Türkçe
2023
SosyolojiHacettepe ÜniversitesiSosyoloji Ana Bilim Dalı
DOÇ. DR. SELDA TAŞDEMİR AFŞAR
- Dizel motor emisyonlarının hesaplamalı akışkanlar dinamiği yardımıyla çok boyutlu modellenmesi ve analizi
Multi – dimensional modelling and analyzing of diesel engine emissions using computational fluid dinamics
SELİN TUĞBA ACUN
Yüksek Lisans
Türkçe
2013
Makine Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET METİN ERGENEMAN
- Çok yönlü dizilerin çokdeğişkenliliği yükseltilmiş çarpımlar gösterilimi aracılığıyla ayrıştırımı ve uygulamaları
Multi-way array decomposition via enhanced multivariance product representation and application
EVRİM KORKMAZ ÖZAY
Doktora
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiHesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
PROF. DR. METİN DEMİRALP
- Genetik algoritmaları kullanarak web sayfalarından veri çıkarımı için otomatik olarak düzenli ifade oluşturma
Automatically generating regular expressions for data extraction from web pages using genetic algorithms
CANAN ASLANYÜREK
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTrakya ÜniversitesiHesaplamalı Bilimler Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TARIK YERLİKAYA
- Metin madenciliği ile karşılaştırmalı bir inceleme: 'Le Petit Prince' çevirileri
A comparative study with text mining: 'Le Petit Prince' translations
İLYAS BOĞUSOĞLU
Yüksek Lisans
Türkçe
2024
DilbilimPamukkale ÜniversitesiDil Bilimleri ve Kültür Araştırmaları Ana Bilim Dalı
DOÇ. DR. ZEYNEP GENÇER BALOĞLU