Geri Dön

Türkçe'de hesaplamalı metin analizi

Computational text analysis in turkish

  1. Tez No: 285191
  2. Yazar: SENEM KUMOVA METİN
  3. Danışmanlar: PROF. DR. BAHAR KARAOĞLAN
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Computer Engineering and Computer Science and Control, Science and Technology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2011
  8. Dil: Türkçe
  9. Üniversite: Ege Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Uluslararası Bilgisayar Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 99

Özet

Metinler bilginin dil vasıtasıyla yazılı biçimde aktarımını ve saklanmasını sağlayan araçlardır. Bu tezde metnin taşıdığı anlamın, aktarmak istediği enformasyonun tespiti çalışmalarını destekleyen iki temel analiz çalışması sunulmaktadır: işlev kelimelerin ve eşdizimlerin tespiti.İşlev kelimeler metnin anlam bütünlüğüne katkısı olmayan ya da çok az olan kelimelerdir. Bu kelimeler sıklıkla gözlenmeleri sebebiyle metinde azımsanamayacak büyüklükte bir yer işgal ederler. Tez kapsamında işlev kelimelerin tespiti için dile ait farklı özelliklerin bir arada değerlendirilebileceği istatistiksel bir yöntem olan diskriminant analizinin kullanılması önerilmiştir. Önerilen yöntem Türkçe metinler üzerinde sınanmış ve sıklıkla kullanılan gözlenme sıklığı ve tf-idf gibi mevcut yöntemlerden daha başarılı sonuçlar ürettiği gösterilmiştir.Eşdizimler anlam bütünlüklerini tamamlamak veya güçlendirmek amacıyla birarada bulunan kelimelerin oluşturduğu kelime birlikleridir. Eşdizim oluşturan kelimelerin birbirlerini anımsattığı temelinden yola çıkarak tez kapsamında eşdizim eğilimi yöntemi geliştirilmiştir. Öncelikle literatürde yer alan bazı yöntemler Türkçe derlemler üzerinde uygulanmış ve gövdelemenin etkisi araştırılmıştır. Daha sonra önerilen yöntem mevcut yöntemlerin ürettiği temel veri kümesine tatbik edilerek, bu yöntemlerin duyarlılık ve anma değerlerindeki değişim incelenmiştir. Eşdizim eğilimi yönteminin tüm yöntemleri iyileştirdiği gözlenmiştir.

Özet (Çeviri)

Texts are language tools to transfer and store information in written form. In this thesis, two analysis methods: function word detection and collocation extraction which support the studies in extraction of meaning and measuring the amount of information are presented.Function words, playing grammatical roles, appear in high frequencies and rarely contribute to the meaning of the text. In this thesis, a statistical method, discriminant analysis, which merges several linguistic features, is proposed to discriminate function words. The proposed method is utilized on Turkish texts. The results show that the method brings a significant improvement in distinction compared to well known frequency of occurrence and tf-idf methods.Collocations are the groups of words which collocate to complete or enforce their meaning integrity. In this thesis, collocative tendency method which states that any word in a collocation must suggest or at least imply the following words composing the collocation is presented. Firstly, current collocation extraction methods are utilized on a Turkish corpora and the effect of stemming is investigated. Following, the proposed method is tested on a base data set extracted by some statistical techniques and it is evaluated by precision and recall measures. It is found that collocation tendency method gives a remarkable improvement in current techniques of collocation extraction.

Benzer Tezler

  1. Analitik sosyoloji perspektifinden hesaplamalı sosyal bilim yöntemleri: Twitter verilerinin metin analizi ve network modellemesi

    Computational social science methods from an analytical sociology perspective: Text analysis and network modelling of Twitter data

    TALİP AKÇELİK

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    SosyolojiHacettepe Üniversitesi

    Sosyoloji Ana Bilim Dalı

    DOÇ. DR. SELDA TAŞDEMİR AFŞAR

  2. Dizel motor emisyonlarının hesaplamalı akışkanlar dinamiği yardımıyla çok boyutlu modellenmesi ve analizi

    Multi – dimensional modelling and analyzing of diesel engine emissions using computational fluid dinamics

    SELİN TUĞBA ACUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Makine Mühendisliğiİstanbul Teknik Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET METİN ERGENEMAN

  3. Çok yönlü dizilerin çokdeğişkenliliği yükseltilmiş çarpımlar gösterilimi aracılığıyla ayrıştırımı ve uygulamaları

    Multi-way array decomposition via enhanced multivariance product representation and application

    EVRİM KORKMAZ ÖZAY

    Doktora

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı

    PROF. DR. METİN DEMİRALP

  4. Genetik algoritmaları kullanarak web sayfalarından veri çıkarımı için otomatik olarak düzenli ifade oluşturma

    Automatically generating regular expressions for data extraction from web pages using genetic algorithms

    CANAN ASLANYÜREK

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTrakya Üniversitesi

    Hesaplamalı Bilimler Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TARIK YERLİKAYA

  5. Metin madenciliği ile karşılaştırmalı bir inceleme: 'Le Petit Prince' çevirileri

    A comparative study with text mining: 'Le Petit Prince' translations

    İLYAS BOĞUSOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    DilbilimPamukkale Üniversitesi

    Dil Bilimleri ve Kültür Araştırmaları Ana Bilim Dalı

    DOÇ. DR. ZEYNEP GENÇER BALOĞLU