Geri Dön

Metin madenciliğinde kategorik değişkenler için benzetim katsayılarının kullanılması üzerine bir çalışma

A study on the use of simulation coefficients for categorical variables in text mining

  1. Tez No: 572943
  2. Yazar: EMİNE EDA ÇAM
  3. Danışmanlar: PROF. DR. LEVENT ŞENYAY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Ekonometri, İşletme, Econometrics, Business Administration
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Dokuz Eylül Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: Ekonometri Ana Bilim Dalı
  12. Bilim Dalı: Ekonometri Bilim Dalı
  13. Sayfa Sayısı: 108

Özet

Metinlerin sayısal ortamlara aktarılması teknolojik gelişmeler yardımı ile kolaylaşmıştır. Metinlere ulaşılabilmesi ve metinlerden anlamlı bilgilerin elde edilebilmesi için metin madenciliği tekniklerinin uygulanması gerekmektedir. Metin madenciliği, yapısal formda bulunmayan verilerden doğal dil işleme disiplini ile birlikte metin üzerinden istatistiksel sonuçları elde etmeyi amaçlamaktadır. Bu çalışma kapsamında, 4 farklı yazarın 6 farklı eseri üzerinde metin madenciliği teknikleri ve benzerlik-uzaklık ölçüleri kullanılarak R programı yardımıyla yazar tanıma ve metin sınıflandırma başarısı elde edilmeye çalışılmıştır. Yazarların eserleri ile ilgili sayısal veriler çıkartılarak bu sayısal veriler ile arasında Öklid uzaklığı hesaplanmış olup K-NN algoritması yardımıyla metin sınıflandırma yapılmıştır. Yazarı belli olmayan bir eserin elde edilen verilerden hareket ile hangi metin kümesine ait olduğu tespit edilmeye çalışılmıştır.

Özet (Çeviri)

The transfer of texts into digital environments is facilitated by technological developments. Text mining techniques should be applied in order to reach the texts and to obtain meaningful information from the texts. Text mining aims to obtain statistical results over the text along with the natural language processing discipline from data that is not found in the structure form. Within the scope of this study, by using the text mining techniques and similarity-distance measurements on 6 different works of 4 different authors, the success of author recognition and text classification with the help of R program has been tried to be achieved. The numerical data related to the authors' works were extracted and the Euclidean distance was calculated between these numerical data and the text classification was done by using the K-NN algorithm. It has been tried to determine which text set belongs to a given work, based on the data obtained.

Benzer Tezler

  1. Understanding twitter users' behaviour by social network analysis during disasters

    Afet durumunda twıtter kullanıcılarının sosyal ağ analizi ile davranışını anlama

    GÖZDE MERVE DEMİRCİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞULE ITIR SATOĞLU

    DOÇ. DR. GÜLÜSTAN DOĞAN

  2. Özellik tabanlı görüş madenciliğinde yapay zeka teknikleri kullanarak görüş hedefi çıkarımı ve kategori tespiti

    Opinion target extraction and category detection using artificial intelligence techniques in aspect-based opinion mining

    KÜRŞAT MUSTAFA KARAOĞLAN

    Doktora

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. OĞUZ FINDIK

  3. Dengesiz veri setlerinde sınıflandırma problemlerinin çözümünde melez yöntem uygulaması

    Hybrid method application to solve classification problems in imbalanced datasets

    MESTAN ŞAHİN PİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Endüstri ve Endüstri MühendisliğiBursa Uludağ Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. DUYGU YILMAZ EROĞLU

  4. Büyük veri analizi yöntemleri ve yazılım teknolojileriyle metin madenciliği

    Text mining using big data analysis methods and tools

    EVREN PALA

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHava Harp Okulu Komutanlığı

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÜRAY YILMAZ

  5. Türkçe sosyal medya içeriklerinin analizi için sanal asistan tasarımı

    Virtual assistant design for analysis of Turkish social media contents

    MELTEM UZAVCI

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilim ve TeknolojiSakarya Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    DOÇ. DR. HALİL İBRAHİM CEBECİ