Geri Dön

R programı ile metin madenciliği üzerine uygulama

An application on text mining with the R program

  1. Tez No: 865527
  2. Yazar: MEHMET ŞULAN
  3. Danışmanlar: DOÇ. DR. FAHRETTİN ÖZBEY
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Bitlis Eren Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 79

Özet

Veri madenciliği yöntemi sayısal özellikli veya sayısal bir biçimde temsil edilen veri setlerinde kullanılan verileri istatistiksel bir şekilde analiz ederek sonuca ulaşmayı hedefler. Metin madenciliği ise metinlerin analizi ile yapısal olmayan, word, pdf formatlarındaki metin dosyaları ile sosyal medya paylaşımları ve blog dosyaları gibi elektronik metin ve belge yığınları arasından daha önceden keşfedilmeyen ve potansiyel olarak kullanılabilir verileri yapısal ve düzenli bir şekilde elde etme işlemidir. Metin madenciliği istatistiksel olarak metin üzerinden sonuca ulaşmayı hedeflemektedir. Metin halindeki bir veriden bilgi çıkarımının yapılabilmesi için öncelikle bazı işlemlerin gerçekleştirilmesi ve yapısal şekilde bulunmayan metinsel verilerin dönüştürülerek yapısal bir hale çevrilmesi gereklidir. Daha sonra yapısal hale dönüştürülen metinsel verilerin veri madenciliği yöntemlerinin uygulanılabileceği hale çevrilmiş olunur. Metinlerin toplanması ile başlayan bu süreç, toplanan metinlerin bazı veri ön işleme ve dönüştürme sürecinden sonra istatistik ve veri madenciliği yöntemlerinin kullanılmasıyla anlamlı bilgiye ulaşılır. Tez çalışmasında veri madenciliği ve metin madenciliği uygulama ve yöntemlerinden bahsedilip YÖK Akademi ve Dergipark Uygulamasından elde edilen veriler R programı kullanılarak ilk etapta veri ve metin madenciliği yöntemleriyle gerekli analizler yapıldıktan sonra kelime bulutları oluşturulmuştur.

Özet (Çeviri)

Data mining aims to analyze data in a statistically significant manner, particularly in datasets featuring numerical attributes or those represented in a numerical format. On the other hand, text mining involves the structured and systematic extraction of previously undiscovered and potentially valuable information from electronic text and document collections, such as textual files in formats like word or pdf, social media posts, and blog entries. Text mining seeks to derive meaningful results from text through statistical analysis. To extract information from textual data, certain processes must first be executed, and non-structurally formatted textual data needs to be transformed into a structured form. Subsequently, the text data transformed into a structured format becomes amenable to the application of data mining methods. Commencing with the collection of texts, this process culminates in meaningful information through the utilization of statistical and data mining methods after subjecting the collected texts to some data preprocessing and transformation procedures. In the thesis study, data mining and text mining applications and methods are discussed, and data obtained from YÖK Academy and Dergipark Application are subjected to initial analyses using R programming with data and text mining methods. Following the necessary analyses, word clouds were generated.

Benzer Tezler

  1. Veri madenciliğinde bir metin madenciliği uygulaması

    A text mining application in data mining

    HARUN BAYER

    Yüksek Lisans

    Türkçe

    Türkçe

    2011

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBeykent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. GÖKHAN SİLAHTAROĞLU

  2. Eğitimde metin madenciliği: Türkçe metinlerde sözlük tabanlı duygu analizi

    Text mining in education: Dictionary-based in Turkish texts sentiment analysis

    LEYLA KARAKUŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Eğitim ve ÖğretimAkdeniz Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    DOÇ. DR. BİLAL BARIŞ ALKAN

  3. Metin madenciliğinde kategorik değişkenler için benzetim katsayılarının kullanılması üzerine bir çalışma

    A study on the use of simulation coefficients for categorical variables in text mining

    EMİNE EDA ÇAM

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    EkonometriDokuz Eylül Üniversitesi

    Ekonometri Ana Bilim Dalı

    PROF. DR. LEVENT ŞENYAY

  4. Otel yorumlarının metin madenciliği yöntemleri ile karşılaştırmalı analizi: Mayorka, Antalya, Şarm-el Şeyh örneği

    Comparative analysis of hotel reviews with text mining methods: The case of Majorca, Antalya, Sharm-el-Sheikh

    LEYLA ATABAY

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    TurizmAkdeniz Üniversitesi

    Turizm İşletmeciliği Ana Bilim Dalı

    PROF. DR. BEYKAN ÇİZEL

  5. Pyrolysis processes and characterisation studies on three solid fuels

    Üç katı yakıtın pirolizi ve karakterizasyon çalışmaları

    MURAT ÇITIROĞLU

    Doktora

    İngilizce

    İngilizce

    1993

    Kimya Mühendisliğiİstanbul Teknik Üniversitesi

    PROF.DR. EKREM EKİNCİ