R programı ile metin madenciliği üzerine uygulama
An application on text mining with the R program
- Tez No: 865527
- Danışmanlar: DOÇ. DR. FAHRETTİN ÖZBEY
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Bitlis Eren Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 79
Özet
Veri madenciliği yöntemi sayısal özellikli veya sayısal bir biçimde temsil edilen veri setlerinde kullanılan verileri istatistiksel bir şekilde analiz ederek sonuca ulaşmayı hedefler. Metin madenciliği ise metinlerin analizi ile yapısal olmayan, word, pdf formatlarındaki metin dosyaları ile sosyal medya paylaşımları ve blog dosyaları gibi elektronik metin ve belge yığınları arasından daha önceden keşfedilmeyen ve potansiyel olarak kullanılabilir verileri yapısal ve düzenli bir şekilde elde etme işlemidir. Metin madenciliği istatistiksel olarak metin üzerinden sonuca ulaşmayı hedeflemektedir. Metin halindeki bir veriden bilgi çıkarımının yapılabilmesi için öncelikle bazı işlemlerin gerçekleştirilmesi ve yapısal şekilde bulunmayan metinsel verilerin dönüştürülerek yapısal bir hale çevrilmesi gereklidir. Daha sonra yapısal hale dönüştürülen metinsel verilerin veri madenciliği yöntemlerinin uygulanılabileceği hale çevrilmiş olunur. Metinlerin toplanması ile başlayan bu süreç, toplanan metinlerin bazı veri ön işleme ve dönüştürme sürecinden sonra istatistik ve veri madenciliği yöntemlerinin kullanılmasıyla anlamlı bilgiye ulaşılır. Tez çalışmasında veri madenciliği ve metin madenciliği uygulama ve yöntemlerinden bahsedilip YÖK Akademi ve Dergipark Uygulamasından elde edilen veriler R programı kullanılarak ilk etapta veri ve metin madenciliği yöntemleriyle gerekli analizler yapıldıktan sonra kelime bulutları oluşturulmuştur.
Özet (Çeviri)
Data mining aims to analyze data in a statistically significant manner, particularly in datasets featuring numerical attributes or those represented in a numerical format. On the other hand, text mining involves the structured and systematic extraction of previously undiscovered and potentially valuable information from electronic text and document collections, such as textual files in formats like word or pdf, social media posts, and blog entries. Text mining seeks to derive meaningful results from text through statistical analysis. To extract information from textual data, certain processes must first be executed, and non-structurally formatted textual data needs to be transformed into a structured form. Subsequently, the text data transformed into a structured format becomes amenable to the application of data mining methods. Commencing with the collection of texts, this process culminates in meaningful information through the utilization of statistical and data mining methods after subjecting the collected texts to some data preprocessing and transformation procedures. In the thesis study, data mining and text mining applications and methods are discussed, and data obtained from YÖK Academy and Dergipark Application are subjected to initial analyses using R programming with data and text mining methods. Following the necessary analyses, word clouds were generated.
Benzer Tezler
- Veri madenciliğinde bir metin madenciliği uygulaması
A text mining application in data mining
HARUN BAYER
Yüksek Lisans
Türkçe
2011
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBeykent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. GÖKHAN SİLAHTAROĞLU
- Eğitimde metin madenciliği: Türkçe metinlerde sözlük tabanlı duygu analizi
Text mining in education: Dictionary-based in Turkish texts sentiment analysis
LEYLA KARAKUŞ
Yüksek Lisans
Türkçe
2021
Eğitim ve ÖğretimAkdeniz ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
DOÇ. DR. BİLAL BARIŞ ALKAN
- Metin madenciliğinde kategorik değişkenler için benzetim katsayılarının kullanılması üzerine bir çalışma
A study on the use of simulation coefficients for categorical variables in text mining
EMİNE EDA ÇAM
Yüksek Lisans
Türkçe
2019
EkonometriDokuz Eylül ÜniversitesiEkonometri Ana Bilim Dalı
PROF. DR. LEVENT ŞENYAY
- Otel yorumlarının metin madenciliği yöntemleri ile karşılaştırmalı analizi: Mayorka, Antalya, Şarm-el Şeyh örneği
Comparative analysis of hotel reviews with text mining methods: The case of Majorca, Antalya, Sharm-el-Sheikh
LEYLA ATABAY
Yüksek Lisans
Türkçe
2020
TurizmAkdeniz ÜniversitesiTurizm İşletmeciliği Ana Bilim Dalı
PROF. DR. BEYKAN ÇİZEL
- Pyrolysis processes and characterisation studies on three solid fuels
Üç katı yakıtın pirolizi ve karakterizasyon çalışmaları
MURAT ÇITIROĞLU