Metin madenciliği tekniklerinin Türkçe otel yorumları üzerine uygulanması
Application of text mining techniques on Turkish hotel reviews
- Tez No: 923429
- Danışmanlar: DOÇ. DR. DENİZ ÖZONUR
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 105
Özet
Bu çalışmada, Antalya'nın üç tatil bölgesindeki beş yıldız ve beş yıldız altı olarak nitelendirilen otuz üç otele ait Tripadvisor sitesinde bulunan müşteri yorumları incelenmiştir. Otellere ait müşteri yorumları literatürde Türkçe veri setine nadiren uygulanan metin madenciliği, doğal dil işleme ve makine öğrenmesi algoritmaları kullanılarak analiz edilmiştir. Toplam 24417 müşteri yorumu metin ön işleme adımlarına tabi tutulmuştur ve duygu analizi yoluyla pozitif veya negatif olarak etiketlenmiştir. Elde edilen pozitif ve negatif yorumlar kullanılarak otellerin güçlü ve zayıf yönlerini ortaya çıkarmak amacıyla“var”ve“yok”kelimeleri seçilerek metin bağlantı analizi uygulanmıştır. Ayrıca, kelimeler ile değişkenler arasındaki ilişkileri ortaya çıkarmak için uygunluk analizi yapılmıştır. Konu modelleme tekniği Gizli Dirichlet Ayrımı (LDA) kullanılarak yorumlar içerisindeki gizli olan“Otel Genel Değerlendirmesi”,“Konaklama ve Tesis Özellikleri”,“Yemek ve Hizmet Kalitesi”,“Eğlence ve Aktiviteler”,“Personel ve Müşteri ilişkileri”konu başlıkları belirlenmiştir. Yorumlar içerisindeki baskın konular tespit edilerek gerçek etiketler olarak nitelendirilmiştir. Yeni yorumların baskın olduğu konuları tahmin etmek amacıyla çeşitli metin temsilleri ile makine öğrenmesi algoritmalarının kombinasyonlarından oluşan sınıflandırma modelleri uygulanmıştır. TF-IDF metin temsili ve Lojistik regresyon sınıflandırma yöntemi kombinasyonunun %86.6 doğruluk oranı ile en yüksek doğruluğu verdiği tespit edilmiştir.
Özet (Çeviri)
In this study, customer reviews of thirty-three hotels located in three holiday regions of Antalya, classified as five-star and below five-star, were analyzed using data obtained from the Tripadvisor website. Customer reviews of the hotels were analyzed using text mining, natural language processing and machine learning algorithms, which are rarely applied to the Turkish data set in the literature. A total of 24417 customer reviews were subjected to text preprocessing steps and labeled as either positive or negative through sentiment analysis. To reveal the strengths and weaknesses of the hotels using the positive and negative comments obtained, text link analysis was applied by selecting the words“exist”and“not exist”. Additionally, correspondence analysis was performed to reveal the relationships between the words and the variables. Using the topic modeling technique Latent Dirichlet Allocation (LDA), the latent topics in the comments,“Overall Hotel Evaluation”,“Accommodation and Facility Features”,“Food and Service Quality”,“Entertainment and Activities”,“Staff and Customer Relations”, were determined. The dominant topics in the comments were determined and characterized as real labels. To predict the dominant themes of future reviews, classification models combining various text representations and machine learning algorithms were applied. It has been determined that the combination of TF-IDF text representation and Logistic regression classification method gives the highest accuracy with an accuracy rate of 86.6%.
Benzer Tezler
- Otel firmalarına yapılan yorumların metin madenciliği ve derin öğrenme yöntemleri ile analizi
Analysis of reviews made to hotel companies using text mining and deep learning methods
MUHAMMED KAAN AKGÜN
Yüksek Lisans
Türkçe
2025
Yönetim Bilişim SistemleriAksaray ÜniversitesiYönetim Bilişim Sistemleri Ana Bilim Dalı
DOÇ. DR. KEMAL ADEM
DR. ÖĞR. ÜYESİ UĞUR DEMİROĞLU
- Metin madenciliği teknikleri kullanılarak kulak burun boğaz hasta bilgi formlarının analizi
Analysis of otolaryngology patient information forms using text mining techniques
BAŞAK OĞUZ
Yüksek Lisans
Türkçe
2009
Bilim ve TeknolojiAkdeniz ÜniversitesiBiyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı
YRD. DOÇ. DR. UĞUR BİLGE
- Metin madenciliği yöntemi ile haber sitelerindeki köşe yazılarının sınıflandırılması
Classification of online newspapers articles through text mining method
MEHMET FATİH KARACA
Yüksek Lisans
Türkçe
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. SALİH GÖRGÜNOĞLU
- Metin madenciliği teknikleri ile sosyal ağlarda bilgi keşfi
Knowledge discovery in social networks using text mining techniques
FATMA GÜLŞAH TAN
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ASIM SİNAN YÜKSEL
- Metin madenciliği ve sağlık alanında bir uygulama
Text mining and an application in health
SELÇUK GÖKSEL TOPLU
Yüksek Lisans
Türkçe
2019
BiyoistatistikDüzce ÜniversitesiBiyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı
DOÇ. DR. ŞENGÜL CANGÜR