Geri Dön

Metin madenciliği tekniklerinin Türkçe otel yorumları üzerine uygulanması

Application of text mining techniques on Turkish hotel reviews

  1. Tez No: 923429
  2. Yazar: ORKUN ENES BALABAN
  3. Danışmanlar: DOÇ. DR. DENİZ ÖZONUR
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 105

Özet

Bu çalışmada, Antalya'nın üç tatil bölgesindeki beş yıldız ve beş yıldız altı olarak nitelendirilen otuz üç otele ait Tripadvisor sitesinde bulunan müşteri yorumları incelenmiştir. Otellere ait müşteri yorumları literatürde Türkçe veri setine nadiren uygulanan metin madenciliği, doğal dil işleme ve makine öğrenmesi algoritmaları kullanılarak analiz edilmiştir. Toplam 24417 müşteri yorumu metin ön işleme adımlarına tabi tutulmuştur ve duygu analizi yoluyla pozitif veya negatif olarak etiketlenmiştir. Elde edilen pozitif ve negatif yorumlar kullanılarak otellerin güçlü ve zayıf yönlerini ortaya çıkarmak amacıyla“var”ve“yok”kelimeleri seçilerek metin bağlantı analizi uygulanmıştır. Ayrıca, kelimeler ile değişkenler arasındaki ilişkileri ortaya çıkarmak için uygunluk analizi yapılmıştır. Konu modelleme tekniği Gizli Dirichlet Ayrımı (LDA) kullanılarak yorumlar içerisindeki gizli olan“Otel Genel Değerlendirmesi”,“Konaklama ve Tesis Özellikleri”,“Yemek ve Hizmet Kalitesi”,“Eğlence ve Aktiviteler”,“Personel ve Müşteri ilişkileri”konu başlıkları belirlenmiştir. Yorumlar içerisindeki baskın konular tespit edilerek gerçek etiketler olarak nitelendirilmiştir. Yeni yorumların baskın olduğu konuları tahmin etmek amacıyla çeşitli metin temsilleri ile makine öğrenmesi algoritmalarının kombinasyonlarından oluşan sınıflandırma modelleri uygulanmıştır. TF-IDF metin temsili ve Lojistik regresyon sınıflandırma yöntemi kombinasyonunun %86.6 doğruluk oranı ile en yüksek doğruluğu verdiği tespit edilmiştir.

Özet (Çeviri)

In this study, customer reviews of thirty-three hotels located in three holiday regions of Antalya, classified as five-star and below five-star, were analyzed using data obtained from the Tripadvisor website. Customer reviews of the hotels were analyzed using text mining, natural language processing and machine learning algorithms, which are rarely applied to the Turkish data set in the literature. A total of 24417 customer reviews were subjected to text preprocessing steps and labeled as either positive or negative through sentiment analysis. To reveal the strengths and weaknesses of the hotels using the positive and negative comments obtained, text link analysis was applied by selecting the words“exist”and“not exist”. Additionally, correspondence analysis was performed to reveal the relationships between the words and the variables. Using the topic modeling technique Latent Dirichlet Allocation (LDA), the latent topics in the comments,“Overall Hotel Evaluation”,“Accommodation and Facility Features”,“Food and Service Quality”,“Entertainment and Activities”,“Staff and Customer Relations”, were determined. The dominant topics in the comments were determined and characterized as real labels. To predict the dominant themes of future reviews, classification models combining various text representations and machine learning algorithms were applied. It has been determined that the combination of TF-IDF text representation and Logistic regression classification method gives the highest accuracy with an accuracy rate of 86.6%.

Benzer Tezler

  1. Otel firmalarına yapılan yorumların metin madenciliği ve derin öğrenme yöntemleri ile analizi

    Analysis of reviews made to hotel companies using text mining and deep learning methods

    MUHAMMED KAAN AKGÜN

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Yönetim Bilişim SistemleriAksaray Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    DOÇ. DR. KEMAL ADEM

    DR. ÖĞR. ÜYESİ UĞUR DEMİROĞLU

  2. Metin madenciliği teknikleri kullanılarak kulak burun boğaz hasta bilgi formlarının analizi

    Analysis of otolaryngology patient information forms using text mining techniques

    BAŞAK OĞUZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2009

    Bilim ve TeknolojiAkdeniz Üniversitesi

    Biyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı

    YRD. DOÇ. DR. UĞUR BİLGE

  3. Metin madenciliği yöntemi ile haber sitelerindeki köşe yazılarının sınıflandırılması

    Classification of online newspapers articles through text mining method

    MEHMET FATİH KARACA

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. SALİH GÖRGÜNOĞLU

  4. Metin madenciliği teknikleri ile sosyal ağlarda bilgi keşfi

    Knowledge discovery in social networks using text mining techniques

    FATMA GÜLŞAH TAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ASIM SİNAN YÜKSEL

  5. Metin madenciliği ve sağlık alanında bir uygulama

    Text mining and an application in health

    SELÇUK GÖKSEL TOPLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    BiyoistatistikDüzce Üniversitesi

    Biyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı

    DOÇ. DR. ŞENGÜL CANGÜR