Geri Dön

Makine öğrenmesinde boyutsal indirgeme teknikleri ile mobil oyun kullanıcı segmentasyonu

Mobile game user segmentation with dimensionality reduction techniques in machine learning

  1. Tez No: 805156
  2. Yazar: GÜLEN ARIKAN KOKKAYA
  3. Danışmanlar: PROF. DR. İLKNUR ESEN YILDIRIM
  4. Tez Türü: Doktora
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Marmara Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: Ekonometri Ana Bilim Dalı
  12. Bilim Dalı: İstatistik Bilim Dalı
  13. Sayfa Sayısı: 149

Özet

Otonom kaynaklardan elde edilen büyük verilerin; hacim, çeşitlilik ve karmaşıklık yönünden değişim hızının artması, bu tür verilerin analizi için yetersiz hale gelen geleneksel yöntemler yerine yapay zeka, makine öğrenmesi vb. yaklaşımlara başvurulmasını gerektirmektedir. Yapay zeka uygulamalarının en gelişmiş versiyonu olarak nitelenen makine öğrenmesi algoritmaları kullanılarak, büyük verinin içerdiği örüntüleri tespit etmek ve veride gizlenen enformasyonları ortaya çıkarmak mümkündür. Depolanan özellik sayısının artması ile birlikte, önemsiz ve/veya benzer özellik taşıyan boyutların da modelde yer alması nedeniyle, makine öğrenmesi performansı ve oluşturulan modelin doğruluğu olumsuz etkilemektedir. Boyutluluk laneti olarak bilinen bu sorunun çözümü için geliştirilen boyut indirgeme algoritmaları sayesinde, yüksek boyutlu verilerin sınıflandırılması, görselleştirilmesi ve özetlenmesi mümkün olmaktadır. Bu çalışmada, yüksek hacmi ve doğrusal olmayan yapısı nedeniyle analizinde güçlük yaşanan gerçek dünya verilerinde, boyut indirgeme ve veri görselleştirme amacıyla kullanılan manifold tabanlı makine öğrenmesi algoritmaları ele alınmıştır. Bu algoritmaların en günceli olan UMAP algoritması, son yıllarda yüksek yatırımlara konu olan mobil oyun sektöründe, bir pazarlama problemi için uygulanmıştır. Firmalar için artan maliyetlerin yanı sıra, yeni müşteri edinmenin mevcut müşterileri elde tutmaktan çok daha pahalı olması sebebiyle, müşteri kayıp oranını azaltmak, firmaların öncelikli amacı haline gelmiştir. Bu kapsamda, doğru müşterilere doğru kampanya ve reklamların ulaştırılması önemli bir rol oynamakta olup; bu amaca ulaşmak da ancak doğru müşteri segmentasyonu ile mümkün olabilmektedir. Bu çerçevede, bir mobil oyuna ait verilere UMAP algoritması uygulanarak, müşterilerin oyun içindeki davranışlarını baz alan bir segmentasyon çalışması yapılmıştır. UMAP algoritması, davranışsal segmentasyon için pazarlama alanında sıkça başvurulan RFM modeline dayalı olarak çalıştırılmış; böylelikle RFM modeline yönelik bazı eleştirilere çözüm üretilmeye çalışılmıştır. Ayrıca; UMAP algoritmasının farklı hiperparametreleri kullanılarak elde edilen davranışsal segmentasyon grafikleri ile müşterilerin yalnızca oyun içinde harcadığı meblağlar baz alınarak yapılan segmentasyon sonuçları karşılaştırılmıştır. UMAP algoritması ile yapılan boyut indirgemenin kNN sınıflama performansı üzerindeki etkisi de değerlendirilmiştir.

Özet (Çeviri)

The increase in the rate of change in terms of volume, diversity and complexity of big data obtained from autonomous sources requires the use of artificial intelligence, machine learning, etc. approaches instead of traditional methods that have become inadequate for the analysis of such data. By using machine learning algorithms, which are described as the most advanced version of artificial intelligence applications, it is possible to detect the patterns contained in big data and to reveal the information hidden in the data. With the increase in the number of stored features, the machine learning performance and accuracy of the created model are adversely affected due to the insignificant and/or similar features being included in the model. Thanks to the dimensionality reduction algorithms developed to solve this problem - known as the curse of dimensionality - it is possible to classify, visualize and summarize high-dimensional data. In this study, manifold-based machine learning algorithms used for dimensionality reduction and data visualization in real world data, which are difficult to analyze due to their high volume and non-linear structure, are discussed. The most recent of these algorithms, the UMAP algorithm, has been applied for a marketing problem in the mobile game industry, which has been subjected to high investments in recent years. In addition to increasing costs for companies, it has become the primary goal of companies to reduce customer churn rates, based on the finding that acquiring new customers is much more expensive than retaining existing customers. In this context, delivering the right campaigns and advertisements to the right customers plays an important role, and achieving this goal is only possible with the right customer segmentation. In this framework, segmentation was made based on the behavior of the customers in the game by applying the UMAP algorithm to the data of a mobile game. UMAP algorithm has been run for behavioral segmentation based on the RFM model, which is frequently used in the field of marketing, and it has been tried to find solutions to some criticisms of the RFM model. In addition, behavioral segmentation graphics obtained by using different hyperparameters of the UMAP algorithm and segmentation results based on only the amount spent by customers in the game were compared. The effect of dimensionality reduction with the UMAP algorithm on the kNN classification performance was also investigated.

Benzer Tezler

  1. Deep convolutional neural network based unconstrained ear recognition

    Derin evrişimsel sinir ağı tabanlı kısıtsız kulak tanıma

    FEVZİYE İREM EYİOKUR

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HAZIM KEMAL EKENEL

  2. Software defect prediction with a personalization focus and challenges during deployment

    Kişiselleştirme odaklı yazılım hata tahmini ve entegrasyon zorlukları

    BEYZA EKEN

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ AYŞE TOSUN KÜHN

  3. Makine öğrenmesinde ayrık öbekleme ve sınıflandırma algoritmaları

    Discrete clustering and classifications in machine learning

    KEREM KABİL

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilim ve Teknolojiİstanbul Teknik Üniversitesi

    Matematik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ATABEY KAYGUN

  4. Makine öğrenmesinde açıklanabilirlik kavramına derin pekiştirmeli öğrenme ve sembolik regresyon ile hibrit yaklaşım: Algoritmik ticaret örneği

    A hybrid approach to explainability in machine learning with deep reinforcement learning and symbolic regression: Algorithmic trading example

    VOLKAN ETEMAN

    Doktora

    Türkçe

    Türkçe

    2024

    EkonometriBursa Uludağ Üniversitesi

    Ekonometri Ana Bilim Dalı

    PROF. DR. ERKAN IŞIĞIÇOK

  5. An investigation of the impact of different data cleaning techniques on metric result quality in machine learning

    Makine öğrenmesinde, farklı veri temizleme tekniklerlerinin sonuç ölçevleri üzerindeki etkisinin incelenmesi

    ISRAA MUSTAFA ABBAS

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtılım Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SACİP TOKER