Geri Dön

Recommender system for employee attrition prediction and movie suggestion

Çalışan yıpranması tahmini ve film tavsiyesi için öneri sistemi

  1. Tez No: 637313
  2. Yazar: FATMA ÖZDEMİR
  3. Danışmanlar: PROF. DR. VEHBİ ÇAĞRI GÜNGÖR, DR. MUSTAFA COŞKUN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Abdullah Gül Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 68

Özet

Bu tezde Makine Öğrenimi Topluluğunda ortaya atılan iki probleme odaklanıyoruz: tavsiye sistemi ve çalışanların yıpranma sorunu. Tavsiye sistemi, kullanıcıların bir ürün satın alırken belirli bir öğeyi tercih edip etmeyeceğini tahmin eden bir bilgi filtreleme sistemidir. Tavsiye sistemleri tahmin etmek için kullanıcı / öğe bilgilerini kullanır. Bu sistemler, özellikle işbirlikçi filtreleme tabanlı sistemler, E-ticarette yaygın olarak kullanılmaktadır. Bu çalışmada, ortak filtreleme ve kullanıcıların / öğelerin yan bilgilerini birleştiren karma bir model öneriyoruz. Önerilen modelde, ilişkili komşuları bulmak ve onları kümelemek için kullanıcıların / öğelerin yan bilgileri kullanılır. Daha sonra, bu kümelere ortak filtreleme yöntemleri uygulanır. Önerilen modelin performansını değerlendirmek için matris çarpanlara ayırma ve yeniden başlatma ile rastgele yürüme uygulanır. Önerilen yaklaşım MovieLens verileri üzerinde sistematik olarak değerlendirilir. Deneysel sonuçlar, kullanıcının / öğenin yan bilgisini kullanan önerilen modelin geleneksel ortak filtreleme yöntemlerinin performansını önemli ölçüde geliştirdiğini göstermektedir. Tezin ikinci bölümünde, hangi kişilerin şu anda çalıştıkları bir şirketten ayrılacağını / devam edeceğini tahmin etmeye çalışan, çalışan yıpranması tahmini sorununu ele almaya çalışıyoruz. Günümüzde şirketler için çalışanların işlerini bırakıp bırakmayacaklarını tahmin etmeleri çok önemlidir. En iyi performans gösteren çalışanların işi bırakması, kuruluşlarda finansal veya kurumsal bilgi kaybına neden olabilir. Bu tür kayıplardan kaçınmak için şirketler, çalışanların yıpranmasını tahmin etmelidir. Bununla birlikte, şirketlerin İK departmanları bu tür tahminleri yapacak kadar gelişmiş değildir. Bu amaçla şirketler, çalışanların yıpranmasını zamanında ve doğru bir şekilde tahmin etmek için veri madenciliği yöntemleri kullanmaktadır. Bu çalışmada, Doğrusal diskriminant analizi (LDA), Naive Bayes, Bagging, AdaBoost, Lojistik Regresyon, Destek Vektör Makinesi (SVM), Rastgele Orman, J48, LogitBoost, Çok Katmanlı Algılayıcı (MLP), K-En Yakın Komşular (KNN), XGBoost, Graph Convolutional Networks, iki özel şirket veri kümesinde (IBM ve Adesso İnsan Kaynakları veri kümelerine) çalışanların yıpranmasını tahmin etmek için uygulanmıştır. Mevcut çalışmalardan farklı olarak, bulgularımızı sistematik olarak F-ölçü, Eğri Altında Alan, doğruluk, duyarlılık ve özgüllük gibi çeşitli sınıflandırma metrikleri ile değerlendiriyoruz. Performans sonuçları, LogitBoost ve Lojistik Regresyon algoritmaları gibi veri madenciliği yöntemlerinin çalışanların yıpranmasını tahmin etmede çok yararlı olabileceğini göstermektedir.

Özet (Çeviri)

In this thesis, we focus on two problems raised in Machine Learning Community, namely, the recommender system and employee attrition problem. The recommender system is an information filtering system that predicts whether users would prefer a given item when purchasing a product. Recommender systems utilize information of users/items to predict. These systems, especially the collaborative filtering based ones, are used widely in E-commerce. In this work, we propose a hybrid model that combines collaborative filtering and side-information of users/items. In the proposed model, side-information of users/items is utilized to find correlated neighbors and cluster them. Then, collaborative filtering methods are applied to these clusters. The matrix factorization and random walk with restart are implemented to evaluate the performance of the proposed model. The proposed approach is systematically evaluated on MovieLens data. Experimental results show that the proposed model, which uses the side-information of the user/item, considerably improves the performance of traditional collaborative filtering methods. In the second part of the thesis, we try to address the employee attrition prediction problem, which is trying to predict which persons will leave/continue a company for which they currently work. Nowadays, it is very critical for companies to predict that the employees will leave their jobs or not. Leaving employees, who are top performers, may cause financial or institutional knowledge losses in the organizations. To avoid such losses, companies have to predict employee attrition. However, the HR departments of companies are not advanced enough to make such a prediction. To this end, companies are using data mining methods to timely and accurately predict employee attrition. In this study, the performance of different classification methods, such as Linear discriminant analysis (LDA), Naive Bayes, Bagging, AdaBoost, Logistic Regression, Support Vector Machine (SVM), Random Forest, J48, LogitBoost, Multilayer Perceptron (MLP), K-Nearest Neighbors (KNN), XGBoost, Graph Convolutional Networks, have been presented to predict employee attrition based on two private company datasets, i.e., IBM and Adesso Human Resource datasets. Different from existing studies, we systematically evaluate our findings with various classification metrics, such as F-measure, Area Under Curve, accuracy, sensitivity, and specificity. Performance results show that data mining methods, such as LogitBoost and Logistic Regression algorithms, can be very useful for predicting employee attrition.

Benzer Tezler

  1. Yapay sinir ağları ve destek vektör makineleri ile kemik erimesinin teşhisi

    Diagnosis of osteoporosis using artificial neural networks and support vector machines

    MUSTAFA İSTANBULLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Biyomühendislikİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. SEDEF KENT

  2. Porsuk Nehri modelinin belirsizlik analizi

    Uncertainty analysis of Porsuk River model

    F.ERCAN KEFLİ

    Yüksek Lisans

    Türkçe

    Türkçe

    1994

    Çevre Mühendisliğiİstanbul Teknik Üniversitesi

    PROF.DR. HASAN Z. SARIKAYA

  3. Ayrık doğal taşınım sistemlerinin analizi

    Analysis of thermally discrete, natural convection systems

    İ.YALÇIN URALCAN

    Doktora

    Türkçe

    Türkçe

    1991

    Makine Mühendisliğiİstanbul Teknik Üniversitesi

    PROF.DR. OSMAN F. GENCELİ

  4. Uçak bakım teknisyenlerindeki tükenmişlik sendromunun uçuş emniyeti üzerindeki etkisinin incelenmesi

    Investigation of the effect of burnout syndrome in aircraft maintenance technicians on flight safety

    ZÜLAL YÜRÜK

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Sivil HavacılıkEskişehir Teknik Üniversitesi

    Uçak Gövde Motor Bakım Ana Bilim Dalı

    DOÇ. DR. EBRU YAZGAN

  5. Havalimanlarındaki yolcu kuyruklarının azaltılmasına yönelik geliştirilen uygulamanın ajan temelli simülasyonu ve analizi

    Agent-based simulation and analysis of developed implementation for reducing passenger queue at the airport

    HAKAN AKSOY

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ÖZGÜR KABAK