Geri Dön

Makine öğrenmesi teknikleri ile güncel tüik yaşam memnuniyeti anketlerinin incelenmesi

Analyizing tsi life satisfaction research data with machine learning techniquies

  1. Tez No: 565049
  2. Yazar: ADİL ÇOBAN
  3. Danışmanlar: PROF. DR. İLHAN TARIMER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Muğla Sıtkı Koçman Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilişim Sistemleri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 118

Özet

Veri toplama yöntemiyle mutluluk düzeyi ölçümü, dünyada 1945 sonrası başlamıştır. Türkiye'de mutluluk konusunu ele alan ilk araştırma, Türkiye İstatistik Kurumu (TÜİK) tarafından 2003 yılında gerçekleştirilmiştir. Bu araştırma her yıl tekrar edilmektedir. Mutluluk kavramı, binlerce yıldır düşünürler tarafından merak edilmiş ve sorgulanmıştır. Mutluluğun tanımlanmasında maddi veya manevi, bireysel değerler veya toplumsal değerler gibi farklı boyutlarda ele alınması ile çeşitli fikirler ortaya konulmuştur. Bu tez çalışmasında TÜİK Yaşam Memnuniyeti Araştırması verileri makine öğrenmesi teknikleri ile incelenmiştir. İki aşamada gerçekleşen deneylerden ilkinde cinsiyet sınıflandırması için genel memnuniyet ifade eden özniteliklerden en değerli olanlar bulunmuştur. İkinci aşamada ise mutluluk ve umut sınıflandırması gerçekleştirilmiş ve yeniden örnekleme ile sınıflandırma başarı yüzdeleri artırılmıştır. İlk aşamada memnuniyet değişkenleriyle cinsiyet sınıflandırmasının yapılabildiği gösterilmiştir. Sınıflandırmada elde edilen en yüksek başarı oranı Chi2 (ki-kare) öznitelik seçim algoritmasının seçmiş olduğu üç öznitelikle Rastgele Orman algoritmasının kullanılmasıyla %73 olarak elde edilmiştir. İkinci deney mutluluk ve umut öznitelikleri için sınıflandırma yapılmıştır. Mutluluk sınıflandırması Rastgele Orman, K-Star ve DVM (Destek Vektör Makineleri) algoritmaları ile yapılmıştır. Algoritmaların sınıflandırma başarı yüzdelerini artırmak için yeniden örnekleme yöntemi kullanılarak başarılı sonuçlar alınmıştır. Mutluluk sınıflandırması için yeniden örnekleme öncesi Rastgele Orman, K-Star ve DVM algoritmaları için sınıflandırma başarıları sırasıyla %53.99, %51.67 ve %53.40 olmuştur. Toplam örnek sayısı değiştirilmeden yapılan yeniden örnekleme işleminde hem aşırı örnekleme hem de alt örnekleme yapılmış ve sonuçlar sırasıyla %83,80, %81.85 ve %68.14 olarak elde edilmiştir. Tüm sınıfların örnek sayılarının en çokv örneğe sahip sınıfa eşitlenmesi ile yapılan yeniden örnekleme uygulamasında sınıflandırma başarı yüzdeleri sırasıyla %92.82, %91.46 ve % 75.79 olmuştur. Burada Rastgele Orman algoritması en başarılı sonucu üretmiştir. Umut sınıflandırması için yeniden örnekleme öncesi Rastgele Orman, K-Star ve DVM algoritmaları için sınıflandırma başarıları sırasıyla %72.01, %68.87 ve %56.80 olmuştur. Toplam örnek sayısı değiştirilmeden yapılan yeniden örnekleme işleminde hem aşırı örnekleme hem de alt örnekleme ile yapılmış ve sonuçlar sırasıyla %89.06, %87.21 ve %55.98 olmuştur. Tüm sınıfların örnek sayılarının en çok örneğe sahip sınıfa eşitlenmesi ile yapılan yeniden örnekleme uygulamasında sınıflandırma başarı yüzdeleri sırasıyla %97.02, %94.70 ve % 57.39 olarak elde edilmiştir. Rastgele Orman algoritması en başarılı sonucu üretmiştir. DVM algoritması ile yapılan sınıflandırma çalışmasında, yeniden örnekleme sonrası genel sınıflandırma başarısı düşmüştür. Ancak yeniden örnekleme öncesi sınıf örneklerinden hiç doğru tahmin yapılamayan sınıflarda doğru tahminler üretilmeye başlanmıştır. Bu durumda DVM az örnekli sınıflarda başarı oranı artmıştır. Umut sınıflandırmasında en başarılı algoritmanın Rastgele Orman algoritması olarak elde edilmiştir. Bu çalışma ile TÜİK Yaşam Memnuniyeti Araştırması verileri üzerinde makine öğrenmesi teknikleri kullanılarak Yaşam Memnuniyeti Araştırması anketlerinin incelenmesinin mümkün olduğu gösterilmiştir. Sınıflar arası dengesizliğin giderilmesi ile sınıflandırma algoritmalarının başarısı yükseltilmiştir.

Özet (Çeviri)

Measurement of happiness with data collection method started in the world after 1945. In Turkey, the first research addressing the topic of happiness was held by Turkey Statistical Institute (TSI) in 2003. The research is being held every year. The concept of happiness has been questioned by thinkers for thousands of years. Various ideas have been put forward in the definition of happiness by considering it in different dimensions such as material or spiritual, individual values or social values. In this thesis, the data obtained with TSI Life Satisfaction Survey were examined with machine learning techniques. Among the experiments that took place in two stages, the most valuable attributes were found in the first of the attributes that express general satisfaction for gender classification. In the second stage, the happiness and hope classification was evaluated and the success rate of classification was increased by resampling. It is shown that gender classification can be done with satisfaction variables at first stage. The highest success rate achieved in classification was 73% by Random Forest algorithm with three attributes selected by the Chi2 (chi-square) feature selection algorithm. In the second experiment, happiness and hope classification was done by Random Forest, K-Star and SVM algorithms. Resampling method is used to increase the success rate of classification of the algorithms and successful results are obtained. The classification successes with Random Forest, K-Star and DVM algorithms before re-sampling for happiness classification were 53.99%, 51.67% and 53.40%, respectively. In the re-sampling process without changing the total number of samples, both over-sampling and sub-sampling were performed and the results were 83.80%, 81.85% and 68.14%, respectively. In the re-sampling stage where the sample numbers of all classes were equalized to the sample with the class having most samples, the percentage success rates were 92.82%, 91.46% and 75.79%, respectively. Random Forest algorithm has produced the most successful result. The classification successes with Random Forest, K-Star and DVM algorithms before re-sampling for hope classification were 72.01%, 68.87% and 56.80%, respectively.vii In the resampling without changing the total number of samples, both over-sampling and sub-sampling were performed, and the results were 89.06%, 87.21% and 55.98%, respectively. The classification success rates were 97.02%, 94.70% and 57.39% in the re-sampling stage with the sample numbers of all classes being equalized to the class with the most samples. Forest algorithm has produced the most successful result. In the classification study performed with the DVM algorithm, the success of the general classification after re-sampling decreased. However, in the classes that were not correctly predicted from the pre-sampling class samples, accurate estimates were started to be produced. In this case, the success rate of the DVM low sample classes increased. The most successful algorithm in the Hope classification was the Random Forest algorithm. With this study, it has been shown that it is possible to examine the Life Satisfaction Survey questionnaires by using machine learning techniques on TURKSTAT Life Satisfaction Survey data. The success of classification algorithms has been improved by eliminating inter-class imbalance.

Benzer Tezler

  1. Saldırı Tespit Sistemlerinde Makine Öğrenimi Tekniklerinin Kullanımı ve Analizi

    Analysis and Use of Machine Learning Techniques in Intrusion Detection Systems

    BERKSU ERTUĞRUL

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTrakya Üniversitesi

    Hesaplamalı Bilimler Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ DERYA ARDA

  2. Güncel makine öğrenmesi teknikleri ile iris görüntülerinden cinsiyet analizi

    Gender analiysis on iris images using novel machine learning techniques

    TUĞBA AÇIL

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİskenderun Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. YAKUP KUTLU

  3. Comparison of machine learning algorithms for financial evaluations

    Finansal değerlendirmeler için makine öğrenmesi algoritmalarının karşılaştırılması

    WUDAY COLLEY

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGebze Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    ASSOC. DR. MEHMET GÖKTÜRK

  4. Makine öğrenmesi yöntemleriyle enflasyona etki eden faktörlerin incelenmesi: Türkiye örneği

    Using machine learning methods to examine factors affecting inflation: The example of Türkiye

    HASAN ŞEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Endüstri ve Endüstri MühendisliğiBursa Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ÖMER FARUK EFE

  5. Hızlı moda sektöründe makine öğrenmesi yöntemleri ile satış miktarlarının tahmin edilmesi

    Forecasting of sales quantities by machine learning methods in fast fashion sector

    SİNEM ÖZTÜRK

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SEDA UĞURLU