Makine öğrenmesi teknikleri ile güncel tüik yaşam memnuniyeti anketlerinin incelenmesi
Analyizing tsi life satisfaction research data with machine learning techniquies
- Tez No: 565049
- Danışmanlar: PROF. DR. İLHAN TARIMER
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: Türkçe
- Üniversite: Muğla Sıtkı Koçman Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilişim Sistemleri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 118
Özet
Veri toplama yöntemiyle mutluluk düzeyi ölçümü, dünyada 1945 sonrası başlamıştır. Türkiye'de mutluluk konusunu ele alan ilk araştırma, Türkiye İstatistik Kurumu (TÜİK) tarafından 2003 yılında gerçekleştirilmiştir. Bu araştırma her yıl tekrar edilmektedir. Mutluluk kavramı, binlerce yıldır düşünürler tarafından merak edilmiş ve sorgulanmıştır. Mutluluğun tanımlanmasında maddi veya manevi, bireysel değerler veya toplumsal değerler gibi farklı boyutlarda ele alınması ile çeşitli fikirler ortaya konulmuştur. Bu tez çalışmasında TÜİK Yaşam Memnuniyeti Araştırması verileri makine öğrenmesi teknikleri ile incelenmiştir. İki aşamada gerçekleşen deneylerden ilkinde cinsiyet sınıflandırması için genel memnuniyet ifade eden özniteliklerden en değerli olanlar bulunmuştur. İkinci aşamada ise mutluluk ve umut sınıflandırması gerçekleştirilmiş ve yeniden örnekleme ile sınıflandırma başarı yüzdeleri artırılmıştır. İlk aşamada memnuniyet değişkenleriyle cinsiyet sınıflandırmasının yapılabildiği gösterilmiştir. Sınıflandırmada elde edilen en yüksek başarı oranı Chi2 (ki-kare) öznitelik seçim algoritmasının seçmiş olduğu üç öznitelikle Rastgele Orman algoritmasının kullanılmasıyla %73 olarak elde edilmiştir. İkinci deney mutluluk ve umut öznitelikleri için sınıflandırma yapılmıştır. Mutluluk sınıflandırması Rastgele Orman, K-Star ve DVM (Destek Vektör Makineleri) algoritmaları ile yapılmıştır. Algoritmaların sınıflandırma başarı yüzdelerini artırmak için yeniden örnekleme yöntemi kullanılarak başarılı sonuçlar alınmıştır. Mutluluk sınıflandırması için yeniden örnekleme öncesi Rastgele Orman, K-Star ve DVM algoritmaları için sınıflandırma başarıları sırasıyla %53.99, %51.67 ve %53.40 olmuştur. Toplam örnek sayısı değiştirilmeden yapılan yeniden örnekleme işleminde hem aşırı örnekleme hem de alt örnekleme yapılmış ve sonuçlar sırasıyla %83,80, %81.85 ve %68.14 olarak elde edilmiştir. Tüm sınıfların örnek sayılarının en çokv örneğe sahip sınıfa eşitlenmesi ile yapılan yeniden örnekleme uygulamasında sınıflandırma başarı yüzdeleri sırasıyla %92.82, %91.46 ve % 75.79 olmuştur. Burada Rastgele Orman algoritması en başarılı sonucu üretmiştir. Umut sınıflandırması için yeniden örnekleme öncesi Rastgele Orman, K-Star ve DVM algoritmaları için sınıflandırma başarıları sırasıyla %72.01, %68.87 ve %56.80 olmuştur. Toplam örnek sayısı değiştirilmeden yapılan yeniden örnekleme işleminde hem aşırı örnekleme hem de alt örnekleme ile yapılmış ve sonuçlar sırasıyla %89.06, %87.21 ve %55.98 olmuştur. Tüm sınıfların örnek sayılarının en çok örneğe sahip sınıfa eşitlenmesi ile yapılan yeniden örnekleme uygulamasında sınıflandırma başarı yüzdeleri sırasıyla %97.02, %94.70 ve % 57.39 olarak elde edilmiştir. Rastgele Orman algoritması en başarılı sonucu üretmiştir. DVM algoritması ile yapılan sınıflandırma çalışmasında, yeniden örnekleme sonrası genel sınıflandırma başarısı düşmüştür. Ancak yeniden örnekleme öncesi sınıf örneklerinden hiç doğru tahmin yapılamayan sınıflarda doğru tahminler üretilmeye başlanmıştır. Bu durumda DVM az örnekli sınıflarda başarı oranı artmıştır. Umut sınıflandırmasında en başarılı algoritmanın Rastgele Orman algoritması olarak elde edilmiştir. Bu çalışma ile TÜİK Yaşam Memnuniyeti Araştırması verileri üzerinde makine öğrenmesi teknikleri kullanılarak Yaşam Memnuniyeti Araştırması anketlerinin incelenmesinin mümkün olduğu gösterilmiştir. Sınıflar arası dengesizliğin giderilmesi ile sınıflandırma algoritmalarının başarısı yükseltilmiştir.
Özet (Çeviri)
Measurement of happiness with data collection method started in the world after 1945. In Turkey, the first research addressing the topic of happiness was held by Turkey Statistical Institute (TSI) in 2003. The research is being held every year. The concept of happiness has been questioned by thinkers for thousands of years. Various ideas have been put forward in the definition of happiness by considering it in different dimensions such as material or spiritual, individual values or social values. In this thesis, the data obtained with TSI Life Satisfaction Survey were examined with machine learning techniques. Among the experiments that took place in two stages, the most valuable attributes were found in the first of the attributes that express general satisfaction for gender classification. In the second stage, the happiness and hope classification was evaluated and the success rate of classification was increased by resampling. It is shown that gender classification can be done with satisfaction variables at first stage. The highest success rate achieved in classification was 73% by Random Forest algorithm with three attributes selected by the Chi2 (chi-square) feature selection algorithm. In the second experiment, happiness and hope classification was done by Random Forest, K-Star and SVM algorithms. Resampling method is used to increase the success rate of classification of the algorithms and successful results are obtained. The classification successes with Random Forest, K-Star and DVM algorithms before re-sampling for happiness classification were 53.99%, 51.67% and 53.40%, respectively. In the re-sampling process without changing the total number of samples, both over-sampling and sub-sampling were performed and the results were 83.80%, 81.85% and 68.14%, respectively. In the re-sampling stage where the sample numbers of all classes were equalized to the sample with the class having most samples, the percentage success rates were 92.82%, 91.46% and 75.79%, respectively. Random Forest algorithm has produced the most successful result. The classification successes with Random Forest, K-Star and DVM algorithms before re-sampling for hope classification were 72.01%, 68.87% and 56.80%, respectively.vii In the resampling without changing the total number of samples, both over-sampling and sub-sampling were performed, and the results were 89.06%, 87.21% and 55.98%, respectively. The classification success rates were 97.02%, 94.70% and 57.39% in the re-sampling stage with the sample numbers of all classes being equalized to the class with the most samples. Forest algorithm has produced the most successful result. In the classification study performed with the DVM algorithm, the success of the general classification after re-sampling decreased. However, in the classes that were not correctly predicted from the pre-sampling class samples, accurate estimates were started to be produced. In this case, the success rate of the DVM low sample classes increased. The most successful algorithm in the Hope classification was the Random Forest algorithm. With this study, it has been shown that it is possible to examine the Life Satisfaction Survey questionnaires by using machine learning techniques on TURKSTAT Life Satisfaction Survey data. The success of classification algorithms has been improved by eliminating inter-class imbalance.
Benzer Tezler
- Saldırı Tespit Sistemlerinde Makine Öğrenimi Tekniklerinin Kullanımı ve Analizi
Analysis and Use of Machine Learning Techniques in Intrusion Detection Systems
BERKSU ERTUĞRUL
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTrakya ÜniversitesiHesaplamalı Bilimler Ana Bilim Dalı
DR. ÖĞR. ÜYESİ DERYA ARDA
- Güncel makine öğrenmesi teknikleri ile iris görüntülerinden cinsiyet analizi
Gender analiysis on iris images using novel machine learning techniques
TUĞBA AÇIL
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİskenderun Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. YAKUP KUTLU
- Comparison of machine learning algorithms for financial evaluations
Finansal değerlendirmeler için makine öğrenmesi algoritmalarının karşılaştırılması
WUDAY COLLEY
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGebze Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
ASSOC. DR. MEHMET GÖKTÜRK
- Makine öğrenmesi yöntemleriyle enflasyona etki eden faktörlerin incelenmesi: Türkiye örneği
Using machine learning methods to examine factors affecting inflation: The example of Türkiye
HASAN ŞEN
Yüksek Lisans
Türkçe
2023
Endüstri ve Endüstri MühendisliğiBursa Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÖMER FARUK EFE
- Hızlı moda sektöründe makine öğrenmesi yöntemleri ile satış miktarlarının tahmin edilmesi
Forecasting of sales quantities by machine learning methods in fast fashion sector
SİNEM ÖZTÜRK
Yüksek Lisans
Türkçe
2020
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. SEDA UĞURLU