Hanehalkı işgücü araştırma verileri ile veri madenciliği yöntemlerinin uygulanması ve modellerin karşılaştırılması
Implementation of data mining methods on household labor research data and comparison of models
- Tez No: 521316
- Danışmanlar: DOÇ. DR. ÇAĞDAŞ HAKAN ALADAĞ
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 97
Özet
Günümüz koşullarında büyüyen ve genişleyen veri hacmiyle birlikte verilerin değerlendirilmesi, analiz edilmesi ve ileriye yönelik tahminlerin yapılması gibi ihtiyaçların artması veri madenciliği yöntemlerine olan yönelimi artırmıştır. Bu çalışma kapsamında veri madenciliğinin tahmin edici yöntemlerinden sınıflama ve regresyon yöntemleri ele alınmış olup C5.0 karar ağacı, CHAID karar ağacı, Lojistik Regresyon ile Bayes Ağları yöntemleri incelenmiş ve gerçek bir veri seti üzerinde uygulanarak modelleme başarıları karşılaştırılmıştır. Çalışmada TÜİK tarafından derlenen ve uygulanan Hanehalkı İşgücü Araştırması (HİA)' nın 2014, 2015 ve 2016 yıllarına ait verileri ele alınmıştır. Ayrıca bu çalışma kapsamında Türkiye'de işgücü durumunun belirlenmesi, hem istihdam kapsamında hem de istihdam dışında olan birey profiline ilişkin sınıflamaların yapılması ile işgücü durumu bilinmeyen bir bireyin model sonucunda işgücü durumunun doğru tahmin edilmesi amaçlanmıştır. Çalışma sonuçları değerlendirildiğinde, çeşitli ölçütlerle yapılan kıyaslamalarda model başarıları birbirine oldukça yakın olarak edilmiş olmasına karşın C5.0 karar ağacı yöntemi sonucunda elde edilen modelin en başarılı sınıflama tahminine sahip olduğu sonucuna ulaşılmıştır.
Özet (Çeviri)
In today' s conditions, increasing the need for such as assessing, analyzing and making forward estimates of data, has increased the demand for data mining methods. In this study, classification and regression estimating methods of data mining are discussed, C5.0 decision tree, CHAID decision tree, Logistic Regression and Bayesian Networks methods are examined and the modeling successes were compared by applying them on a real data set. Additionally, data on the Household Labor Force Survey compiled and implemented by Turkish Statistical Institute for 2014, 2015 and 2016 years. Also, within the scope of this study to determine the labor situation in Turkey, both the employed labor force status by making regarding the classification of individuals outside employment profile is intended to be an accurate estimate of the labor situation as a result of unknown individual models. When the study results were evaluated, it was calculated that the model obtained as a result of the C5.0 decision tree method had the most successful classification prediction even though the model successes were relatively close to each other in comparison with various criteria.
Benzer Tezler
- Türkiye İş Kurumu verileri bağlamında eğitimsel niteliklerin istihdam edilebilirlik üzerine etkisi: Ankara ili örneği
Impact of educational qualities upon employability within the context of data from Turkish Employment Agency: Example of Ankara province
MERVE ÇELİK
Yüksek Lisans
Türkçe
2018
Çalışma Ekonomisi ve Endüstri İlişkileriMuğla Sıtkı Koçman ÜniversitesiÇalışma Ekonomisi ve Endüstri İlişkileri Ana Bilim Dalı
DOÇ. DR. SANİYE DEDEOĞLU
- Essays on estimation methods
Tahmin yöntemleri üzerine makaleler
YASİN KÜTÜK
Doktora
İngilizce
2019
Ekonometriİstanbul Teknik Üniversitesiİktisat Ana Bilim Dalı
PROF. DR. BÜLENT GÜLOĞLU
- Türkiye'de gelir dağılımı açısından ücret ve maaş gelirlerinin mukayeseli analizi
Başlık çevirisi yok
ABDULLAH KAHRAMAN
Yüksek Lisans
Türkçe
1995
Çalışma Ekonomisi ve Endüstri İlişkileriGazi ÜniversitesiPROF.DR. KAMİL TURAN
- İş bulma yöntemi tercihini etkileyen faktörler: TÜİK verileri üzerine ampirik bir araştırma
Determinants of the choice of job search method: An empirical study on TURKSTAT data
ZEYNEP BAŞAK KARAKUŞ
Yüksek Lisans
Türkçe
2024
Çalışma Ekonomisi ve Endüstri İlişkileriİstanbul ÜniversitesiÇalışma Ekonomisi ve Endüstri İlişkileri Ana Bilim Dalı
PROF. DR. TEKİN AKGEYİK
- Comparison and analysis of logistic regression, neural networks and naïve bayes machine learning algorithms for predicting child labor in Turkey
Lojistik regresyon, sinir ağları ve naïve bayes makine öğrenimi algoritmalarının karşılaştırılması ve analizi: Türkiye'de çocuk işçiliğinin öngörülmesi örneği
MEHMET ROHAT BİNGÖL
Yüksek Lisans
İngilizce
2023
İstatistikMarmara ÜniversitesiEkonometri Ana Bilim Dalı
PROF. DR. AHMET METE ÇİLİNGİRTÜRK