Veri madenciliği ile hanehalkı yağ tüketiminin modellenmesi
Modeling household oil consumption by using data mining
- Tez No: 440584
- Danışmanlar: DOÇ. DR. SEZGİN IRMAK
- Tez Türü: Doktora
- Konular: Ekonometri, Econometrics
- Anahtar Kelimeler: Hanehalkı Bütçe Anketi, Hanehalkı Yağ Tüketimi, Veri Madenciliği, Karar Ağaçları, Household Budget Survey, Household Oil Consumption, Data Mining, Decision Trees
- Yıl: 2016
- Dil: Türkçe
- Üniversite: Akdeniz Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: Ekonometri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 276
Özet
Hanehalkına ait hane, fert ve tüketim karakteristiklerini içeren“Hanehalkı Bütçe Anketi”veri seti ile yapılmış birçok çalışma mevcuttur. Bu çalışmanın amacı TÜİK tarafından derlenen Hanehalkı Bütçe Anketi verileri kullanılarak, hanehalkının tüketmiş olduğu zeytinyağı, tereyağı, margarin ve diğer bitkisel yağlar ile diğer yenilebilir sıvı yağ tüketimini etkileyen hanehalkı karakteristiklerine ilişkin faktörlerin ve hanehalklarının tüketim durumlarının Karar Ağacı yöntemi ile belirlenmesidir. Çalışmanın birinci bölümünde veri madenciliği kavramı ve bilgi keşfi sürecinde kullanılan metodolojiler özetlenmiştir, ikinci bölümünde veri madenciliği modelleme çeşitleri ile ilgili bilgiler verilmiştir. Üçüncü bölümde genel olarak katı ve sıvı yağlar ile ilgili bilgilere yer verilmiştir. Ayrıca bu bölümde hanehalkı genel tüketimi, gıda tüketimi ve yağ tüketimi harcamalarını etkileyen faktörler incelenmiş ve bu alanda daha önce yapılmış çalışmalar detaylı bir şekilde incelenmiştir. Çalışmanın uygulama kısmında ilk önce 2009-2012 yılları arasında TÜİK tarafından derlenen hanehalkı bütçe anketi verilerinin veri birleştirme, ön işleme aşamaları ile gelir ve harcama verilerinin enflasyondan arındırma işlemlerine yer verilmiştir. Buradan elde edilen veri setleri ile veri madenciliği yöntemlerinden kümeleme analizi ve karar ağacı yöntemleri kullanılarak Türkiye hanehalkının belirlenen yağ tüketimi kategorisinde tüketim profili çıkarılmıştır. Yapılan çalışma sonucunda hanehalkının tüketmiş olduğu dört farklı yağ türünün tüketimini etkileyen faktörler karar ağacı yöntemi ile belirlenmiştir. Yağ türlerinin tüketimini etkileyen faktörler genel olarak birbirine benzemekle beraber, hangi yağ türünü hangi karakteristiğin hangi şekilde etkilediği farklılıklar göstermektedir. Meydana gelen karar ağacında bu detaylar görülmektedir. Zeytinyağı ve tereyağı gibi sağlıklı, besin değeri yüksek ve pahalı olan yağ türlerini etkileyen en önemli karakteristiğin gelir olduğu görülürken, margarin ve diğer bitkisel yağlar ile diğer yenilebilir sıvı yağ gibi daha ucuz yağ türlerinin tüketimini etkileyen en önemli karakteristiğin hanehalkı büyüklüğü olduğu görülmüştür. Her bir yağ türünde meydana gelen karar ağacının alt düğümlerine ve detaylarına inildiğinde tüketimi etkileyen faktörlerin değiştiği görülmüş ve bunların detayları çalışmada incelenmiştir.
Özet (Çeviri)
There are a lot of researchs made with HSB data set which contains characteristics of household and personal consumption of households. The aim of this research is to identify the factors on household characteristics which affect the consumption of olive oil, butter, margarine, other vegetable oils and consumable oils consumed by households and consumption situations of households with decision tree method by using HSB datas compiled by TÜİK. In the first part of the research, data mining concept and methodologies used in knowledge discovery are summarized. In the second part, informations about data mining modelling type; in the third part, generally the informations about fats and oils are given. And also, in this part, the factors affect the general household consumption, food consumption and the oil consumption expenditures are examined, and the studies in this field are scrutinized. In the execution part of the research, databinding and preprocessing phases of HBS datas compiled by TÜİK between the years 2009-2012 and net of income and expenditure datas of inflation were included first. With the data sets obtained, by using the clustering analysis and decision tree method which are data mining methods, the consumption profile in determined oil consumption cathegory of Turkey household is profiled. In consequence of the research, factors affect the consumption of four different kinds of oil consumed by the household are determined via decision-tree method. Despite the factors affect the consumption of fat kinds usually look alike, it shows differences on which fat kind is affected by which characteristic in which way. In the decision tree, those details are seen. While the most important characteristic on consumption of healthy, nutritious and expensive oils like olive oil and butter is the income, it's the size of the household on cheaper oils like margarines, other vegetable and consumable oils. When looking down the nodes and the details of a decision tree took place on each kinds of oil, it is seen that the factors which affect the consumption and the characteristics are changed, the details of these factors are examined in the research.
Benzer Tezler
- Veri madenciliğinde kümeleme algoritmaları ve kümeleme analizi
Clustering algorithms in data mining and clustering analysis
YASEMİN KOLDERE AKIN
- Hanehalkı bilişim teknolojileri kullanımının veri madenciliği teknikleri ile analizi
Analysis of the use of household information technologies with data mining techniques
MAHMUT COŞKUN
Yüksek Lisans
Türkçe
2019
Bilim ve TeknolojiGazi ÜniversitesiYönetim Bilişim Sistemleri Ana Bilim Dalı
PROF. DR. HALİL İBRAHİM BÜLBÜL
- Veri madenciliği yöntemleri ile ana harcama gruplarının paylarının tahmini
Estimation of main expenditure groups' portion with data mining methods
LEVENT AHİ
Yüksek Lisans
Türkçe
2015
İstatistikHacettepe Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. MURTAZA ÖZGÜR YENİAY
- IPTV kullanıcılarının izleme profillerine göre illerin kümelenmesi
Clustering provinces by IPTV users' viewing profiles
AHMET SARİ
Doktora
Türkçe
2020
Bilim ve TeknolojiAtatürk ÜniversitesiSayısal Yöntemler Ana Bilim Dalı
PROF. DR. ÜSTÜN ÖZEN
- Hanehalkı işgücü araştırma verileri ile veri madenciliği yöntemlerinin uygulanması ve modellerin karşılaştırılması
Implementation of data mining methods on household labor research data and comparison of models
MERVE BARAN KILIÇALAN
Yüksek Lisans
Türkçe
2018
İstatistikHacettepe Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. DR. ÇAĞDAŞ HAKAN ALADAĞ