Veri madenciliği yaklaşımı kullanılarak internet erişimli televizyon kullanıcı verilerinin analizi
Analysis of internet access television user data by using data mining approach
- Tez No: 781231
- Danışmanlar: DOÇ. DR. HULUSİ GÜLSEÇEN
- Tez Türü: Doktora
- Konular: Mühendislik Bilimleri, Engineering Sciences
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: İstanbul Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Enformatik Ana Bilim Dalı
- Bilim Dalı: Enformatik Bilim Dalı
- Sayfa Sayısı: 138
Özet
Teknolojik gelişmelere ve ihtiyaçlara bağlı olarak veri miktarı ve çeşidi her geçen gün artmaktadır. Verilerin doğru şekilde toplanarak analiz edilmesi, veriler arasındaki ilişkilerin keşfedilmesi gereklilik haline gelmiştir. Bu ihtiyacı karşılamak için sınıflandırma, kümeleme ve birliktelik kuralı gibi farklı veri madenciliği yaklaşımları yaygın olarak kullanılmaktadır. Tez çalışmasının amacı kullanıcı verilerinin analizi sonucu kullanıcı dostu, dayanıklı, segmente edilmiş ürünlerin oluşturulmasına yönelik bilgilerin elde edilmesidir. Kümeleme ve birliktelik kuralı yöntemleri kullanılarak, kullanıcıların kullanım alışkanlıklarına göre gruplandırılması hedeflenmiştir. Kümeleme yöntemi vasıtasıyla müşteri segmentasyonu yapılması amaçlanmıştır. Birliktelik kuralı analizi sonucunda ürün tasarımına yönelik hangi kaynakların birlikte kullanıldığının belirlenmesi hedeflenmiştir. Kullanım süresine göre ürün dayanıklılık durumunun değerlendirmesi amaçlanmıştır. Bu tez çalışması kapsamında tüketici elektroniği sektöründe faaliyet gösteren bir firmanın internet bağlantılı televizyon kullanıcılarının kullanım süresi ve kaynak kullanım verileri ele alınmıştır. Veri madenciliği süreç adımları izlenerek analiz çalışmaları gerçekleştirilmiştir. Verilerin ön işlenmesi, dönüştürülmesi ve analizi adımları sırasında R dili kullanılmıştır. Kullanım alışkanlıklarına yönelik 17 adet nitelik değerlendirme kapsamına alınmıştır. Kullanım alışkanlıklarına yönelik modelleme aşamasında K-ortalamalar kümeleme yönteminden faydalanılmıştır. Kümeleme performansını ölçmek ve optimum küme sayısını belirlemek amacıyla iç indekslerden yararlanılmıştır. Kümeleme çalışması sonucunda kullanıcıların çoğunlukla harici oynatıcıları ve uydu yayınları başta olmak üzere sayısal kaynakları kullanmayı tercih ettikleri saptanmıştır. İlgili ürün segmentinde hangi kaynakların sıklıkla kullandığı tespit edilmiştir. Belirlenen minimum destek ve güven değeri kriterlerine göre birliktelik kuralı analizi yapılmıştır. Farklı sayıda grupları içeren birliktelik kuralları oluşturulmuştur. Birbirine özdeş olan kaynakların kullanım oranları değerlendirilmiştir. Kullanım süresine yönelik güvenilirlik analizi tekniğinden yararlanılmıştır. Yıllar içinde ışık akısındaki değişimler hesaplanmıştır. Arrhenius sıcaklık yaşam modeli parametrelerinden yararlanılarak hesaplanan 82,5 °C jonksiyon sıcaklığındaki ışık akısı değeri interpolasyon yöntemi ile belirlenmiştir. LED ışık akısının %70 seviyesine düşeceği zaman öngörülmüştür. Yaşam-stres analizinde sıcaklığın hızlandırıcı stres etkisi gözlemlenmiştir. Belirlenen yıllık ortalama izleme süresi verisinden yararlanılarak güvenilirlik ve arıza oranı değerleri hesaplanmıştır. Çalışma sırasında Birleşmiş Milletler Gelişim Programı tarafından yayınlanan İnsani gelişmişlik raporu verilerinden yararlanılmıştır. Ülkeler arasında insani gelişmişlik düzeyinin yıllar içindeki trendi değerlendirilmiştir. Bu amaçla Avrupa kıtasında yer alan 31 ülkenin 1995 ile 2021 yılları arasındaki insani gelişmişlik indeksi değerleri incelenmiştir. Avrupa kıtasında yer alan ülkeler arasında gelişmişlik düzeyi açısından farklılık durumu Anova yöntemi ile analiz edilmiştir. Hangi ülkeler arasında fark olduğunu belirleyebilmek için Games-Howell testi kullanılarak post-hoc analizi yapılmıştır. Televizyon izleme süreleri ile insani gelişmişlik düzeyi arasındaki ilişki korelasyon yöntemi ile incelenmiştir. Korelasyon analizi sonucunda insani gelişmişlik düzeyi ile televizyon izleme oranları arasında zayıf negatif bir ilişki olduğu görülmüştür.
Özet (Çeviri)
The volume and variety of data increases day by day depending on technological developments and needs. It has become a necessity to collect and analyze the data accurately and discover the relationships between the data. Several data mining approaches such as classification, clustering and association rule are widely used to satisfy this needs. The aim of thesis study is to obtain information for creation of user-friendly, robust and segmented products as a result of the analysis of user data. By using clustering method and association rules, it is targetted to group users according to their usage habits. It is aimed to make customer segmentation through the clustering method. As a result of association rule analysis, it is aimed to determine which ports are used together for product design. It is also intended to evalute the reliability of examined product according to usage time. Within the scope of this thesis, the usage time and port usage data of internet-connected television users of a consumer electronic company were investigated. Analyzes were carried out by following the data mining process steps. The R language was used during the preprocessing, conversion, analysis steps of the data mining. 17 attributes related to usage habits were evaluated. K-means clustering method was used in the modeling phase for usage habits. Internal indexes were used to measure the clustering performance and determine the optimum number of clusters. As a result of the clustering study, it has been determined that users mostly prefer to use digital ports, especially external ports and satellite broadcasts. It has been determined which ports are frequently used in the relevant product segment. Association rule analysis was performed according to minimum support and confidence criteria determined. Association rules containing different numbers of groups were created. Utilization rates of ports that are identical to each other were evaluated. The reliability analysis technique was used for the life time evaluation of product. Changes in luminous flux over the years have been calculated. The luminous flux value at the 82,5 °C junction temperature which was calculated with the Arrhenius temperature life model parameters , was determined by means of the interpolation method. It has been predicted when LED flux will decrease to %70 level. By using the determined annual average watching time data, reliability and failure rate values were calculated. In this study, the Human Development Report data published by the United Nations Development Program was used. For the years between 1995 and 2021 , trends of human development level among 31 countries in the European continent were evaluated. The difference between the countries in the European continent in terms of the level of development was analyzed by the Anova method. Post-hoc analysis was conducted by using Games Howell test to determine which countries differ. Using the data of the human development report, the relationship between the television watching time and the level of human development was examined by correlation method. As a result of the correlation analysis, it was seen that there is a weak negative relationship between the level of human development and television viewing rates.
Benzer Tezler
- Metin madenciliği ve makine öğrenmesi ile internet sayfalarının sınıflandırılması
Web page classification using text mining and machine learning
İLKER ŞAHİN
Yüksek Lisans
Türkçe
2019
Endüstri ve Endüstri MühendisliğiHacettepe ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. OUMOUT CHOUSEIN OGLOU
- Türkçe için sahte haber tespit modelinin oluşturulması
A fake news detection model for Turkish language
UĞUR MERTOĞLU
Doktora
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BURKAY GENÇ
PROF. DR. HAYRİ SEVER
- Analysis of impact on ethical values of internet use: A data mining model approach
İnternet kullanımının etik değerler üzerindeki etkisinin analizi: Veri madenciliği modeli yaklaşımı
MERVE ARITÜRK
Yüksek Lisans
İngilizce
2015
Bilim ve TeknolojiBahçeşehir ÜniversitesiBilgi Teknolojileri Ana Bilim Dalı
YRD. DOÇ. DR. DİLEK KARAHOCA
- Pre-release forecasting of imdb movie ratings using multi-view data
Gösterime girmemiş filmlerin ımdb puanının farklı özellik kümeleri kullanılarak tahmin edilmesi
BEYZA ÇİZMECİ
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ŞULE ÖĞÜDÜCÜ