Geri Dön

Clustering of divers using data mining techniques

Dalgıçların veri madenciliği teknikleri kullanılarak sınıflandırılması

  1. Tez No: 521910
  2. Yazar: AHMET CÜNEYT YAVUZ
  3. Danışmanlar: DOÇ. DR. SALİH MURAT EGİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: İngilizce
  9. Üniversite: Galatasaray Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 50

Özet

Divers Alert Network (DAN), dalış güvenlik laboratuarı projesi kapsamında 1994 yılından beri topladığı dalış ile ilgili verilerle büyük bir veritabanı oluşturmuştur. Bu çalışmanın amacı, bu veritabanını veri madenciliği teknikleri kullanarak analiz etmektir. Dalıcıların sağlık ve demografik bilgilerine göre kümelenmesi ve dalıcı grupları arasındaki anlamlı farkların bulunması çalışmanın ana hedefleridir. Değişkenlerin zaman etkilerinden arındırılması için DAN Avrupa veritabanında kayıtlı toplam 3097 dalıcıdan sadece tek dalışı olanlar ve tek dalış etkinliğine katılmış olanlar seçilmiş ve sırasıyla 874 (tek dalışı olan) ve 1669 (tek etkinliğe katılmış) dalıcının verileri kullanılarak, İki Adımlı Analiz ve K-Ortalamaları yöntemleri ile kümeleme analizleri gerçekleştirilmiştir. Kümeleme analizi sonrası, kadın ve erkek dalıcıların ve elde edilen kümelerin arasındaki farklılıkları anlamak için istatistiksel analizler yapılmıştır. Bu analizler sonucu her dalıcılar 3 farklı gruba ayrılmış ve bu grupların ayırt edici özellikleri ortaya koyulmuştur. Tek dalışı olan ve tek etkinliğe katılmış dalıcı gruplarının özellikleri birbirleriyle benzerdir. İki Adımlı Analiz yöntemi kategorik değişkenler için uygun olduğu için, yaş ve dalış tecrübesi değişkenleri 3 kategoriye dağıtılmıştır. Sayısal veriler için etkin olan K-Ortalamaları yöntemi için ise bu değişkenlerin sayısal değerleri kullanılmıştır. En ayırt edici kümeler iki adımlı kümeleme yöntemi ile oluşturulmuştur. Orta yaşlı ve sağlıklı dalıcılar birinci kümede toplanmıştır. Sağlık problemi olan ve yüksek sigara içme oranına sahip kadın ve erkek dalıcılar ikinci kümede, uzun süredir dalış yapan dalıcılar ise üçüncü kümede toplanmıştır. Dalış ile ilgili değişkenlerin arasındaki farklılıkların araştırılması ise İki Adımlı Analiz sonuçlarına ve dalıcıların cinsiyetlerine göre yapılmıştır.

Özet (Çeviri)

Divers Alert Network (DAN) created a database (DB) with a big amount of dive related data which has been collected since 1994 within the scope of Dive Safety Laboratory project. The aim of this study is to analyse DB using data mining techniques. The clustering of divers by their health and demographic information and revealing significant differences between diver groups are the main objectives of this study. To eliminate time effect of age, divers who participated to only one dive and one dive event were included in the study. The number of one-dive and one-event divers are 874 and 1669 respectively. Before applying clustering methods, data cleaning was performed to eliminate the potential mistakes resulting from inconsistencies, inaccuracies and missing information. TwoStep and K-means clustering methods were performed on DB to find the naturally associated clusters. Conventional statistical analysis was performed to understand differences in clusters and between male and female divers. As the result, divers were separated into 3 groups and distinguishing variables of these clusters were revealed. One dive and one event results were similar for all clusters. In order to analyse the dive-related variables with nonrecurring data, we focused on one-dive divers. The reason of this is to avoid inconsistencies in the data which changes in time. As TwoStep is suitable for categorical variables, age and dive activity years were distributed in 3 categories. For K-Means Clustering, original numerical values of these variables was used for clustering. The most distinct clusters were formed by TwoStep Clustering. The middle aged male divers without any health problem are in Cluster 1. Male and female divers with health problems and high rate of cigarette smoking are in the Cluster 2 and old divers with many dive activity years are in the Cluster 3. The search for significant differences in dive-related variables was performed based on the TwoStep Clustering results and separating male and female divers.

Benzer Tezler

  1. Cluster analysis of decompression illness

    Dekompresyon hastalığının cluster analizi

    BARIŞ AKSOY

    Yüksek Lisans

    İngilizce

    İngilizce

    2009

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGalatasaray Üniversitesi

    Bilgisayar Mühendisliği Bölümü

    DR. VİNCENT LABATUT

    YRD. DOÇ. DR. S. MURAT EGİ

  2. Clustering and classification methods using unsupervised, semi-supervised and supervised algorithms

    Eğitimsiz, yarı-eğitimli ve eğitimli algoritmalar kullanılarak kümeleme ve sınıflandırma yöntemleri

    BALA MIKAT TYODEN

    Doktora

    İngilizce

    İngilizce

    2016

    İstatistikÇukurova Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. HAMZA EROL

  3. Aggregating advantages of a set of clusterings into a final clustering using object-wise similarity graph

    Bir kümelenmeler kümesinin avantajlarını nesneler arası benzerlik çizgesi kullanarak bir sonuç kümelenmesinde birleştirmek

    ERTUNÇ ERDİL

    Yüksek Lisans

    İngilizce

    İngilizce

    2011

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. SELİM NECDET MİMAROĞLU

  4. Eksik değerleri en olası değer ile doldurmanın sınıflandırma algoritmaları üzerinden karşılaştırılması

    Comparison of filling missing values with the best fit over classification algorithms

    ÇAĞDAŞ KEKLİK

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBeykent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. CENGİZ ÖRENCİK

  5. Ensemble pruning using optimization modeling

    Optimizasyon modellemesi kullanarak topluluk budaması

    PINAR KARADAYI ATAŞ

    Doktora

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Mühendislik Bilimleri Ana Bilim Dalı

    DOÇ. DR. SÜREYYA AKYÜZ