Geri Dön

İç göç verilerini kullanarak kümeleme analizinde elde edilen kümelerin geçerliliğinin sınanması

Testing the validity of clusters used in cluster analysis using internal migration

  1. Tez No: 566810
  2. Yazar: HASAN GÜRCAN ÖZGEN
  3. Danışmanlar: PROF. DR. SEMRA ERBAŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 109

Özet

Kümeleme analizinde, anlamlı ve geçerli sonuçlara ulaşabilmek birçok araştırmacının hem hedefi hem de karşılaştığı en önemli sorunlardan biridir. Bu bakımdan elde edilen kümeleme çözümlerinin kalitesini test etmek amacıyla geliştirilen bazı yöntemler bulunmaktadır. Bu yöntemlerden biri de, çalışmada incelenen çok değişkenli bir istatistik analiz tekniği olan diskriminant analizinin kümeleme sonuçlarına uygulanmasıdır. Bu çalışmada, SPSS Paket Programı ve Minitab Paket Programı kullanılarak Türkiye İstatistik Kurumu 2017 yılı 15 yaş ve üzeri iç göç verileri üzerinde hiyerarşik kümeleme analizi tekniklerinden tek bağlantı kümeleme tekniği, tam bağlantı kümeleme tekniği, merkezi bağlantı kümeleme tekniği, medyan bağlantı kümeleme tekniği ve Ward tekniklerinden her birine karesi alınmış Öklid, Pearson, City-Block(Manhattan) ve Minkowski uzaklıkları uygulanarak elde edilen kümeler karşılaştırılmış ve ortaya çıkan bu kümelerin her biri için varyans-kovaryans matrislerinin eşitliğine göre doğrusal veya karesel diskriminat analizi uygulanarak meydana gelen kümelerin geçerliliği sorgulanmıştır. Bu çerçevede söz konusu uygulama özelinde, hangi uzaklık ölçüsünün hangi kümeleme tekniğinde nasıl kümeler oluşturduğu incelenmiş ve doğrusal veya karesel diskriminant analizi gerçekleştirilerek hangi oranda doğru sınıflandırma ortaya koyduğu belirlenmeye çalışılmıştır. Gerçekleştirilen analiz sonuçlarına göre, tek bağlantı kümeleme tekniğinde tüm uzaklıkların aynı oranda doğru sınıflandırma yaptığı, tam bağlantı kümeleme tekniği ve medyan bağlantı kümeleme tekniğinde Pearson uzaklığına göre elde edilen kümelerin sırasıyla % 97,5 ve % 98,8 oranında en fazla doğru sınıflandırma oranına sahip olduğu, merkezi bağlantı kümeleme tekniğinde karesi alınmış Öklid uzaklığının % 98,8 ile en fazla oranda doğru sınıflandırma gösterdiği ve Ward tekniğinde ise Pearson ve Manhattan uzaklıklarının % 96,3 ile en fazla doğru sınıflandırma oranına sahip oldukları belirlenmiştir. Bununla birlikte, Türkiye'de 81 il bazında illere göç edenlerin eğitim durumu konusunda durum tespiti yapılmış olup elde edilen bu sınıflandırmaların ilgili politika, uygulama ve diğer akademik çalışmalara yol gösterici nitelikte olacağı düşünülmektedir.

Özet (Çeviri)

In cluster analysis, finding significant and valid results is both the goal and one of the most important problems of many researchers. In respect to this, there are some methods developed to test the quality of resulting cluster analyses. One of these methods examined in our study is to apply a discriminant analysis, which is a multivariate statistical analysis technique, to the clustering results. In this study, SPSS Software Package and Minitab Software Package were used to apply Euclidean Squared, Pearson's, City-Block (Manhattan) and Minkowski distances on each of these particular hierarchical cluster analysis methods, consisting of single linkage clustering method, complete linkage clustering method, centroid linkage clustering method, median linkage clustering method and Ward's method, using the Turkish Statistical Institute data on internal migration of people aged 15 and older, to compare the resulting clusters, and to question the validity of the resulting clusters by applying linear or quadratic discriminant analysis depending on the equality of the variance-covariance matrices. Within the scope of the aforementioned operation, it was examined which distance measurement created what kind of cluster in which clustering method, and it was attempted to be determined that at what rate the accurate classifications were done. According to the results of the analysis, in the single linkage clustering method all distances had the same rate of accurate classification, in the complete linkage clustering method and the median linkage clustering method the clusters which are obtained according to the Pearson's distance had the most accurate classification rate of 97.5% and 98.8% respectively, in the centroid linkage clustering method the Euclidean Squared distance had the most accurate classification rate with 98.8%, and in Ward's method Pearson's and Manhattan distances had the most accurate classification rate with 96.3%. In addition to this, educational statuses of immigrants throughout 81 provinces of Turkey were determined on the basis of provinces, and it is believed that the resulting classifications will provide guidance to politics, practical applications, and other academic studies.

Benzer Tezler

  1. Suriyeli göçmenlerin Sosyal Uyum Ölçeği ile değerlendirilmesi: Nizip örneği

    Assessment of the syrian immigrants with Social Adaptation Scale: Sample of Nizip

    MERVE KAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Kamu YönetimiÇanakkale Onsekiz Mart Üniversitesi

    Doğal Afetlerin Risk Yönetimi Ana Bilim Dalı

    DOÇ. DR. İSMAİL SEKİ

  2. Aiding agricultural practices with the exploration of earth observation data via machine learning

    Yer gözlem uydu verilerinin tarımsal uygulamalara yardımcı olmak amacıya makine öğrenme algoritmaları ile incelenmesi

    MEHMET FURKAN ÇELİK

    Doktora

    İngilizce

    İngilizce

    2023

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. ESRA ERTEN

  3. Assessment of urbanization history of Addis Ababa city, Ethiopia

    Addıs Ababa cıty, Ethıopıa'nın kentleşme tarihinin değerlendirilmesi

    ABDURAHMAN HUSSEN YIMER

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Şehircilik ve Bölge PlanlamaMersin Üniversitesi

    Şehir ve Bölge Planlama Ana Bilim Dalı

    DOÇ. DR. ALİ CENAP YOLOĞLU

  4. Crowd density map estimation system from aerial images

    Havadan alınan görüntülerden yoğunluk haritası tespit sistemi

    OSMAN TARIK ÇETİNKAYA

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HAZIM KEMAL EKENEL

  5. Migration, integration and perceptions: A case study of Afghan asylum seekers in Sivas

    Göç, entegrasyon ve algılar: Sivas'taki Afgan sığınmacılara yönelik bir durum çalışması

    MEDİNE DERYA CANPOLAT

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Uluslararası İlişkilerAnkara Sosyal Bilimler Üniversitesi

    Uluslararası İlişkiler Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ K. ONUR UNUTULMAZ