Geri Dön

Data mining for regional and graph-structured data objects

Bölgesel ve çizge-yapılı veri nesneleri için veri madenciliği

  1. Tez No: 553761
  2. Yazar: DERYA DİNLER
  3. Danışmanlar: DR. ÖĞR. ÜYESİ MUSTAFA KEMAL TURAL, PROF. DR. NUR EVİN ÖZDEMİREL
  4. Tez Türü: Doktora
  5. Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 228

Özet

Bu çalışmada üç problem ele alınmıştır. İlk problem veri nesnelerinin kapalı konveks sınırlı politoplar ya da kapalı diskler olduğu durumlar için yarı gözetimli kümeleme problemidir. Kümeleme öncesi belirtilmiş bir takım nesne düzeyi kısıtlar olduğu düşünülmektedir. Verilen bir küme için küme merkezi bulma problemi ikinci dereceden konik programlama yardımıyla formüle edilmiştir. Ayrıca hızlı şekilde çözümler elde etmek için alt gradyan metodu yardımıyla da çözülmüştür. Sonrasında ise ele alınan kümeleme problemi için karmaşık tam sayılı ikinci dereceden konik proramlama formülasyonu ve altı tane sezgisel yöntem önerilmiştir. Son olarak, çözüm yöntemleri çözüm kalitesi ve çözüm zamanı açısından hem rassal olarak üretilen hem de gerçek hayat veri setleri kullanılarak karşılaştırılmıştır. İkinci problem verilen bir çizgede en merkezi düğüm grubunu bulma problemidir. Merkezi düğümleri bulmak için grup aradalık merkeziliği (GAM) kullanılmıştır. Problemi çözmek için önerilen yöntemde istenen tüm düğüm gruplarının GAM değerine alt ve üst sınırlar hesaplanır, üst sınırı bulunan en büyük alt sınırdan küçük olan gruplar elenir ve optimal düğüm grubu olabilecek adaylar kalır. Geliştirilen metodun performansını ölçmek için hem rassal olarak üretilmiş hem de gerçek hayattan ağlarla sayısal çalışmalar yapılmıştır. Son problem m-li ağaç veri nesnelerinin kümelenmesidir. Ağaçlardaki düğümler ağırlıksızken, kenarlar ağırlıksız ya da ağırlıklı olabilir. Ayrıca herhangi bir ağaç üzerinde verilen bir düğümün başka bir ağaç üzerinde hangi düğüme denk olduğunun bilindiği varsayılmaktadır. Problemin çözümü için k-means tabanlı yöntemler önerilmiştir. İki ağaç arasındaki mesafeyi ölçmek için literatürde kullanılan düğüm/kenar örtüşmesi (DKÖ) ve çizge düzeltme uzaklığı (ÇDU) ölçüleri kullanılmıştır. Verilen bir ağaç kümesini temsil edecek ağacı bulma problemi için matematiksel formülasyonlar ve bunlar için etkili çözüm yöntemleri önerilmiştir. Geliştirilen yöntemlerin performanslarını ölçmek için hem rassal olarak üretilen hem de gerçek hayattan veri setleri kullanılmıştır.

Özet (Çeviri)

Three research problems are addressed in this study. The first one is a semi-supervised clustering problem with instance-level constraints where each data object is either a closed convex bounded polytope or a closed disk. We first model the problem of computing the centroid of a given cluster as a second order cone programming problem. Also, a subgradient algorithm is adopted for its faster solution. We then propose a mixed-integer second order cone programming formulation and six heuristic approaches for the considered clustering problem. Finally, we compare solution approaches in terms of computational time and quality on randomly generated and real life datasets. The second problem deals with mining a single graph to find central group of nodes of the graph. For the identification of central nodes, we utilize the group betweenness centrality (GBC) measure. We propose a method that first computes upper and lower bounds on the GBC of several groups. The method then eliminates groups with upper bounds that are lower than the maximum lower bound obtained to find candidates for the optimal group. Finally, an approximating or the optimal group can be returned to the user. We conduct computational experiments with randomly generated and real life networks to test the performance of the proposed method. The last problem is the clustering of m-ary trees where nodes are unweighted, edges are unweighted or weighted, and node correspondence is known. To measure the distance between two trees, we utilize vertex/edge overlap (VEO) and graph edit distance (GED) measures from the literature. To find a representative (centroid) tree for a given set of trees, we propose exact and heuristic solution approaches. We test our algorithms on randomly generated and real life datasets.

Benzer Tezler

  1. Bir altın madeninde yeraltı üretim geometrilerinin ve tahkimat sisteminin jeoteknik esaslara göre belirlenmesi

    Determination of underground production geometries and support system in a gold mine according to geotechnical principles

    FATMA ZEHRA TOKER

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Maden Mühendisliği ve Madencilikİstanbul Teknik Üniversitesi

    Maden Mühendisliği Ana Bilim Dalı

    DOÇ. DR. CÜNEYT ATİLLA ÖZTÜRK

  2. Konvektif sınır tabakanın kuramsal ve deneysel incelenmesi

    Başlık çevirisi yok

    FERDİ TÜRKSOY

    Yüksek Lisans

    Türkçe

    Türkçe

    1993

    Meteorolojiİstanbul Teknik Üniversitesi

    PROF.DR. SÜREYYA ÖNEY

  3. Siirt – Madenköy açık işletme sahasında gerçekleşen kütle hareketleri ile bölgesel yağış ilişkisinin saptanması

    Determining the relationship between mass movements occurred in Siirt – Madenkoy open mining site and regional precipitation

    DENİZ DOLMA

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Jeoloji Mühendisliğiİstanbul Teknik Üniversitesi

    Jeoloji Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ENVER VURAL YAVUZ

  4. Enerji tüketim verileri kullanılarak tüketici davranışlarının analizi

    Analysis of consumer behavior using energy consumption data

    MERYEM BALTACI

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    EnerjiFırat Üniversitesi

    Ekobilişim Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÜMİT ÇELİK

  5. WRF bölgesel modeli, YTTS gözlemleri ve istatistiksel yöntemler kullanarak İstanbul yıldırım düzeninin incelenmesi

    Using by WRF regional model, YTTS observations and statistical methods examining of the İstanbul lightning characteristics

    KERİM ATİLLA KORKMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Meteorolojiİstanbul Teknik Üniversitesi

    Meteoroloji Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET DURAN ŞAHİN