Data mining for regional and graph-structured data objects
Bölgesel ve çizge-yapılı veri nesneleri için veri madenciliği
- Tez No: 553761
- Danışmanlar: DR. ÖĞR. ÜYESİ MUSTAFA KEMAL TURAL, PROF. DR. NUR EVİN ÖZDEMİREL
- Tez Türü: Doktora
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 228
Özet
Bu çalışmada üç problem ele alınmıştır. İlk problem veri nesnelerinin kapalı konveks sınırlı politoplar ya da kapalı diskler olduğu durumlar için yarı gözetimli kümeleme problemidir. Kümeleme öncesi belirtilmiş bir takım nesne düzeyi kısıtlar olduğu düşünülmektedir. Verilen bir küme için küme merkezi bulma problemi ikinci dereceden konik programlama yardımıyla formüle edilmiştir. Ayrıca hızlı şekilde çözümler elde etmek için alt gradyan metodu yardımıyla da çözülmüştür. Sonrasında ise ele alınan kümeleme problemi için karmaşık tam sayılı ikinci dereceden konik proramlama formülasyonu ve altı tane sezgisel yöntem önerilmiştir. Son olarak, çözüm yöntemleri çözüm kalitesi ve çözüm zamanı açısından hem rassal olarak üretilen hem de gerçek hayat veri setleri kullanılarak karşılaştırılmıştır. İkinci problem verilen bir çizgede en merkezi düğüm grubunu bulma problemidir. Merkezi düğümleri bulmak için grup aradalık merkeziliği (GAM) kullanılmıştır. Problemi çözmek için önerilen yöntemde istenen tüm düğüm gruplarının GAM değerine alt ve üst sınırlar hesaplanır, üst sınırı bulunan en büyük alt sınırdan küçük olan gruplar elenir ve optimal düğüm grubu olabilecek adaylar kalır. Geliştirilen metodun performansını ölçmek için hem rassal olarak üretilmiş hem de gerçek hayattan ağlarla sayısal çalışmalar yapılmıştır. Son problem m-li ağaç veri nesnelerinin kümelenmesidir. Ağaçlardaki düğümler ağırlıksızken, kenarlar ağırlıksız ya da ağırlıklı olabilir. Ayrıca herhangi bir ağaç üzerinde verilen bir düğümün başka bir ağaç üzerinde hangi düğüme denk olduğunun bilindiği varsayılmaktadır. Problemin çözümü için k-means tabanlı yöntemler önerilmiştir. İki ağaç arasındaki mesafeyi ölçmek için literatürde kullanılan düğüm/kenar örtüşmesi (DKÖ) ve çizge düzeltme uzaklığı (ÇDU) ölçüleri kullanılmıştır. Verilen bir ağaç kümesini temsil edecek ağacı bulma problemi için matematiksel formülasyonlar ve bunlar için etkili çözüm yöntemleri önerilmiştir. Geliştirilen yöntemlerin performanslarını ölçmek için hem rassal olarak üretilen hem de gerçek hayattan veri setleri kullanılmıştır.
Özet (Çeviri)
Three research problems are addressed in this study. The first one is a semi-supervised clustering problem with instance-level constraints where each data object is either a closed convex bounded polytope or a closed disk. We first model the problem of computing the centroid of a given cluster as a second order cone programming problem. Also, a subgradient algorithm is adopted for its faster solution. We then propose a mixed-integer second order cone programming formulation and six heuristic approaches for the considered clustering problem. Finally, we compare solution approaches in terms of computational time and quality on randomly generated and real life datasets. The second problem deals with mining a single graph to find central group of nodes of the graph. For the identification of central nodes, we utilize the group betweenness centrality (GBC) measure. We propose a method that first computes upper and lower bounds on the GBC of several groups. The method then eliminates groups with upper bounds that are lower than the maximum lower bound obtained to find candidates for the optimal group. Finally, an approximating or the optimal group can be returned to the user. We conduct computational experiments with randomly generated and real life networks to test the performance of the proposed method. The last problem is the clustering of m-ary trees where nodes are unweighted, edges are unweighted or weighted, and node correspondence is known. To measure the distance between two trees, we utilize vertex/edge overlap (VEO) and graph edit distance (GED) measures from the literature. To find a representative (centroid) tree for a given set of trees, we propose exact and heuristic solution approaches. We test our algorithms on randomly generated and real life datasets.
Benzer Tezler
- Bir altın madeninde yeraltı üretim geometrilerinin ve tahkimat sisteminin jeoteknik esaslara göre belirlenmesi
Determination of underground production geometries and support system in a gold mine according to geotechnical principles
FATMA ZEHRA TOKER
Yüksek Lisans
Türkçe
2024
Maden Mühendisliği ve Madencilikİstanbul Teknik ÜniversitesiMaden Mühendisliği Ana Bilim Dalı
DOÇ. DR. CÜNEYT ATİLLA ÖZTÜRK
- Siirt – Madenköy açık işletme sahasında gerçekleşen kütle hareketleri ile bölgesel yağış ilişkisinin saptanması
Determining the relationship between mass movements occurred in Siirt – Madenkoy open mining site and regional precipitation
DENİZ DOLMA
Yüksek Lisans
Türkçe
2023
Jeoloji Mühendisliğiİstanbul Teknik ÜniversitesiJeoloji Mühendisliği Ana Bilim Dalı
DOÇ. DR. ENVER VURAL YAVUZ
- Enerji tüketim verileri kullanılarak tüketici davranışlarının analizi
Analysis of consumer behavior using energy consumption data
MERYEM BALTACI
- WRF bölgesel modeli, YTTS gözlemleri ve istatistiksel yöntemler kullanarak İstanbul yıldırım düzeninin incelenmesi
Using by WRF regional model, YTTS observations and statistical methods examining of the İstanbul lightning characteristics
KERİM ATİLLA KORKMAZ
Yüksek Lisans
Türkçe
2022
Meteorolojiİstanbul Teknik ÜniversitesiMeteoroloji Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET DURAN ŞAHİN