Dimension reduction for tree-structured data
Ağaç yapılı veriler için boyut indirgeme
- Tez No: 694505
- Danışmanlar: DOÇ. DR. MUSTAFA KEMAL TURAL, PROF. DR. CEM İYİGÜN
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 117
Özet
Ağaç yapılı verilerin istatistiksel analizi, genişleyen uygulama alanlarıyla ilgi çekici araştırma alanlarından biridir. Klasik veri analizinde, veri nesneleri Öklid uzayındaki noktalarken, ağaç yapılı veri analizinde ağaçlardır. Öklid uzayındaki noktaların ağaçlarla değiştirilmesi, veri analizinde ek karmaşıklık getirir ve boyut indirgeme tekniklerinin kullanılmasını gerektirir. Bu çalışmada, her ağacın köklü ve etiketli olduğu ağaç yapılı veriler için boyut indirgeme teknikleri geliştirmeyi hedefliyoruz. İki klasik boyut küçültme tekniğini ele alıyoruz; temel bileşen analizi (PCA) ve çok boyutlu ölçekleme (MDS), ve bunları ağaç yapılı verilere uyarlıyoruz. Ağaç yapılı veriler için PCA üzerine yapılan önceki bir çalışmanın aksine, bu tezde önerilen PCA teknikleri bir varyans ölçüsünü maksimize ediyor. Rastgele oluşturulmuş veriler ve gerçek hayat verileri üzerinde yapılan hesaplama deneyleri, önerilen PCA tekniklerinin mevcut olana göre üstünlüğünü göstermektedir. Literatürde ağaç yapılı veriler üzerinde MDS gerçekleştirip ağaç uzayına yansıtan bir çalışma bulunmamaktadır. Bu doğrultuda, ağaçların kenarlarının boyut olarak kabul edildiği ağaç yapılı veriler için ilk MDS yöntemini öneriyoruz. Önerilen MDS yönteminde amaç, ağaç çiftleri arasındaki Hamming uzaklıklarını orantısal olarak benzer tutmaktır. Bu amaçla, tutulacak kenarları optimal bir şekilde bulan bir karma tamsayılı doğrusal programlama modeli ve kenarların açgözlülükle tek tek seçildiği sezgisel yöntemler önermekteyiz. Hesaplamalı deneyler, önerilen MDS yöntemlerinin, kenarların yalnızca bir kısmı ile yüksek kümeleme doğruluğu elde edildiğinden yararlı bilgileri tutmada başarılı olduğunu göstermektedir. Hesaplamalı deneyleri sistematik bir şekilde yapabilmek için bir rastgele ağaç üreteci algoritması geliştirilmiştir. Bu algoritma, farklı eğiklik ve yoğunluk parametrelerine sahip ağaç kümeleri oluşturabilmektedir. Bu parametreleri sistematik olarak değiştirerek önerilen yöntemlerin güçlü ve zayıf yönlerini anlayabiliriz.
Özet (Çeviri)
Statistical analysis of tree-structured data is one of the exciting research areas with expanding application areas. In classical data analysis, the data objects are points in the Euclidean space, whereas they are trees in the analysis of tree-structured data. The replacement of points in the Euclidean space with trees brings in additional complexity in data analysis and necessitates the use of dimension reduction techniques. In this study, we aim to develop dimension reduction techniques for tree-structured data where each tree is rooted and labeled. We consider two classical dimension reduction techniques; namely, the principal component analysis (PCA) and multidimensional scaling (MDS), and adapt them to tree-structured data. Unlike a previous study on the PCA for tree-structured data, the PCA techniques proposed in this thesis maximize a measure of variance. Computational experiments on randomly generated data and real life data show the superiority of the proposed PCA techniques over the existing one. In the literature, there is no study that performs MDS on tree-structured data to project them in the tree space. In this direction, we propose the first MDS method for tree-structured data, where the edges of the trees are considered as the dimensions. In the proposed MDS method, the aim is to keep the Hamming distances between pairs of trees proportionally similar. For this purpose, we propose a mixed-integer linear programming model which finds the edges to be kept in an optimal way and heuristic methods where the edges are greedily selected one by one. Computational experiments show that the proposed MDS methods are successful in keeping useful information as high clustering accuracy is achieved with only a fraction of the edges. To be able to perform the computational experiments in a systematic way, a random tree generator algorithm is developed. This algorithm is able to generate clusters of trees with different skewness and density parameters. By changing these parameters systematically, we are able to understand the strength and weaknesses of the proposed methods.
Benzer Tezler
- Text document querying via hierarchical clustering of documents in vector spaces
Vektör uzayında dökümanların sıradüzensel olarak gruplandırılmasıyla metin veri tabanlarında sorgulama
SERKAN KAYA
Yüksek Lisans
İngilizce
2002
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiSistem ve Kontrol Mühendisliği Ana Bilim Dalı
PROF. DR. FİKRET GÜRGEN
YRD. DOÇ. DR. ULUĞ BAYAZIT
- Metin sınıflama için yeni bir özellik çıkarım yöntemi
A new method on feature extraction for text classification
GÖKSEL BİRİCİK
Doktora
Türkçe
2011
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. A. COŞKUN SÖNMEZ
- Fonksiyonel veri analizinin karar ağaçlarında kullanımı
Utilization of functional data analysis in decision trees
BURCU KOCARIK GACAR
- Content-based image retrieval using deep learning and multidimensional indexing
Derin öğrenme ve çok boyutlu indeksleme kullanılarak içerik tabanlı görüntü alma
ÖMER UZEL
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SERDAR ARSLAN
- New approach to unsupervısed based classıfıcatıon on mıcroarray data
Mi̇krodi̇zi̇li̇m veri̇lerden danışmansız öğrenmeye dayalı sınıflamada yeni̇ yaklaşım
ERDAL COŞGUN
Doktora
İngilizce
2013
BiyoistatistikHacettepe ÜniversitesiBiyoistatistik Ana Bilim Dalı
PROF. DR. ERGUN KARAAĞAOĞLU