Makine öğrenmesi yöntemleri ile yapısal verilerin vektör gömülümleri
Vector embeddings of structural data by machine learning techniques
- Tez No: 904157
- Danışmanlar: PROF. DR. SEMRA GÜNDÜÇ
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Science and Technology, Engineering Sciences
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Ankara Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 119
Özet
Günümüzde artan veri miktarı ve karmaşıklığı, verilerdeki ilişkileri ve gizli kalıpları ortaya çıkarabilecek güçlü yöntemlere olan ihtiyacı artırmaktadır. Ağlar, bu karmaşık ilişkilerin yakalanmasında ve analizinde etkili bir araç sunmaktadır. Ancak ağların düzensiz yapısı, geleneksel makine öğrenimi algoritmalarının gerektirdiği sabit boyutlu vektör formatına uygun değildir. Bu nedenle, ağların yapısal bilgilerini vektör temsillerine dönüştüren yöntemlerin geliştirilmesine ihtiyaç duyulmaktadır. Bu tez çalışmasında, ağ verilerinin işlenmesi ve düğüm yerleştirme yöntemleri incelenerek, ağların yapısal özelliklerini koruyan düşük boyutlu vektör temsillerinin nasıl elde edileceği araştırılmıştır. Düğüm sınıflandırma, bağlantı tahmini ve topluluk tespiti gibi çeşitli ağ madenciliği görevlerinde makine öğrenimi ile ağ temsili öğreniminin entegrasyonunun performansı artırdığı gösterilmiştir. Bu kapsamda, ağların makine öğrenimi ile etkin bir şekilde analiz edilmesi için üç yeni yöntem önerilmiştir. İlk olarak, derece tabanlı rasgele yürüyüş yöntemi geliştirilmiştir. Bu yöntem, düğüm derecelerine orantılı rasgele yürüyüşler yaparak, daha az sayıda yürüyüşle yüksek hassasiyette vektör temsilleri elde edilmesini sağlamıştır. İkinci olarak, Geçiş Olasılık Matrisi (TPM) yöntemi önerilmiş ve düğümlerin yerel yapısal özellikleri, anonim rasgele yürüyüşler aracılığıyla analiz edilmiştir. TPM, düğüm kimliklerinden ziyade bağlantı yapılarını vurgulayarak ağın derinliklerine inmeden daha verimli bilgi toplamayı sağlamıştır. Son olarak, metin verilerinin ağ yapısı ile incelenmesi amacıyla Kılavuzlu Geçiş Olasılık Matrisi (GTPM) yöntemi önerilmişitir. Bu yöntem, metinlerin gizli içeriklerini ve sözdizimsel unsurlarını dikkate alarak, kelimeler arasındaki ilişkileri daha iyi temsil eden yerleştirme vektörleri oluşturmuştur. Önerilen yöntemler, ağ analizi ve metin sınıflandırma gibi çeşitli deneysel çalışmalara dayanarak değerlendirilmiş ve hesaplama verimliliği ile doğruluk açısından mevcut yöntemlere üstünlük sağlamıştır.
Özet (Çeviri)
In today's world, the increasing volume and complexity of data have amplified the need for powerful methods capable of uncovering relationships and hidden patterns within the data. Networks provide an effective tool for analyzing such complex relationships, but their irregular structure is not compatible with the fixed-dimensional vector format required by traditional machine learning algorithms. Therefore, methods are needed to convert the structural information of networks into vector representations. This thesis explores how to obtain low-dimensional vector representations that preserve network structures through the examination of node embedding techniques. It demonstrates that integrating machine learning with network representation learning improves performance in tasks like node classification, link prediction, and community detection. In this context, three novel methods have been proposed for the effective analysis of networks using machine learning. First, a degree-based random walk method is developed, producing high-precision vector representations with fewer walks. Second, the Transition Probability Matrix (TPM) method analyzes local node structures using anonymous random walks, efficiently collecting information without deep exploration of the network. Lastly, the Guided Transition Probability Matrix (GTPM) method has been proposed for the analysis of text data within a network structure. This method generates embedding vectors that more accurately represent the relationships between words by taking into account the latent content and syntactic elements of the texts. The proposed methods have been evaluated through various experimental studies, including network analysis and text classification, demonstrating superiority over existing methods in terms of computational efficiency and accuracy.
Benzer Tezler
- Classification of abnormal respiratory sounds using deep learning techniques
Solunum seslerinin derin öğrenme yöntemleri ile sınıflandırılması
AHAMADI ABDALLAH IDRISSE
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
DOÇ. DR. OKTAY YILDIZ
- Generalized multi-view data proliferator (gem-vip) for boosting classification
Genelleştirilmiş çok boyutlu veri üretimi ile sınıflandırma hassaslığının yükseltilmesi
MUSTAFA ÇELİK
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ISLEM REKIK
- A multi-fidelity prediction framework with convolutional neural networks using high-dimensional data
Yüksek boyutlu veriler ile çok-doğruluklu evrişimsel sinir ağı tabanlı kestirim
HÜSEYİN EMRE TEKASLAN
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiUçak ve Uzay Mühendisliği Ana Bilim Dalı
PROF. DR. MELİKE NİKBAY
- Derin öğrenme ile Türkçe sağlık metinleri üzerinde olumsuz anlam tespiti
Negation detection in Turkish medical texts with deep learning
ZANA SÖĞÜT
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
PROF. DR. OĞUZ DİKENELLİ
- Penetration rate optimization with support vector regression method
Destek vektör regresyonu yöntemi ile ilerleme hızı optimizasyonu
KORHAN KOR
Yüksek Lisans
İngilizce
2015
Petrol ve Doğal Gaz Mühendisliğiİstanbul Teknik ÜniversitesiPetrol ve Doğal Gaz Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. GÜRŞAT ALTUN