Using topological features of microservice call graphs to predict the response time variation
Mikroservis çağrı ağlarının topolojik özelliklerini kullanarak yanıt süresi değişkenliğinin tahmin edilmesi
- Tez No: 856571
- Danışmanlar: PROF. DR. BANU GÜNEL KILIÇ, DOÇ. DR. AYSU BETİN CAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Yönetim Bilişim Sistemleri, Computer Engineering and Computer Science and Control, Science and Technology, Management Information Systems
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Enformatik Enstitüsü
- Ana Bilim Dalı: Bilişim Sistemleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 117
Özet
Mikroservis mimarileri, yazılım tasarım alanında giderek daha fazla popülerlik kazanmaktadır. Mikroservisler arasındaki iletişimden oluşan ağların topolojisi üzerine yapılan araştırma, mikroservis mimarisi araştırmalarının bir alt alanını oluşturur. Topoloji ile yanıt süresi arasındaki ilişkiyi inceleyen çalışmalar olmasına rağmen, yanıt süresindeki değişkenliğin topoloji ile olan bağlantısı tam anlamıyla keşfedilmemiştir. Mikroservis performans istikrarı, mimarinin kalitesini gösteren kritik bir metrik olarak hizmet verir. Performans istikrarını sağlamak için düşük yanıt süresi değişkenliğine sahip mimarilere ihtiyaç vardır, bu da daha öngörülebilir ve kolay test edilebilir sistemlerin oluşturulmasını sağlar. Deneysel gözlem, çağrı ağı topolojisinin yanıt süresi değişkenliği üzerinde önemli bir etkisi olduğunu ortaya koymakta, bu da bu ilişkinin araştırılmasının önemini vurgulamaktadır. Bu çalışmada, mikroservis çağrı ağlarının topolojik özellikleri ile eğitilen makine öğrenimi modelleri kullanılarak bu etkiyi keşfetmek ve yanıt süresi değişkenliğini tahmin etmek amaçlanmaktadır. Başarılı ve istatistiksel olarak anlamlı modellerin özellik önemi incelenir. Bu özellik önemi bilgisi ile yanıt süresi değişkenliği açısından stabil olan topolojik tasarımların anlaşılması hedeflenmektedir. 70 bin mikroservis çağrı ağından elde edilen merkezilik, modülerlik, mikroservis sayısı, döngü sayısı ve ortalama derece özellikleri rastgele orman, LightGBM, CatBoost modellerini eğitmek için kullanılır. Bu modeller çağrı ağının düşük ve yüksek yanıt değişkenliği sınıflarından hangisine ait olduğunu tahmin etmeye çalışır. İstatistiksel olarak anlamlı ve 0.8'den yüksek F1 skor, doğruluk ve kesinlik elde eden modellerin SHAP değerleri ve bağımlılık grafikleri incelenerek özelliklerin model çıktısı üzerindeki etkisi incelenir. Sonuç olarak bu tezde, yanıt süresi değişkenliğini topolojik özellikleri kullanarak sınıflandıran modeller ve topolojik özelliklerin yanıt süresi değişkenliğindeki etkisi elde edilir.
Özet (Çeviri)
Microservice architectures are increasingly gaining popularity in the field of software design. Research on the topology of graphs formed by communication between microservices is a subdomain within the broader scope of microservice architecture research. Although there have been studies examining the relationship between topology and response time, the variability in response time and its connection to topology has not been thoroughly explored. To ensure performance stability, architectures with low response time variation are needed. Low response time variation enables the creation of more predictable and easily testable systems. In this study, machine learning models trained with the topological features of microservice call graphs are used to explore the impact of topology on predicting response time variation. The feature importance of models achieving successful and significant results is examined. The centralization, modularity, node count, average degree, and loop count features obtained from 70,000 microservice call graphs are used to train random forest, LightGBM, and CatBoost classifiers. These models aim to predict whether the call graph belongs to the class of high response time variation or low response time variation. The feature importance of models achieving F1 score, accuracy, and precision higher than 0.8, along with statistically significant results from the McNemar test, is examined using SHAP values and dependence plots. Finally, models predicting response time variation based on topological features and understanding the impact of topological features on response time variation are obtained in this thesis.
Benzer Tezler
- Evolving boolean graphs to model the topological and dynamical behavior of biological regulatory networks and their metanetworks
Boolcu ağların evrimleştirilmesi ile biyolojik regulasyon ağlarının ve meta-ağlarının topolojik ve dinamik özelliklerinin modellenmesi
BURÇİN DANACI
Yüksek Lisans
İngilizce
2014
Fizik ve Fizik Mühendisliğiİstanbul Teknik ÜniversitesiFizik Mühendisliği Ana Bilim Dalı
PROF. DR. AYŞE ERZAN
- A survey on multidimensional persistence theory
Çok boyutlu ısrarcılık teorisi üzerine
DİLAN KARAGÜLER
Yüksek Lisans
İngilizce
2021
MatematikOrta Doğu Teknik ÜniversitesiMatematik Ana Bilim Dalı
DOÇ. DR. SEMRA PAMUK
- Topological data analysis and clustering algorithms in machine learning
Topolojik veri analizi ve makine öğreniminde kümeleme algoritmaları
İSMAİL GÜZEL
Doktora
İngilizce
2023
Matematikİstanbul Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
PROF. DR. ATABEY KAYGUN
- Optimal kontrol sistemlerinin incelenmesi
Investigation of optimal control systems
HAKAN GÜRKAN
Yüksek Lisans
Türkçe
2000
Elektrik ve Elektronik MühendisliğiAnkara ÜniversitesiElektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ABDULRIZA ABİLOV
- An open source spatial software for transportation infrastructure performance metrics
Ulaştırma altyapı performans ölçütleri için mekansal açık kaynak kodlu yazılım
ÖMER AKIN
Yüksek Lisans
İngilizce
2019
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. HANDE DEMİREL