Disaster estimation for operational systems
Operasyonel sistemlerde felaket senaryosu tahminleme
- Tez No: 724391
- Danışmanlar: DR. ÖĞR. ÜYESİ ECE GELAL SOYAK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Bahçeşehir Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 62
Özet
Operasyonel sistemler kurumlar için hayati önem taşımaktadır. Kurum içi ve dışı gerçekleşen bütün iş akışları bu sistemler üzerinden ilerlemektedir. Kurumun işleyişi bu şekilde iken bu teknolojik sistemlerin çalışmasında yaşanacak ufak aksaklıklar bile kurumları ciddi zarara uğratabilecek sonuçlar doğurabilmektedir. Bu tarz sistemlerin hareketlerini analiz edebilmek için log verileri en olası yol gözükmektedir. Türkiye'nin büyük ölçekli sigorta firmalarından biri içerisinde, bir iş ihtiyacı olarak doğan bu talep için 4 aylık (2021) bir uygulama çıkartılarak veri seti olarak ele alınmıştır. Bu tez çalışmasında operasyonel sistemlerdeki olası sorunların keşfedilmesine yönelik ziyaret süresi, bilgisayar ana sistemi ve bağlantı zamanı gibi operasyonel sistem göstergelerinden yararlanılmıştır. Yanıt Süresi verileri hedef değişken olarak alınıp, hem sürekli hem de bir eşiğe dayalı kategorik olarak değerlendirilmiştir. Veri analizi için Python aracı kullanılmıştır. Model tahmini/testi için veri ön işleme ile başlayan standart veri bilimi akışı takip edilmiştir. Ön analizler aşamasında farklı veri işleme adımları, değişken mühendisliği ve seçimi yapılır. Modelleme aşamasında hem regresyon hem de sınıflandırma algoritmaları kullanılmaktadır. İlk olarak regresyon algoritması tahmin edilmiştir, ancak tahmin edilen modelin sonucu istatistiksel olarak anlamlı ve tahmin edici değildir. İkinci aşamada, sürekli değişken olan Yanıt Süresi hedef değişkeni 0/1 olarak sınıflandırılır ve öncelikle Destek Vektör Makinesi ( SVM ) algoritması kullanılarak yüksek doğruluk elde edilir. Doğruluk oranı yüksek olmasına ragmen kurumun ihtiyacı için kesinlik ve duyarlıklık da önem arz etmektedir. Bu konular gözetilerek CatBoost sınıflandırma algoritması kurulur. Bu sınıflandırma algoritması sonucunda %99 doğruluk elde edilmiştir. Çıkan sonuçlarda, regresyon sonuçlarını sınıflandırma algoritması sonuçlarıyla karşılaştırdığımızda, vakamız aykırı değer tespiti olarak sınıflandırılabileceğinden, artırma tabanlı sınıflandırma algoritmasının regresyondan açık ara farklı daha iyi performans gösterdiği sonucuna varabiliriz. Bu sonuç, bu konudaki son makine öğrenmesi çalışmaları ile desteklenebilmektedir.
Özet (Çeviri)
Operational systems are crucial for corporations. All of the business processes flow through these systems. While systems are functional company wide, even minor downtimes which effects these systems, cause serious financial consequences. System logs seem the best possible way for analyzing the behaviors of operational systems like these. One of the large scale insurance companies had a business to analyze these systems and create a prediction mechanism. Data set extracted for an interval includes 4 months (2021) and it becomes input for this work. In this thesis, operational system indicators like visit duration, computer main system and time of connection data are used. The response time data is taken as the target variable and evaluated as both continuous and categorical flag based on a threshold. For the data analysis, Python tool is used. We follow standard data science pipeline starting with data preprocessing to model estimation/test. Different data processing tasks, feature engineering and selection are done. At modelling phase, both regression and classification are used. First, regression algorithm is used to estimate continuous target, response time, using all features; however, the resulting estimated model is not deemed to be statistically significant or predictive. In the second phase, continuous response time target is categorized into 0/1 flag and Support Vector Machine ( SVM ) algorithm applied to our data set. Although it has high accuracy it does not cover company's need for precision and recall aspects. As a result of this, CatBoost classification algorithm adopted. As a result of this classification algorithm, 99% accuracy of is achieved. Based on our results, when we compare regression results with classification algorithm result we can conclude that boosting based classification algorithm shows slightly better performance than the regression since our case can be classified as outlier detection. This result can be supported with recent machine learning studies on this topic.
Benzer Tezler
- Şubat 2023 Türkiye depremlerinden etkilenen köprülerin hasar durumlarının tahmini
Estimation of damage conditions of bridges affected by february 2023 Türkiye earthquakes
MUSTAFA GÖVERCİN
Yüksek Lisans
Türkçe
2024
İnşaat Mühendisliğiİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET ABDULLAH DÖNMEZ
PROF. DR. YASİN FAHJAN
- Uydu görüntü verileri kullanılarak orman yangın analizi
Forest fire analysis using satellite images
ÇİĞDEM İNAN
Yüksek Lisans
Türkçe
2018
Mühendislik Bilimleriİstanbul Teknik Üniversitesiİletişim Sistemleri Ana Bilim Dalı
PROF. DR. SEDEF KENT PINAR
- Çoklu insansız hava araçları arası altyapısız ağlar için yeni bir konum bilgisi paylaşımlı ve yönlü ortam erişim kontrol protokolü
A novel location oriented directional medium access control protocol for ad hod unmanned air vehicle networks
ŞAMİL TEMEL
Doktora
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHava Harp Okulu KomutanlığıBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. İLKER BEKMEZCİ
- Milli Savunma Bakanlığı inşaat emlak teşkilatında ödeneklerin planlama ve görevlerin yürütülme esasları ile problemlerin çözüm yöntemleri
Başlık çevirisi yok
HÜSEYİN IŞIK
Yüksek Lisans
Türkçe
1997
İnşaat Mühendisliğiİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. DOĞAN SORGUÇ
- Taşkın akımlarının tahmininde WRF-ARW ve HEC-HMS modellerinin birlikte kullanılması, Ergene Havzası örneği
Prediction of flood runoff by coupling wrf-arw and HEC-HMS models, Ergene Basin
FATMA BETÜL DEMİR
Yüksek Lisans
Türkçe
2019
Meteorolojiİstanbul Teknik ÜniversitesiMeteoroloji Mühendisliği Ana Bilim Dalı
PROF. DR. SEVİNÇ ASİLHAN