Geri Dön

Öznitelik seçimi ve makine öğrenimi kullanılarak enerji iletim, kontrol ve yönetim sistemlerinde siber güvenlik analizi

Cyber security analysis in energy transmission, control and management systems by using feature selection and machine learning

  1. Tez No: 728287
  2. Yazar: SEZGİN ERTUĞRUL
  3. Danışmanlar: DR. ÖĞR. ÜYESİ GÖKALP TULUM
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Elektrik ve Elektronik Mühendisliği, Enerji, Computer Engineering and Computer Science and Control, Electrical and Electronics Engineering, Energy
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: İstanbul Arel Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 80

Özet

Enerjinin iletimi, denetimi ve yönetiminin yapıldığı SCADA benzeri sistemlerin internet ağına bağlı olarak çalışmaları ve ağ üzerinden güvenli bir şekilde veri iletmeleri beklenmektedir. Enerji denetim ve yönetim sistemlerinde, sisteme yapılacak siber saldırılar sonucu verilerde oluşabilecek hataların sınıflandırılması ile sistemin korunmasını sağlayabilecek akıllı sistemlerin geliştirilmesi mümkündür. Fakat büyük çaplı sistemler için geliştirilecek akıllı sınıflandırma algoritmalarında en büyük problem öznitelik uzayının oldukça büyük olmasıdır. Böyle sistemler için doğru şekilde öznitelik azaltma önemlidir. Bu çalışmada birbirine ardışık bağlı öznitelik seçim algoritmalarının hem zaman hem sınıflandırma başarısına etkilerinin incelenmesi amaçlanmıştır. Böylece her bir öznitelik seçimi sonrası elde edilen öznitelik matrisleri ile sistem performansının iyileşip iyileşmediği incelenecektir. Geliştirilen algoritma için 128 farklı iletim hattı ölçüm parametresinin öznitelik uzayından oluşan açık kaynaklı bir veri seti kullanılmıştır. Çalışmada izlenen metodoloji temel olarak dört ana adımdan oluşmaktadır. Çalışmada her adımda sınıflandırıcı olarak 5'li komite yapısına sahip, oy çokluğu ile karar veren, sabit parametreli (katman sayısı, nöron sayısı, öğrenme oranı ve momentum katsayısı) çok katmanlı algılayıcı (MLP) tercih edilmiş ve 10 katlamalı çapraz doğrulama yöntemi uygulanmıştır. İlk adım olarak tüm veri seti doğrudan MLP ağları ile sınıflandırılmış, başarı ve sınıflandırma eğitim süreleri kaydedilmiştir. İkinci adımda ilk öznitelik seçim yöntemi olarak ANOVA analizi kullanılmış ve p-değeri 0,05'den büyük olan öznitelikler elenmiştir. İlk öznitelik seçimi sonrasında elde edilen öznitelik matrisi aynı özelliklere sahip MLP ağı ile sınıflandırılmış, başarı ve eğitim süresi kaydedilmiştir. Üçüncü adımda ise özniteliklerin arasındaki korelasyona bakılmıştır. En düşük p-değerine sahip öznitelikten başlayarak korelasyon katsayısı |r|

Özet (Çeviri)

A recorded it is expected from systems which transmit, control and manage the energy like SCADA to operate by being connected to internet networkand transmit data from network securely. It is possible to develop smart systems that protect energy control and management systems by classifyingerrors on data as a result of cyber-attacks to the system. However, in the smart classifying algorithms which will be developed for large scalesystems, the biggest problem is that the feature space is so large. For these systems, it is important to reduce features correctly. In this study, it is aimed to investigate the effects of sequentially connected feature selection algorithms to the consumed time and classification performance. Thus, the system performance will be investigated with the feature matrices that are acquired after each feature selection. An open source dataset which consists of 128 different transmission line measurement parameters' feature space were used for the developed algorithm. The methodology of the study has 4 main steps. In each step, multi-layer perceptron (MLP) which has quintet committee structure, decides by majority of votes, has constant parameter (number of layer and neuron, learning rate and momentum coefficient) was preferred and ten-fold crossvalidation was applied. For the first step, all dataset was classified directly with MLP network. Performance and classification times were recorded. For the second step, ANOVA analysis was used as the first feature selection method and the features which have p-value greater than 0.05 were eliminated. The feature matrix which was acquired after the first feature selection was classified with the same MLP network. Performance and training duration were recorded. In the third step, correlation was examined among features. By starting with the lowest p-valued feature, features that have correlation coefficients lesser than 0.7 were selected with this method and were inserted into the classification algorithm. Performance and consumed time wererecorded. For the last feature selection method, features were sorted by weighting according to the relation among them with ReliefF algorithm. From the acquired sorted features, the mean value of the features that have minimum and maximum value were calculated. The features that have greaterweight value than mean value were inserted into the classification process. When the results are examined, MLP network faced with overlearning problem for the whole dataset and it couldn't classify any of two classes. The classification performance was 21% and training time was observed approximately as 63.14 seconds. After the first feature selection, number offeatures decreased from 128 to 82. The classification performance was 89.11% and training time was nearly 205.82 seconds. Twenty four featureswere suitable for classification after second feature selection which was carried our according to correlation coefficients. The classification performancewas obtained as 85.32% and process duration was 17.69 seconds with these features. After the last feature selection, the number of features dropped to 6 and classification duration was 7.4 seconds. The classification performance was 84.49%.

Benzer Tezler

  1. Estimation of energy production in biogas plants

    Biyogaz tesislerinde enerji üretiminin tahmini

    ŞEVVAL AYŞE YURTEKİN

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Elektrik ve Elektronik MühendisliğiKadir Has Üniversitesi

    Mühendislik ve Doğa Bilimleri Ana Bilim Dalı

    DOÇ. DR. ATİLLA ÖZMEN

    DR. BARAN TANDER

  2. Statistical feature learning and signal generation for time-series sensor signals

    Zaman serisi sensör işaretleri için öznitelik öğrenimi ve işaret üretimi

    ERKAN KARAKUŞ

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HATİCE KÖSE

  3. Penetration rate optimization in heterogeneous formations with support vector machines method

    Destek vektör makinesi yöntemi ile heterojen formasyonlarda ilerleme hızı optimizasyonu

    KORHAN KOR

    Doktora

    İngilizce

    İngilizce

    2021

    Petrol ve Doğal Gaz Mühendisliğiİstanbul Teknik Üniversitesi

    Petrol ve Doğal Gaz Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÜRŞAT ALTUN

  4. Betonarme perdelerin çevrimsel sönümlenen enerji kapasitesinin makine öğrenmesi yöntemleri ile incelenmesi

    Investigation of energy dissipation capacity of RCc shear walls with machine learning methods

    BERKAY TOPALOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Deprem Mühendisliğiİstanbul Teknik Üniversitesi

    Deprem Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ZEYNEP DEĞER

  5. Makine öğrenim yöntemlerini kullanarak gecol'daki güç yükü tahmini

    The power load prediction in gecol using machine learning methods

    ASHRAF MOHAMMED ABUSIDA

    Doktora

    Türkçe

    Türkçe

    2023

    Mühendislik BilimleriKastamonu Üniversitesi

    Malzeme Bilimi ve Mühendisliği Ana Bilim Dalı

    PROF. DR. AYBABA HANÇERLİOĞULLARI