Geri Dön

Karma veri modellerinin optimizasyonu için esnek hesaplama yöntemleri

Soft computing methods for optimization of mixed data models

  1. Tez No: 893529
  2. Yazar: GÖZDE KARAKOÇ
  3. Danışmanlar: PROF. ÖZLEM TÜRKŞEN
  4. Tez Türü: Doktora
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Ankara Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: İstatistik Bilim Dalı
  13. Sayfa Sayısı: 160

Özet

Gerçek dünya problemlerine ilişkin verilerin hem nitel hem de nicel değerli olması durumunda problem karma veri problemi olarak adlandırılır. Bu tez çalışmasında, karma veri probleminin modellenmesi ve çok amaçlı optimizasyonu amaçlanmıştır. Çok yanıtlı karma veri probleminin modelleme aşamasında, Genelleştirilmiş Doğrusal Modeller (Generalized Linear Models-GLM), Ridge, LASSO, Elastik Net ve Görünüşte İlişkisiz Regresyon (Seemingly Unrelated Regression-SUR) analizleri yapılarak tahmini yanıt fonksiyonları elde edilmiştir. Modelleme aşamasında elde edilen tahmini yanıt fonksiyonları amaç fonksiyonları olarak ele alınıp karma verili çok amaçlı optimizasyon (Multi-Objective Optimization - MOO) problemi oluşturulmuştur. Çalışmada, bu tür problemlerin Pareto çözüm kümesinin bulunması için popülasyon tabanlı bir yapay zeka optimizasyon algoritması olan Baskın Sıralı Genetik Algoritma-II (Nondominated Sorting Genetic Algorithm-II / NSGA-II) ve Baskın Sıralı Genetik Algoritma-III (NSGA-III) uyarlanmıştır. NSGA-II'nin ve NSGA-III'ün değişken gösterimi, başlangıç popülasyonu oluşturma ve genetik operatörlerin uygulanması aşamalarında yapılan uyarlamalarla elde edilen yöntemler Karma Verili Baskın Sıralı Genetik Algoritma-II (Mixed Data Nondominated Sorting Genetic Algorithm-II / MDNSGA-II) ve Karma Verili Baskın Sıralı Genetik Algoritma-III (MDNSGA-III) olarak adlandırılmıştır. Önerilen MDNSGA-II ve MDNSGA-III yöntemleriyle kesikli girdi değişkenlerinin tanım kümesinden değerler alması sağlanarak karma verili çok amaçlı problem optimize edilmiştir. Çalışmanın uygulama aşamasında, UCI Machine Learning Repository veri tabanındaki enerji verimliliği karma veri kümesine ve gıda alanında literatürde mevcut olan deneysel veri kümesinin karma verili hale getirilmesiyle elde edilen veri kümesine MDNSGA-II ve MDNSGA-III yöntemleri uygulanmıştır. MOO sonucunda, MDNSGA-III ile elde edilen Pareto çözüm kümesinde MDNSGA-II'ye göre iyileşme sağlandığı ve daha fazla çözüm çeşitliliğinin elde edilebildiği sonucuna ulaşılmıştır.

Özet (Çeviri)

The problem is called mixed data problem, if the data has both qualitative and quantitative values for a real world problem. In this thesis, modeling and multiobjective optimization of the mixed data problem is aimed. In the modeling phase of the multi response mixed data problem, Generalized Linear Models (GLM), Ridge, LASSO, Elastic Net and Seemingly Unrelated Regression (SUR) analyses are performed to obtain estimated response functions. The estimated response functions obtained in the modeling phase are taken as objective functions and a mixed data multiobjective optimization problem (MOO) is formed. In this study, Nondominated Sorting Genetic Algorithm-II (NSGA-II) and Nondominated Sorting Genetic Algorithm-III (NSGA-III), which are population based artificial intelligence optimization algorithms, are adapted to find the Pareto solution set of such problems. The methods obtained by adapting NSGA-II and NSGA-III in the variable representation, initial population generation and application of genetic operators are named Mixed Data Nondominated Sorting Genetic Algorithm-II (MDNSGA-II) and Mixed Data Nondominated Sorting Genetic Algorithm-III (MDNSGA-III). With the proposed MDNSGA-II and MDNSGA-III methods, the mixed data multiobjective problem is optimized by ensuring that the discrete input variables take values from the definition set. In the application phase of the study, the MDNSGA-II and the MDNSGA-III methods are applied to the energy efficiency mixed dataset from the UCI Machine Learning Repository database and the dataset obtained by converting the experimental dataset available in the literature in the food field into mixed data. As a result of the MOO, it is concluded that the Pareto solution set obtained with the MDNSGA-III, have more solution diversity with improvement than the Pareto solution set of the MDNSGA-II.

Benzer Tezler

  1. Networked computing-based system identification and control of electromechanical systems with industrial IoT

    Endüstriyel IoT ile elektromekanik sistemlerin ağ hesaplama tabanlı sistem tanıma ve kontrolü

    RAMAZAN KAYA

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ALİ FUAT ERGENÇ

  2. Çok amaçlı akıllı metasezgisel optimizasyon modeli ile nicel verilerde kural çıkarım temelli sınıflandırma modellerinin geliştirilmesi

    Development of rule mining based classification models for quantitative data with many-objective intelligent metaheuristic optimization model

    SUNA YILDIRIM

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    PROF. DR. BİLAL ALATAŞ

  3. Evrişimli sinir ağlarında kullanılan havuzlama katmanının analizi

    Analysis of pooling layer used in convolutional neural networks

    PINAR ARSLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSivas Cumhuriyet Üniversitesi

    Yapay Zeka ve Veri Bilimi Ana Bilim Dalı

    DOÇ. DR. KALİ GÜRKAHRAMAN

  4. Derin öğrenme yaklaşımı kullanarak bulut ortamları için saldırı tespit hizmet tasarımı

    A deep learning approach for designing a cloud intrusion detection service

    WISAM ELMASRY

    Doktora

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Ticaret Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ABDÜL HALİM ZAİM

    DOÇ. DR. AKHAN AKBULUT

  5. Data augmentation and missing data imputation using similar traffic characteristic of road segments for improving long-term speed prediction

    Uzun vadeli trafik hızı tahminini iyileştirmek için benzer trafik karaktestliğine sahip yolların kullanılarak veri arttırılması ve kayıp verilerin giderilmesi

    MUSTAFA MERT KARA

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MEHMET AMAÇ GÜVENSAN

    DR. ÖĞR. ÜYESİ HAFİZA İREM TÜRKMEN ÇİLİNGİR