Resampling based regression approach for what-if analysis
What-if analizi için yeniden örneklemeli regresyon yaklaşımı
- Tez No: 814864
- Danışmanlar: DOÇ. DR. TEVFİK AYTEKİN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Bahçeşehir Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 52
Özet
Regresyon ve sınıflandırma modellerinin beklenilen performansı göstermesini engelleyen en yaygın problemlerden biri değişkenler arası güçlü korelasyon durumu yani çoklu bağlantı problemidir. Bu durum ortaya çıktığında, her bir değişkenin bağımlı değişken üzerindeki bireysel etkisini belirlemek zor olabilmektedir. Çoklu bağlantı varsa, modelden bir veya daha fazla ilişkili değişkenin kaldırılması veya bunların makine öğrenmesi modellerinden tutarlı sonuçlar almayı sağlamak için tek bir bileşik değişkene birleştirilmesi sıklıkla başvurulan yöntemlerdendir. Ancak, makine öğrenmesi modellerini gerçek yaşam problemlerine uygularken, tüm değişkenleri bir arada tutmak ve hedef üzerindeki bireysel etkilerini gözlemlemek bazen model performansından daha da önemli olabilmektedir. Bu ihtiyaç özellikle, birbirine bağlı süreçler ile ilerlyen iş modellerinde ortaya çıkmaktadır. Bu tip iş modellerinde süreçlerin birbiri ardına olması sebebiyle, her bir sürecin temsil ettiği değişken bir diğeriyle kuvvetli korelasyon içerir. Bu çalışmada; bu tip iş modelleri için, tüm bağımlı değişkenleri model içerisinde tutarak hedefle olan ilişkilerini açıklamaya çalışan yeni bir yaklaşım üzerinde durulacaktır. Bu yöntemin amacı çoklu bağlantı problemini çözmek değil, sadece bu problemin ortaya çıktığı durumlarda hedef değişkenle bağımlı değişkenlerin arasındaki ilişkiyi daha doğru bir biçimde yansıtmaktır. Önerilen yaklaşım, herhangi bir bağımsız değişkende belirli bir değişiklik olduğunda hem bağımlı hedef değişkeninde hem de diğer bağımsız değişkenlerde ne olacağını göstermeye çalışmaktadır. Bu yönüyle, ana hedefi makine öğrenmesi modellerinin girdi ve çıktı değişkenleri arasındaki ilişkiyi daha şeffaf ve yorumlanabilir bir şekilde açıklamak olan“açıklanabilir makine öğrenmesi”alanına da dokunmaktadır.
Özet (Çeviri)
Regression and classification are two types of supervised learning tasks in machine learning. Though their target variable types are different their common objective is to find out the relationship between input and output variables. One of the most frequent problems that prevents regression and classification models from performing as expected is multicollinearity. If multicollinearity is present, it can be addressed by removing one or more of the correlated variables from the model or by combining them into a single composite variable to ensure getting consistent results from machine learning models. In practical applications of machine learning, particularly in funnel-based business models, it's often more crucial to monitor the unique impact of each variable on the target than to prioritize model performance. In this study we are trying to explore a solution to that type of problem in which we have to keep all dependent variables and explain their relationship with the target. While this method isn't a replacement for techniques like PCA or dimension reduction that handle multicollinearity, it mainly aids in understanding the relationship between dependent and independent variables in multicollinearity scenarios. Basically it will try to show what will happen on both target and other input variables while a certain change happens in any input variable. From that aspect it will also touch the field of“interpretable machine learning”of which the main objective is explaining the relationship between input and output variables of a machine learning model in a more transparent and interpretable way.
Benzer Tezler
- Using machine learning techniques to enhance teaching and performance prediction of students with autism spectrum disorders
Yapay öğrenme yöntemleri ile otizm spektrum bozukluğu olan öğrencilerin öğretiminin ve öğretim performansı tahmininin iyileştirilmesi
AKRAM M.M. RADWAN
Doktora
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ZEHRA ÇATALTEPE
- Dengesiz veri kümeleri için yenilikçi bir hibrit yaklaşım: IQCM metodolojisi ve karşılaştırmalı performans analizi
An innovative hybrid approach for imbalanced datasets: IQCM methodology and comparative performance analysis
MUSTAFA YAVAŞ
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDoğuş ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ AYSUN GÜRAN
- Bulanık regresyon fonksiyonları yöntemi ile konut kredisi riski modellemesi
Home credit risk modelling with the fuzzy regression functions method
ELİF HANDE EDİNSEL
Yüksek Lisans
Türkçe
2023
BankacılıkAnkara ÜniversitesiGayrimenkul Geliştirme ve Yönetimi Ana Bilim Dalı
DOÇ. DR. FURKAN BAŞER
- Parametrik olmayan regresyon analizinde bootstrap yöntemi
In non-parametric regression analysis bootstrap method
NİLÜFER BETÜL AKMAN
Yüksek Lisans
Türkçe
2018
EkonometriSivas Cumhuriyet ÜniversitesiEkonometri Ana Bilim Dalı
DOÇ. DR. NECATİ ALP ERİLLİ
- İki aşamalı bootstrap veri zarflama analizi ile TIMSS verileri kullanılarak eğitim sisteminde etkinliklerin değerlendirilmesi
Evaluation of efficiencies in the education system using TIMSS data with two-stage bootstrap data envelopment analysis
FİRDEVS CEVHEROĞLU EREN
Yüksek Lisans
Türkçe
2023
Eğitim ve ÖğretimOndokuz Mayıs Üniversitesiİstatistik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SERPİL AYDIN