Makine öğrenmesi yöntemlerine dayalı veri yönetim sistemi
Data management system based on machine learning methods
- Tez No: 848197
- Danışmanlar: DOÇ. DR. GÖKAY AKKAYA
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Atatürk Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Endüstri Mühendisliği Bilim Dalı
- Sayfa Sayısı: 40
Özet
Amaç: Bu çalışmada eksik verilerin tahmini için makine öğrenmesi yöntemlerine dayalı eksik veri yönetim sistemi geliştirilmiştir. Veri setlerindeki eksik veri kavramını ele alıp eksik veri problemini silme, ortalama alma gibi yanlılığa neden olan klasik süreçlerden kurtararak alanlarında uzman olmasalar bile rahatlıkla kullanabilecekleri bir arayüz oluşturup, veri setlerindeki eksik nümerik verileri tamamlayan bir sistem geliştirmektir. Yöntem: Bu çalışmada belirtilen amaç doğrultusunda python programlama dili kullanılarak eksik veri tamamlama sistemi geliştirilmiştir. Geliştirilen sistem masaüstü uygulaması haline dönüştürülmüştür. Eksik verilerin tahminini yapmak için iterative imputer ve tahminci olarak da random forest regressor algoritması kullanılmıştır. En iyi iterasyon sayısını bulmak için çapraz doğrulama kullanılan sistemde, kullanıcı tarafından girilen eksik veri setinin raporlaması, eksik veri türleri ve ısı haritası olarak kullanıcıya sunulmuştur. Bulgular: Geliştirilen algoritma 4 farklı veri setinde %5, %10 ve %15 olmak üzere 3 farklı eksiklik oranında tamamen rastgele eksik olarak azaltılmış ve test edilmiştir. Azaltılan nümerik veriler geliştirilen algoritma tarafından tamamlanmış ve sonuç olarak %57 ile %79 arasında değişen bir doğruluk oranıyla tahminler yapılmıştır. Sonuç: Eksik veri problemine çözüm yaklaşımı sunan bu çalışmada amaçlanan hedefler doğrultusunda kullanıcılara kolay ve anlaşılabilir bir arayüz sunularak veri setlerindeki eksik nümerik verilerin tamamlanması sağlanmış, klasik olarak yapılan silme veya ortalama alma gibi işlemlerde meydana gelen yanlılık problemini aşmak için bir çözüm sunulmuştur. Ayrıca sözel verilerin tahmini ve kompakt bir sistem içinde literatüre farklı bir bakış kazandırılmıştır.
Özet (Çeviri)
Purpose: In this study, a missing data management system based on machine learning methods has been developed for predicting missing values. Addressing the concept of missing data in datasets and aiming to eliminate biases introduced by classical processes such as deletion or mean imputation, the goal is to create a user-friendly interface that can be easily utilized by individuals, even if they are not experts in the field. The system is designed to complete missing numerical data in datasets. Method: In pursuit of the stated objective in this study, a missing data completion system has been developed using the Python programming language. The developed system has been transformed into a desktop application. For predicting missing data, the iterative imputer has been employed, with the random forest regressor algorithm serving as the predictor. Cross-validation has been utilized to determine the optimal number of iterations in the system. The system provides users with a report on the entered missing data set, including information on missing data types presented as a heatmap. Findings: The developed algorithm was tested on four different datasets with three different missingness rates: 5%, 10%, and 15%, where the missing values were completely randomly reduced. The reduced numerical data were imputed by the developed algorithm, resulting in prediction accuracy ranging from 57% to 79%. Results: In this study, which presents a solution approach to the missing data problem, the aim was to provide users with an easy and understandable interface to complete missing numerical data in datasets. A solution was offered to overcome the bias problem that arises in classical processes such as deletion or mean imputation. Additionally, the prediction of categorical data was addressed, contributing a novel perspective to the literature within a compact system.
Benzer Tezler
- Küçük ve orta ölçekli firmalar için makine öğrenmesi destekli karar destek sistemi
Machine learning supported decision support system for small and medium-sized companies
KEMAL ÇAM
Yüksek Lisans
Türkçe
2021
Bilim ve TeknolojiDokuz Eylül ÜniversitesiYönetim Bilişim Sistemleri Ana Bilim Dalı
DOÇ. DR. CAN AYDIN
- Havacılık sektöründe istatistiksel proses kontrol: Uçak bakım süreçlerinin iyileştirilmesine yönelik bir uygulama
Statistical process control in the aviation sector: An implementation to improve aircraft maintenance processes
HAMİT HAMİDETTİN KUMURKAN
Yüksek Lisans
Türkçe
2021
Mühendislik Bilimleriİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
DOÇ. DR. NİHAN YILDIRIM
- Konteyner liman operasyonlarının makine öğrenmesi yöntemleri ile analizi
Analysis of container port operations using machine learning methods
ÜSTÜN ATAK
Doktora
Türkçe
2022
Deniz Bilimleriİstanbul Teknik ÜniversitesiDeniz Ulaştırma Mühendisliği Ana Bilim Dalı
PROF. DR. YASİN ARSLANOĞLU
PROF. DR. TOLGA KAYA
- Modelling and state of charge estimation of lithium-ion batteries
Lityum bazlı batarya hücrelerininmodelleme ve şarj durumu tahmini
MANİ KAZIMI
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
PROF. DR. METİN GÖKAŞAN
- Shipyard productivity evaluation with key performance indicators
Tersane üretim verimliliğinin temel performans göstergeleri ile değerlendirilmesi
ÜMRAN BİLEN
Doktora
İngilizce
2022
Gemi Mühendisliğiİstanbul Teknik ÜniversitesiGemi İnşaatı ve Gemi Makineleri Mühendisliği Ana Bilim Dalı
PROF. DR. ŞEBNEM HELVACIOĞLU