Özellik seçme problemlerinde farklı metasezgisel algoritmaların kullanılması
Using different meta-heuristic algorithms in feature selection problems
- Tez No: 685907
- Danışmanlar: PROF. DR. MEHMET SERHAT ODABAŞ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Ondokuz Mayıs Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Akıllı Sistemler Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 157
Özet
Günümüz dünyasında çeşitli uygulamalar tarafından üretilen veriler gittikçe artmaktadır. Ayrıca günümüzde sistemler ve internet ağları, büyük miktarda veriler üretmekte ve çok yakın bir gelecekte internetin dünya çapında yaşayan herkesin beyin kapasitesini aşacağı tahmin edilmektedir. Verilerin bu kadar hızlı bir şekilde artmasının nedeni dijital sensörlerin, iletişimin, bilgi işleminin ve depolamanın ilerlemesinden kaynaklanmaktadır. Ancak gelecekte araştırmacılar büyük veri yığınlarıyla karşı karşıya kalacaklar. Bundan dolayı araştırmacılar veri hacminden, kendi yaptığı işiyle ilgili uygun ve anlamlı özellikleri çıkartma konusunda bir öneri fikri bulması gerekmektedir. Yapılan işle alakası olmayan ve fazlalık olan özellikleri veri kümesinden çıkartmaya özellik seçme işlemi denilmektedir. Özellik seçme büyük miktarda veriler için evrensel olarak kullanılan bir veri ön işleme yöntemidir. Özellik seçimi, veri kümelerini basitleştirmede, performans ve hesaplama verimliliğini arttırmada ve birçok nedenden dolayı hem denetimli hem de denetimsiz öğrenme metotlarıyla kullanılmaktadır. Genel olarak özellik seçme sorunun kesin bir çözüm yolu yoktur ve şimdiye kadarda kesin bir çözüm yolu önerilmemiştir. Ayrıca özellik seçimi için farklı yaklaşımlar literatürde mevcuttur, ama yanıtlarının kalitesi genellikle uygun değildir. Bundan dolayı akıllı optimizasyon teknikleri bu sorunlara çok daha iyi çözümler sunabilir. Bu yüzden, özellik seçimini ve ilgili sorunları çözmenin en etkili ve yapıcı yollarından birisi metasezgisel yöntemlerini kullanmaktır. Bu çalışmada öncelikle yapay sinir ağı ve birden çok kez çalıştırmalı yapay sinir ağı ile veri setinin tüm özellikleri kullanarak vücut yağ tahmini yapıldı ve korelasyon değerleri sırasıyla 0.89028 ve 090355 olarak bulundu. Daha sonrasında 6 tane metasezgisel algoritması(ikili genetik, karınca koloni optimizasyonu, benzetimli tavlama, parçacık sürüsü optimizasyonu,diferansiyel evrim, baskın olmayan sıralı genetik algoritması II) özellik seçimi için kullanıldı ve 8 özellikle en iyi maliyet değerine ulaşıldı. Ayrıca her biri için korelasyon değeri sırasıyla 0.88629, 0.89347, 0.89279, 0.89124, 0.90041, 0.89998 olarak bulundu. Sonuçlara bakıldığında, önemli özellikleri kullanarak daha az maliyet ve zamanla aynı performansa ulaşılabilir.
Özet (Çeviri)
In today's world, the data produced by various applications is increasing. In addition, systems and internet networks today produce large amounts of data and it is predicted that the internet will exceed the brain capacity of everyone living worldwide in the very near future. The reason data is increasing so rapidly is due to the advancement of digital sensors, communication, computing and storage. But in the future, researchers will be faced with huge data piles. Therefore, researchers need to come up with a proposal idea to extract appropriate and meaningful features related to their work from the data volume. The process of removing redundant and irrelevant features from the dataset is called feature selection. Feature selection is a universally used data preprocessing method for large amounts of data. Feature selection is used with both supervised and unsupervised learning methods to simplify datasets, improve performance and computational efficiency, and for many reasons. In general, there is no definitive solution to the feature selection problem, and no definitive solution has been proposed so far. Also, different approaches for feature selection are available in the literature, but the quality of their responses is often unsuitable. Therefore, smart optimization techniques can offer much better solutions to these problems. Therefore, one of the most effective and constructive ways to solve feature selection and related problems is to use metaheuristics. In this study, body fat was estimated using artificial neural network and multiple run artificial neural network and all the features of the data set, and correlation values were found as 0.89028 and 090355, respectively. Then, 6 metaheuristic algorithms (binary genetics, ant colony optimization, simulated annealing, particle swarm optimization, differential evolution, non-dominant sequential genetic algorithm II) were used for feature selection and the best cost value was achieved with 8 features. In addition, the correlation values for each of them were found as 0.88629, 0.89347, 0.89279, 0.89124, 0.90041, 0.89998, respectively. Looking at the results, the same performance can be achieved in less cost and time by using important features.
Benzer Tezler
- Sınıflandırma problemlerinde özellik seçimi için geliştirilen modifiye edilmiş parçacık sürü optimizasyonu algoritması
Modified particle swarm optimization algorithm developed for feature selection in classification problems
EMRE KOÇAK
- Büyük boyutlu veriler için metasezgisel yöntemler ile öznitelik indirgemede yeni bir yaklaşım geliştirilmesi
Developing a new approach to feature selection with metaheuristic methods for large scale data
ESİN AYŞE ZAİMOĞLU
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. NİLÜFER YURTAY
- Sosyal örümcek algoritmasının sürekli ve ayrık optimizasyon problemlerinde performans iyileştirmeleri
Performance improvements of social spider algorithm in continuous and discrete optimization problems
EMİNE BAŞ
Doktora
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ERKAN ÜLKER
- Sentiment analysis model proposal with deep learning techniques on big data: Portfolio selection with the help of industry indicators
Büyük veri üzerinde derin öğrenme teknikleri ile duygu analizi model önerisi: Sektör göstergeleri yardımıyla portföy seçimi
MAHMUT SAMİ SİVRİ
Doktora
İngilizce
2023
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ALP ÜSTÜNDAĞ
- Incipient fault detection in wind turbines
Rüzgar türbinlerinde gelişmekte olan hata öngörüsü
AYŞE GÖKÇEN KAVAZ TAŞKINER
Doktora
İngilizce
2019
Enerjiİstanbul Teknik ÜniversitesiEnerji Bilim ve Teknoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BURAK BARUTÇU