Karmaşık veri kümelerinin makine öğrenme algoritmaları üzerinde uygulanması
Implementation of machine learning algorithms on complex data sets
- Tez No: 487751
- Danışmanlar: PROF. DR. TUNCAY YİĞİT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2017
- Dil: Türkçe
- Üniversite: Süleyman Demirel Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 149
Özet
Günden güne sürekli artan veri miktarı ve çeşitliliği ile birlikte karmaşık veri ve büyük veri gibi kavramlar ortaya çıkmış, çözülmeye çalışılan problemler artık kodlanamayacak kadar karmaşık hale gelmiştir. Sonuçta geleneksel metotlar analiz ve çözümleme yapmak için yetersiz kaldığından makine öğrenme yöntemleri ortaya çıkmıştır. Yapay zekânın bir alt bilim dalı olarak kabul gören makine öğrenme yöntemleri, veri kümelerinden çıkarım yaparak algoritmaların kendi kendine öğrenme kabiliyetleri artırmak ve geleceğe yönelik veri odaklı öngörülerde bulunmak amacıyla kullanılmaktadır. Makine öğrenme algoritmaları böylece davranışlarını deneysel verilere dayanarak geliştirir. Yeni koşullara uyum sağlayan algoritmalar eğitimi tecrübeye dönüştürerek öğrenmeyi gerçekleştirir. Ancak probleme uygun çözüm ortamının hazırlanabilmesi için makine öğrenme algoritmaları ile ilgili yazılımların geliştirilmesi gerekmektedir. Makine öğrenme ile ilgili yapılan çalışmalar incelendiğinde yüksek performansta sonuçlar alınabildiği için danışmanlı makine öğrenmenin tercih edildiği, problemin ve veri kümesinin yapısına göre danışmanlı makine öğrenme algoritmalarının başarım performanslarının değişkenlik gösterdiği, aralarında bir üstünlük olmadığı ancak yapay sinir ağı ile genellikle daha iyi sonuçlar alındığı görülmektedir. Yapılan çalışmada geliştirilen bir uygulama yazılımı ile eğitim her seferinde rastgele örnekler üzerinden tekrarlanmış ve algoritmaların en iyi hata değerlerini elde etme olasılığı artırılarak algoritma tahmin başarımları birbirleriyle karşılaştırılmıştır. Eğitim yinelemesinin başlarında ortalama karesel hataların karekökü ve ortalama mutlak hata ölçütlerine göre algoritmaların hata değerleri yüksek iken yineleme sayısı arttıkça kullanılan algoritmalardan Naive Bayesian hariç diğer algoritmaların hata değerleri kabul edilebilir değerlere çekilerek 0,2'nin altında hata değerleri elde edilmiştir. Ayrıca yapay sinir ağı ile %0,21 ve lineer regresyon ile %0,45 gibi çok düşük oranlarda tahmin hata oranları elde edilmiş yani yüksek doğruluk oranlarına ulaşılmıştır.
Özet (Çeviri)
With the day by day increasing of amounts and diversity of the data, concepts such as complex data and big data have emerged and the problems being solved have become so complex that they can no longer be coded. As a result, machine learning methods have appeared because traditional methods are insufficient to test and analyze. Machine learning methods, which are accepted as a sub-branch of artificial intelligence, are used for the purposes of increasing the self learning capabilities of algorithms by deducing from data sets and providing data-oriented predictions for the future. Therefore, machine learning algorithms develop their behavior based on experimental data. Algorithms that adapt to the new conditions make learning by converting training into experience. However, in order to be prepared a suitable solution environment for the problem, it is necessary to develop software programs related to machine learning algorithms. When the studies on machine learning are examined, it is seen that supervised machine learning is preferred because of high performance results can be obtained, success performance of supervised machine learning algorithms varies according to the structure of the problem and data set, there is no superiority among them but generally better results are obtained with artificial neural network. With the application software developed in this study, training has been repeated every time through random samples and the algorithmic prediction performances have been compared with each other by having been increased the probability of obtaining the best error values of the algorithms. While the error values of the algorithms were high by the criteria of root mean squared error and mean absolute error at the beginning of the training iteration, when the number of iteration increased, the acceptable error values below 0.2 of the other used algorithms except Naive Bayesian have been obtained. In addition, prediction error rates have been obtained at a very low rate of 0,21% with artificial neural network and 0,45% with linear regression, that is, high accuracy rates have been achieved.
Benzer Tezler
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- Pre-release forecasting of imdb movie ratings using multi-view data
Gösterime girmemiş filmlerin ımdb puanının farklı özellik kümeleri kullanılarak tahmin edilmesi
BEYZA ÇİZMECİ
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ŞULE ÖĞÜDÜCÜ
- Prediction of COVID 19 disease using chest X-ray images based on deep learning
Derin öğrenmeye dayalı göğüs röntgen görüntüleri kullanarak COVID 19 hastalığının tahmini
ISMAEL ABDULLAH MOHAMMED AL-RAWE
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ADEM TEKEREK
- Design and deployment of deep learning based fuzzy logicsystems
Derin öğrenme tabanlı bulanık sistemlerin geliştirilmesi ve uygulanması
AYKUT BEKE
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
DOÇ. DR. TUFAN KUMBASAR
- An empirical investigation on improving fairness testing for machine learning models
Makine öğrenme modelleri için adalet testlerinin geliştirilmesi üzerine ampirik bir araştırma
UMUTCAN KARAKAŞ
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AYŞE TOSUN KÜHN