Geri Dön

Belge benzerliği sonuçlarının nsga-ıı ile çok amaçlı optimizasyonu

Multi-objective optimization of document similarity results with(via) nsga-ii

  1. Tez No: 503872
  2. Yazar: HÜSEYİN AHMETOĞLU
  3. Danışmanlar: DOÇ. DR. RIDVAN SARAÇOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Van Yüzüncü Yıl Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 106

Özet

Sınıflandırma algoritmalarının başarı performanslarının artırımı, veri madenciliğinin önemli amaçları arasındadır. Bu tez çalışmasında, veri madenciliği sınıflandırma başarısının sezgisel yöntemlerle arttırılması incelenmiştir. Sınıflandırmada kullanılan eğitim veri seti hem benzerlik hesap sonuçları yönünden hem de sınıflandırma yeteneği yönünden optimize edilmiştir. Aynı sınıfta olan vektörlerin benzerlik sonuçlarının maksimize edilmesi, aynı zamanda farklı sınıftaki vektörlerin benzerlik sonuçlarının minimize edilmesi amaçlanmıştır. Bu çelişen iki durum için çok amaçlı sezgisel yöntemlerden olan, Sıralı Seçkin Bastırılamayan Genetik Algoritma (NSGA II) kullanılmıştır. Hatalı sınıflandırma oranlarının, optimizasyonun her iterasyonunda sıfıra daha çok yaklaştırılması hedeflenmiştir. Bu çalışmada veri madenciliğinin tüm aşamalarının sırayla gerçekleştirilmesine özen gösterilmiştir. Ham veriler işlenerek öznitelikler çıkarılmıştır. Boyut azaltma işlemleri için ise Temel Bileşen Analizi (PCA) kullanılmıştır. Veri setleri üzerinde K En Yakın Komşu Algoritması (KNN) kullanılarak yalın haldeki sınıflandırma başarıları ile optimizasyon sonrası sınıflandırma başarıları karşılaştırılmıştır. Optimizasyonun, eğitim veri setinin sınıflandırma yeteneğini arttırdığı görülmüştür. Optimize edilmiş veriler, eğitim kümesi olarak kullanıldığında sınıflandırma başarısında artış gözlemlenmiştir.

Özet (Çeviri)

Increasing performance of classification algorithms is one of the important goals of data mining. In this thesis study, it has been investigated how to increase the data mining classification success with heuristic methods. The training data set used in the classification is optimized in terms of the both similarity calculation results and the classification ability. It is aimed to maximize the similarity results of the vectors in the same class and at the same time to minimize the similarity results of the vectors in different classes. For these two contradictory cases, Non Sorting Genetic Algorithm II (NSGA II), which is a multipurpose heuristic method, is used. It is aimed to approximate the false classification ratios zero in each iteration of the optimization. In this study, care was taken in order to perform all phases of data mining in order. The raw data were processed and attributes were extracted. For size reduction operations, Principal Component Analysis (PCA) is used. Using the K Nearest Neighborhood (KNN) Algorithm on the data sets, the lean classification successes and the post-optimization classification successes are compared. Optimization has been shown to increase the ability to classify training data sets. An increase in classification success was observed when the optimized data were used as a training set.

Benzer Tezler

  1. Sürü zekâsı kullanarak renkli görüntü segmentasyon tekniklerinin geliştirilmesi

    Development of color image segmentation techniques using swarm intelligence

    TAHİR SAĞ

    Doktora

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MEHMET ÇUNKAŞ

  2. Normalleştirme ve genişletme yöntemleri kullanılarak bilgiye erişim sürecinin iyileştirilmesi

    Improving information retrieval process by normalization and expansion techniques

    ÖZLEM KARAGEDİK

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ATA ÖNAL

  3. Oyun motorlarının mimarı tasarım ve temsil süreçlerinde değerlendirilmesi

    Evaluation of game engines in architectural design and representation processes

    OSMAN SÜMER

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilim ve Teknolojiİstanbul Teknik Üniversitesi

    Bilişim Ana Bilim Dalı

    PROF. DR. MİNE ÖZKAR KABAKÇIOĞLU

  4. Kentsel doku ile otomobil bağımlılığı ilişkisinin sürdürülebilir ulaşım açısından değerlendirilmesi

    Evaluation of the relationship between urban pattern and car dependency in terms of sustainable urban mobility

    KÜBRA KALOŞ ERDOĞAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Şehircilik ve Bölge Planlamaİstanbul Teknik Üniversitesi

    Şehir ve Bölge Planlama Ana Bilim Dalı

    DOÇ. DR. HASAN SERDAR KAYA

  5. Text categorization based on semantic similarity with word2vector

    Word2vector ile semantik benzerliğe dayanan metin kategorizasyonu

    ATHER ABDULRAHEM MOHAMMEDSAED ALSAMURAI

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ABDÜL KADİR GÖRÜR