Geri Dön

Dengesiz bal peteği veri setinde sınıflandırma performansının analizi

Analysis of classification performance on imbalanced honeycomb dataset

  1. Tez No: 762182
  2. Yazar: SERKAN ÖZGÜN
  3. Danışmanlar: DOÇ. DR. MEHMET AKİF ŞAHMAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Selçuk Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 57

Özet

Arıcılık faaliyetleri Türkiye ve Dünya için önemli bir tarımsal faaliyettir. Arıcılık, Türkiye' deki kırsal kesimlerin kalkınmasına katkısı nedeniyle sosyo-ekonomik anlamda önem arz etmektedir. Ayrıca arıcılık faaliyetleri sonucunda üretilen ürünler insanlar için önemli besin kaynaklarıdır. Bu nedenle arıcılık faaliyetlerinde doğru yöntemlerin kullanılması arıcılık faaliyetlerinin sürdürülebilirliği için önemlidir. Üreticiler tarafından bilinçsiz ve gerekli teknikler kullanılmadan gerçekleştirilen arıcılık faaliyetleri, elde edilecek ürünlerin kalitesini ve verimini negatif yönde etkilemektedir. Bal, arıcılık faaliyetleri sonucunda elde edilen en önemli çıktılardan birisidir. Bal üretim sürecinde birçok aşama yer almaktadır. Bu aşamalardan biri de bal hasadı aşamasıdır. Bal hasadı aşamasında doğru yöntem ve tekniklerden faydalanılması üretilen bal miktarını ve kalitesini arttırmaktadır. Ayrıca bilinçli arıcılık faaliyetleri yersiz yavru arı kayıplarından kaçınılarak, arı kolonisi varlığının korunmasında da etkilidir. Bu tez çalışmasında, bal hasadındaki yavru arı kayıplarını azaltmak için bal peteği üzerinde 'kapalı larva hücrelerinin' tespiti bir sınıflandırma problemi olarak ele alınmıştır. Çalışmada 38 adet bal peteği görüntüsünden faydalanılarak veriseti oluşturulmuştur. Verisetinde kapalı larva hücreleri ve diğerleri olmak üzere iki sınıf için etiketle yapılmıştır. Veri setindeki etiketlenmiş iki sınıfa ait veri oranının yaklaşık 1/5 olduğu görülmüştür. Sınıflar arasındaki dengesizliğin giderilerek sınıflandırma başarısını arttırmak istenmiştir. Bunun için literatürde iyi bilinen ve güncel beş farklı veri düzeyinde aşırı örnekleme (SMOTE, Borderline-SMOTE1, Borderline-SMOTE2, Safe-Level-SMOTE ve DEBOHID) yaklaşımdan faydalanılmıştır. Dengelenmiş veriler üzerindeki sınıflandırma başarısını göstermek için üç farklı sınıflandırıcıdan (K- En Yakın Komşu (kNN), Karar Ağacı(KA) ve Destek Vektör Makineleri (DVM)) faydalanmıştır. Sınıflandırma sonuçları F1-Skor, G-Ortalama ve AUC metrikleri ile değerlendirilmiştir. Sınıflandırma işlemleri sonucunda sentetik veri üretme yöntemleri ile dengeli hale getirilen veri setlerinde sınıflandırma başarısının arttığı görülmüştür.

Özet (Çeviri)

Beekeeping activities are an important agricultural activity for Turkey and the World. Beekeeping is important in socio-economic terms due to its contribution to the development of rural areas in Turkey. In addition, the products produced as a result of beekeeping activities are important food sources for humans. For this reason, using the right methods in beekeeping activities is important for the sustainability of beekeeping activities. Beekeeping activities carried out by the producers unconsciously and without using the necessary techniques negatively affect the quality and yield of the products to be obtained. Honey is one of the most important outputs obtained as a result of beekeeping activities. There are many stages in the honey production process. One of these stages is the honey harvest stage. Utilizing the right methods and techniques during honey harvesting increases the amount and quality of honey produced. In addition, conscious beekeeping activities are also effective in preserving the existence of the bee colony by avoiding unnecessary baby bee losses. In this thesis, the detection of 'closed larval cells' on the honeycomb is considered as a classification problem in order to reduce the loss of baby bees in honey harvest. In the study, a dataset was created by using 38 honeycomb images. The dataset was constructed with labels for two classes, closed larval cells and others. It was seen that the data ratio of the two labeled classes in the data set was 1/5. It was aimed to increase the classification success by eliminating the imbalance between the classes. For this, five different data-level oversampling approaches (SMOTE, Borderline-SMOTE1, Borderline-SMOTE2, Safe-Level-SMOTE and DEBOHID) that are well-known and current in the literature were used. Three different classifiers (K-Nearest Neighbor (kNN), Decision Tree and Support Vector Machines (DVM)) were used to show the classification success on balanced data. Classification results were evaluated with F1-Score, G-Mean and AUC metrics. As a result of the classification processes, it was observed that the classification success increased in the data sets that were balanced with synthetic data generation methods.

Benzer Tezler

  1. Karma spin (1, 5/2) Ising sisteminin dengeli ve dengesiz davranışları

    Equilibrium and nonequilibrium behaviors of the mixed spin (1, 5/2) Ising system

    MEHMET BATI

    Yüksek Lisans

    Türkçe

    Türkçe

    2009

    Fizik ve Fizik MühendisliğiErciyes Üniversitesi

    Fizik Bölümü

    PROF. DR. MUSTAFA KESKİN

  2. Küresel terör ve alternatif mücadele yöntemleri

    Global terror and alternative combating methods

    SERKAN TAŞĞIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2007

    Siyasal BilimlerPolis Akademisi

    Uluslararası Polislik Çalışmaları Ana Bilim Dalı

    DOÇ. DR. İHSAN BAL

  3. İstanbul il merkezindeki ortaokullarda öğrenim gören öğrencilerin kahvaltı alışkanlıkları üzerine bir araştırma

    A research on breakfast habits of the students studying in secondary schools in İstanbul province

    ÖZGENUR SAVAŞAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Beslenme ve DiyetetikSelçuk Üniversitesi

    Çocuk Gelişimi ve Ev Yönetimi Eğitimi Ana Bilim Dalı

    PROF. DR. DİDEM ÖNAY DERİN

  4. Sürdürülebilir kalkınma çerçevesinde çevre sorunlarıyla mücadele aracı olarak kirlilik izinleri piyasasının etkinliği

    The efficiency of pollution permit market as an instrument for combating environmental problems within the sustainable development

    HASAN ÇEBİ BAL

    Doktora

    Türkçe

    Türkçe

    2012

    EkonomiGazi Üniversitesi

    İktisat Ana Bilim Dalı

    DOÇ. DR. MÜSLÜME NARİN

  5. The Estimators of random coefficient models

    Stokastik katsayılı modeller için tahmin yöntemleri

    YASEMİN BAL GÜNDÜZ

    Doktora

    İngilizce

    İngilizce

    1999

    Ekonomiİhsan Doğramacı Bilkent Üniversitesi

    Ekonomi Ana Bilim Dalı

    PROF. DR. ASAD ZAMAN