Dengesiz bal peteği veri setinde sınıflandırma performansının analizi
Analysis of classification performance on imbalanced honeycomb dataset
- Tez No: 762182
- Danışmanlar: DOÇ. DR. MEHMET AKİF ŞAHMAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Selçuk Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 57
Özet
Arıcılık faaliyetleri Türkiye ve Dünya için önemli bir tarımsal faaliyettir. Arıcılık, Türkiye' deki kırsal kesimlerin kalkınmasına katkısı nedeniyle sosyo-ekonomik anlamda önem arz etmektedir. Ayrıca arıcılık faaliyetleri sonucunda üretilen ürünler insanlar için önemli besin kaynaklarıdır. Bu nedenle arıcılık faaliyetlerinde doğru yöntemlerin kullanılması arıcılık faaliyetlerinin sürdürülebilirliği için önemlidir. Üreticiler tarafından bilinçsiz ve gerekli teknikler kullanılmadan gerçekleştirilen arıcılık faaliyetleri, elde edilecek ürünlerin kalitesini ve verimini negatif yönde etkilemektedir. Bal, arıcılık faaliyetleri sonucunda elde edilen en önemli çıktılardan birisidir. Bal üretim sürecinde birçok aşama yer almaktadır. Bu aşamalardan biri de bal hasadı aşamasıdır. Bal hasadı aşamasında doğru yöntem ve tekniklerden faydalanılması üretilen bal miktarını ve kalitesini arttırmaktadır. Ayrıca bilinçli arıcılık faaliyetleri yersiz yavru arı kayıplarından kaçınılarak, arı kolonisi varlığının korunmasında da etkilidir. Bu tez çalışmasında, bal hasadındaki yavru arı kayıplarını azaltmak için bal peteği üzerinde 'kapalı larva hücrelerinin' tespiti bir sınıflandırma problemi olarak ele alınmıştır. Çalışmada 38 adet bal peteği görüntüsünden faydalanılarak veriseti oluşturulmuştur. Verisetinde kapalı larva hücreleri ve diğerleri olmak üzere iki sınıf için etiketle yapılmıştır. Veri setindeki etiketlenmiş iki sınıfa ait veri oranının yaklaşık 1/5 olduğu görülmüştür. Sınıflar arasındaki dengesizliğin giderilerek sınıflandırma başarısını arttırmak istenmiştir. Bunun için literatürde iyi bilinen ve güncel beş farklı veri düzeyinde aşırı örnekleme (SMOTE, Borderline-SMOTE1, Borderline-SMOTE2, Safe-Level-SMOTE ve DEBOHID) yaklaşımdan faydalanılmıştır. Dengelenmiş veriler üzerindeki sınıflandırma başarısını göstermek için üç farklı sınıflandırıcıdan (K- En Yakın Komşu (kNN), Karar Ağacı(KA) ve Destek Vektör Makineleri (DVM)) faydalanmıştır. Sınıflandırma sonuçları F1-Skor, G-Ortalama ve AUC metrikleri ile değerlendirilmiştir. Sınıflandırma işlemleri sonucunda sentetik veri üretme yöntemleri ile dengeli hale getirilen veri setlerinde sınıflandırma başarısının arttığı görülmüştür.
Özet (Çeviri)
Beekeeping activities are an important agricultural activity for Turkey and the World. Beekeeping is important in socio-economic terms due to its contribution to the development of rural areas in Turkey. In addition, the products produced as a result of beekeeping activities are important food sources for humans. For this reason, using the right methods in beekeeping activities is important for the sustainability of beekeeping activities. Beekeeping activities carried out by the producers unconsciously and without using the necessary techniques negatively affect the quality and yield of the products to be obtained. Honey is one of the most important outputs obtained as a result of beekeeping activities. There are many stages in the honey production process. One of these stages is the honey harvest stage. Utilizing the right methods and techniques during honey harvesting increases the amount and quality of honey produced. In addition, conscious beekeeping activities are also effective in preserving the existence of the bee colony by avoiding unnecessary baby bee losses. In this thesis, the detection of 'closed larval cells' on the honeycomb is considered as a classification problem in order to reduce the loss of baby bees in honey harvest. In the study, a dataset was created by using 38 honeycomb images. The dataset was constructed with labels for two classes, closed larval cells and others. It was seen that the data ratio of the two labeled classes in the data set was 1/5. It was aimed to increase the classification success by eliminating the imbalance between the classes. For this, five different data-level oversampling approaches (SMOTE, Borderline-SMOTE1, Borderline-SMOTE2, Safe-Level-SMOTE and DEBOHID) that are well-known and current in the literature were used. Three different classifiers (K-Nearest Neighbor (kNN), Decision Tree and Support Vector Machines (DVM)) were used to show the classification success on balanced data. Classification results were evaluated with F1-Score, G-Mean and AUC metrics. As a result of the classification processes, it was observed that the classification success increased in the data sets that were balanced with synthetic data generation methods.
Benzer Tezler
- Karma spin (1, 5/2) Ising sisteminin dengeli ve dengesiz davranışları
Equilibrium and nonequilibrium behaviors of the mixed spin (1, 5/2) Ising system
MEHMET BATI
Yüksek Lisans
Türkçe
2009
Fizik ve Fizik MühendisliğiErciyes ÜniversitesiFizik Bölümü
PROF. DR. MUSTAFA KESKİN
- Küresel terör ve alternatif mücadele yöntemleri
Global terror and alternative combating methods
SERKAN TAŞĞIN
Yüksek Lisans
Türkçe
2007
Siyasal BilimlerPolis AkademisiUluslararası Polislik Çalışmaları Ana Bilim Dalı
DOÇ. DR. İHSAN BAL
- İstanbul il merkezindeki ortaokullarda öğrenim gören öğrencilerin kahvaltı alışkanlıkları üzerine bir araştırma
A research on breakfast habits of the students studying in secondary schools in İstanbul province
ÖZGENUR SAVAŞAN
Yüksek Lisans
Türkçe
2019
Beslenme ve DiyetetikSelçuk ÜniversitesiÇocuk Gelişimi ve Ev Yönetimi Eğitimi Ana Bilim Dalı
PROF. DR. DİDEM ÖNAY DERİN
- Sürdürülebilir kalkınma çerçevesinde çevre sorunlarıyla mücadele aracı olarak kirlilik izinleri piyasasının etkinliği
The efficiency of pollution permit market as an instrument for combating environmental problems within the sustainable development
HASAN ÇEBİ BAL
- The Estimators of random coefficient models
Stokastik katsayılı modeller için tahmin yöntemleri
YASEMİN BAL GÜNDÜZ
Doktora
İngilizce
1999
Ekonomiİhsan Doğramacı Bilkent ÜniversitesiEkonomi Ana Bilim Dalı
PROF. DR. ASAD ZAMAN