Ağırlıklı çoklu sınıflandırıcı kullanarak biyolojik verilerin tahmini
Prediction of biological data by using weighted ensemble classifiers
- Tez No: 350359
- Danışmanlar: YRD. DOÇ. DR. TANSEL ÖZYER
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2013
- Dil: Türkçe
- Üniversite: TOBB Ekonomi ve Teknoloji Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 81
Özet
Kanser, günümüzde çok yaygın olarak rastlanılan tedavisi zor olan bir hastalıktır. Göğüs kanseri, akciğer kanseri, merkezi sinir sistemi kanseri ve lösemi başta olmak üzere birçok çeşidi bulunmaktadır. Bunlar, vücuttaki farklı gen dizilimlerindeki hatalardan dolayı oluşmaktadır. Bu hastalık türlerinin tedavi edilebilmeleri için erken teşhis önemlidir. Başka bir deyişle, genler dizilimlerinin doğru anlamlandırılması anlamına gelmektedir. Günümüzde mikro çip teknolojisi ile geniş çaplı gen sınıflandırılması mümkündür. DNA mikroçip, aynı anda, farklı seviyelerde genlerin durumlarını sunar. Geçmiş çalışmalar, mikroçip teknolojisinin tümör sınıflandırmasında da çok etkili olduğunu göstermektedir. İlgili veri setleri fazla özniteliğe sahip olmalarına rağmen, az örnek bulundururlar. Geçmiş yıllarda, farklı sınıflandırıcı yöntemleri geliştirilmiştir. Yöntemler, veri setlerine bağımlı olarak farklı doğruluk oranlarına sahip olabilirler. Bu da bir sınıflandırıcının, bütün veri setlerinde aynı etkinlikte çalışamayacağı anlamına gelmektedir. Bir veri seti için; birden çok sınıflandırıcı kullanıp bir topluluk oluşturarak, sınıflandırıcı doğruluğunu arttırmak ve yanlış sınıflandırıcı seçme olasılığını azaltmak hedeflenmiştir. Yaygın kullanımda sınıflandırıcı topluluğu, birçok sınıflandırıcının bireysel performanslarına bakılarak ortak bir karar mekanizması yaratmak ve daha önce tanımlanmamış örnekleri bu karar mekanizması ile sınıflandırılması için kullanılır. Sınıflandırıcı topluluk oluşturma, sadece mikroçip veri setlerini sınıflandırmanın yanı sıra, görüntü işleme, yapay zekâ ve tıp gibi birçok alanda da kullanılmaktadır. Bu tez çalışmasında, literatürde bulunan yirmi dokuz sınıflandırıcı kullanaarak, veri setlerine özel sınıflandırıcı topluluklar oluşturulmuştur. Ayrıca oluşturulan topluluktaki her bir sınıflandırıcıya ağırlıklar atanmıştır. Bu sayede, sınıflandırmanın doğruluğunun arttırılması amaçlanmıştır. Sınıflandırıcı topluluğu oluşturmak için iki seviyeli genetik algoritma kullanılarak yeni bir metot geliştirilmiştir. İki seviyeli genetik algoritmanın ilk seviyesinde sınıflandırıcılar seçilmiş, ikinci seviyesinde ise, bu sınıflandırıcılara uygun ağırlıklar atanmıştır. Önerilen yöntem ile alınan sonuçlar, diğer yöntemlerle elde edilen sonuçlardan üstündür.
Özet (Çeviri)
Nowadays, cancer disease is rapidly spreading and it is difficult to treat. There are different types of cancer such as breast, lung, central nervous system, leukemia and many more. Each type consists of different sequence error in the gene syntax in the body. In order to treat them, early diagnosis is mandatory, It means that gene sequences must be interpreted in a smart and accurate way. Genome wide scale data classification has been triggered by the microarray technologies. A DNA microarray can have different expression levels of genes simultaneously. Past studies indicate that microarray technology can provide means for tumor classification. Related datasets contain small number of samples; the number of genes is extremely larger than the number of samples and these make knowledge discovery challenging in microarray. For this reason, different classification methods were proposed. However, classifiers' performance results may be dataset dependent. While the classification accuracy of one classifier can make high accuracy for some dataset, it may give poor accuracy for another. That means, there is no perfect classifier works for all datasets robustly. Regardless of selecting one classification approach, ensemble classifiers approach is proposed. It combines each individual classifier prediction in the pool to create joint decision-rules and classify unknown samples according to this decision rules. Ensemble classifiers is being used in many image processing, artificial intelligence and medical fields as well. In this thesis, I worked on creating an ensemble classifiers method that chooses best classifier combination in the classifier pool. I focused on twenty nine different classifiers in literature to selection each having different weights based on their past performance. A two level genetic algorithm is used to create ensemble classifiers. In this proposed method, the first level determines the classifiers to use; the second level optimizes their weights for effectiveness. The results of this study are promising when compared to other methods.
Benzer Tezler
- GOOWE-ML: A novel online stacked ensemble for multi-label classification in data streams
GOOWE ML: Veri akışlarında çok-etiketli sınıflandırma için yeni bir üst-öğrenicili çoklu-sınıflandırıcı
ALİCAN BÜYÜKÇAKIR
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. FAZLI CAN
- GOOWE: Geometrically optimum and online-weighted ensemble classifier for evolving data streams
GOOWE: Değişen veri akışları için geometrik açıdan optimum ağırlıklı çevrim içi çoklu sınıflandırıcı
HAMED REZANEJAD ASL BONAB
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. FAZLI CAN
- Heart disease system prediction using data mining techniques
Veri madenciliği teknikleri kullanarak kalp hastalığı sitemi tahmini
MOHAMMED IBRAHIM MAHDI AL-AZZAWI
Yüksek Lisans
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTürk Hava Kurumu ÜniversitesiBilgi Teknolojileri Ana Bilim Dalı
YRD. DOÇ. DR. YURIY ALYEKSYEYENKOV
- Mikroşebekelerde ada mod çalışmanın tespiti ve güç kalitesi olaylarının sınıflandırılması için yapay zekâ tabanlı kontrol yöntemlerinin geliştirilmesi
Development of artificial intelligence based control methods for detection of islanding conditions and classification of power quality events in microgrids
ALPER YILMAZ
Doktora
Türkçe
2023
Elektrik ve Elektronik MühendisliğiBursa Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÖKAY BAYRAK
- Derin öğrenme ve büyük veri analitiği yöntemleriKullanarak Covid-19 yayılımının ileriye dönük tahmini
Forecasting the spread of covid-19 using deep learning and big data analytics methods
CYLAS KIGANDA
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. MUHAMMET ALİ AKCAYOL