Veri madenciliği uygulamaları için veri indirgeme algoritmalarının geliştirilmesi ve resim madenciliğine uygulanması
Development of data reduction algorithms for data mining applications and implementation of these algorithms to image mining
- Tez No: 409820
- Danışmanlar: DOÇ. DR. NİHAT YILMAZ
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Science and Technology, Engineering Sciences
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2015
- Dil: Türkçe
- Üniversite: Selçuk Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 184
Özet
Teknolojinin ilerlemesi ve yaygınlaşmasıyla birlikte çok sayıda veri üretilmekte ve depolanmaktadır. Genelde kendi başlarına değersiz olan bu verilerin hızlı bir şekilde analiz edilerek anlamlı bilgilere dönüştürülmesi gerekir. Veriler büyüdükçe, verilerin tutarlılığı bozulmaya başlamış, içinde gürültü diye tabir edilen tutarsız ve yanlış veri miktarı artmaya başlamıştır. Bu gürültülü veriler, anlamlı bilgiye ulaşılmasını güçleştirmekte, bazı durumlarda imkânsız hale getirmektedir. Bu tez çalışmasında, özellikle medikal ve endüstriyel alandaki görüntü verileri üzerinde veri madenciliği ve sınıflama işlemlerinde kullanılacak verilerin analizinde karşılaşılan gürültülü, yanlış elde edilmiş ve sınıflanmış verilerin elenmesi, daha az nitelikle bilgiyi daha hızlı bir şekilde elde etmeyi amaçlayan sistemler geliştirilmiştir. Gürültülü verilerin elenmesinde, kümeleme algoritmalarından olan k-ortalamalar algoritması kullanılmış ve geliştirilmiştir. Sınıflama işlemlerinde güvenirliliği artırmak için kullanılan k-kat çaprazlama doğrulama algoritması tüm eğitme süreçlerine entegre edilmiştir. Niteliklerin azaltılması işleminde ise birliktelik algoritmalarından Apriori algoritması ve verinin en önemli karakteristik niteliklerini tespit eden Temel Bileşen Analizi (TBA) birleştirilerek oluşturulan hibrid bir sistem ile daha az nitelikle yararlı bilginin elde edilmesi sağlanmıştır. Geliştirilen bu sistemler literatürde yaygın olarak kullanılan veri kümeleriyle test edilmiş ve elde edilen yüksek başarı değerleri literatürdeki sonuçlarla karşılaştırılmıştır. Ayrıca endüstride yüksek hızlı termal transfer yazıcılarda kullanılan yazıcı başlıklarının termal hücre arızalarının miktarını özel tasarlanmış bir mikroskop sistemi ile elde edilen görüntülerinden tespit eden bir sistem geliştirilmiştir. Bu sistemin başarısının artırılması amacıyla gürültülü verilerin elenmesinde geliştirdiğimiz algoritmalar uygulanmış ve sistemin başarısının yükseldiği gözlenmiştir.
Özet (Çeviri)
By the advancement and spread of technology, lots of data are produced and stored. These data, usually worthless by themselves, must be quickly analyzed and transformed into meaningful information. As the data expands, its consistency started to be deteriorated, and the amount of inconsistent and incorrect data inside it, which is called as“noise”, began to increase. The noise makes it difficult and in some cases impossible to reach meaningful information. In this thesis study, in order to eliminate the noisy data that is untruly gotten and classified, which is met in the analysis of data used in data mining and classification especially on image data in the medical and industrial fields, it is developed the systems that aim at getting less information more quickly. In the elimination of noisy data, it is used and developed K-means algorithm, which is one of the clustering algorithms. K-fold cross-validation algorithm, which is used to increase reliability in the classification operations, is integrated in all training processes. In the process of data reduction, it is ensured to achieve less information by a hybrid system formed by the union of Apriority Algorithm, which is one of the integration algorithms, and Principal Component Analysis (PCA), which determines the most important characteristics of data. The systems developed are tested by the data clusters that are commonly used in the literature, and the high values of success obtained are compared to the other conclusions in the literature. In addition, it is developed a system that determines the amount of thermal cell failures of print heads, which are used in the high-speed thermal transfer printers in the industry, by the images that get via a special-designed microscope system. The success of the system is boosted by the method that we develop to eliminate the noisy data by the aim of strengthening the success of this system.
Benzer Tezler
- Comparison of data reduction algorithms for biomedical applications
Biyomedikal uygulamalar için veri azaltılması algoritmalarının karşılaştırılması
THIBAUT JUDICAEL BAH
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. BEKİR KARLIK
- TÜİK yaşam memnuniyeti anketleri üzerine veri madenciliği uygulaması
The application of data mining upon the questionaires of TÜİK on life satisfaction
SERKAN DEMİRCAN
Yüksek Lisans
Türkçe
2015
Endüstri ve Endüstri MühendisliğiErciyes ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. SİNEM KULLUK
- Veri madenciliği tekniklerini kullanarak imalat verilerinin modellenmesi ve analizi
Modeling and analysing manufacturing data with data mining techniques
ESRA KAHYA ÖZYİRMİDOKUZ
- Sağlık bilimlerinde veri ön işleme
Data preprocessing in health sciences
SEDA TAŞ
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul ÜniversitesiEnformatik Ana Bilim Dalı
PROF. DR. SEVİNÇ GÜLSEÇEN
- Veri madenciliği yöntemleri ile bilgi merkezi verilerinden bilgi keşfi
Discovering knowledge in information centers data with data mining methods
SEFA BAYRAKTAR
Yüksek Lisans
Türkçe
2024
Bilgi ve Belge YönetimiBurdur Mehmet Akif Ersoy ÜniversitesiYönetim Bilişim Sistemleri Ana Bilim Dalı
PROF. DR. İSMAİL KIRBAŞ