Veri madenciliği süreci ve gerçek bir veri seti üzerinde uygulanması
Data mining process and an application of it on a sample data set
- Tez No: 270157
- Danışmanlar: YRD. DOÇ. DR. CANAN HAMURKAROĞLU
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2010
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 105
Özet
Veri tabanı büyüklüklerinin terabaytlarla ifade edildiği günümüzde verinin anlamlı bir şekilde ilişkilendirilebilmesi ve ?değerli veri?nin bu veritabanından çıkarılabilmesi için yeni yöntemlere ihtiyaç duyulmuş ve veri madenciliği kavramı ve süreci bu ihtiyaç sonunda ortaya çıkmıştır.Bu tez çalışmasında veri madenciliği sürecinin tarihçesi, OLAP ve istatistik gibi disiplinlerle ilişkisi açıklanmış olup süreç örneklerle detaylı olarak ele alınmış ve veri madenciliği yöntemleri ayrıntılı olarak incelenmiştir.Veri madenciliği yöntemleri sınıflandırma, kümeleme ve birliktelik kuralları ana başlıkları altında ele alınmış, karar ağacına ait ID3, C4.5, CART, k-en yakın komşuluk algoritmaları ve market sepet analizi örneklerle incelenmiştir.Uygulama bölümünde gerçek bir veri seti üzerinde Clementine programı kullanılarak veri madenciliği uygulaması yapılmış ve sonuçları yorumlanmıştır.
Özet (Çeviri)
Database size are expressed with terabytes today. In order to draw meaningful conclusions about the data which is ?valuable?, new techniques and methods are required and data mining process appeared for this necessity.In this thesis, history of data mining process, its relations with the disciplines such as OLAP and statistics are dealed with and data mining techniques are detailed with samples.Classification, desicion trees, clustering, association rules, market basket analyses are studied in detail with the algorithms ID3, C4.5, CART, k-NN (k nearest neighbour).In the last section, data mining application has been made on a real sample data set by using Clementine software.
Benzer Tezler
- Hastane veri tabanında bilgi keşfi
Knowledge discovery in hospital database
MERVE GÜLŞAH ULUSOY
Yüksek Lisans
Türkçe
2017
BiyoistatistikEge ÜniversitesiBiyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı
PROF. DR. SONER DUMAN
- Efficient estimation of Shrinkage parameters in fuzzy Ridge and fuzzy Liu regression models using α-cut-based methods under multicollinearity
Çoklu bağıntı durumunda bulanık Ridge ve bulanık Liu regresyon modellerinde α-kesim tabanlı yöntemler kullanılarak Shrinkage parametrelerinin etkin tahmini
AMMAR HOMAIDA
- Developing a process mining-based model for detecting patient safety errors in healthcare
Sağlık sektöründe, hasta güvenliğine yönelik hataların tespit edilmesinde süreç madenciliğine dayalı bir model geliştirilmesi
AHMET MURAT SÜMER
Doktora
İngilizce
2025
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. CEMİL CEYLAN
- Dizel makinanın makina öğrenmesi yöntemi kullanılarak modellenmesi ve karar-destek mekanizması oluşturulması
Machine learning method based marine diesel engine modelling and decision-support system setting
TOLGA ŞAHİN
Doktora
Türkçe
2022
Makine Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
PROF. DR. CEVAT ERDEM İMRAK
- Data-driven process mining for production line optimization using IIOT and big data technologies
IIOT ve büyük veri teknolojileri kullanılarak veri odaklı süreç madenciliği ile üretim hattı uygulaması
BEYZA YAPAKÇI
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiVeri Mühendisliği ve İş Analitiği Ana Bilim Dalı
PROF. DR. ALP ÜSTÜNDAĞ