Geri Dön

Sınıflama ve regresyon ağaçları ve bir uygulama

Classification and regression trees and an application

  1. Tez No: 97662
  2. Yazar: GÜLHAYAT GÖLBAŞI
  3. Danışmanlar: PROF. DR. M. KEMAL YOĞURTÇUGİL
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Classification and Regression Trees, CART, Cross-validation, Splitting Rules
  7. Yıl: 2000
  8. Dil: Türkçe
  9. Üniversite: Mimar Sinan Güzel Sanatlar Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 166

Özet

ÖZET Sınıflama ve Regresyon Ağaçlan, her bir orta düğümünde sadece iki dala sahip, ikili karar ağacı algoritmasıdır. Sınıflama ağaçlan herhangi bir durumun veya nesnenin sınıf üyeliğini, bir veya daha fazla bağımsız değişkenden yararlanarak bulmaya çalışan istatistiksel bir süreçtir. Sınıflama ağaçlarında bağımsız değişken kategorik olmak zorundadır. Regresyon ağaçlarında ise bağımlı değişken sürekli olmalıdır. Regresyon ağaçlan sürekli bir bağımlı değişken için farklı aralıklar bulmaya çalışır. Bağımsız değişkenlerden yararlanarak, kişilerin veya nesnelerin bu aralıklardan hangisine düşeceğini bulmaya çalışır. Sınıflama ve Regresyon Ağaçlan algoritmasının amacı kategorik veya sürekli bir bağımlı değişken için tahmin yapmak ve bu tahminin açıklamasını bağımsız değişkenlerle yapmaktır. Bu yönüyle geleneksel istatistiksel yöntemler olarak bilinen, Diskriminant Analizi, Lojistik Regresyon, Kümeleme Analizi gibi yöntemlerle aynı işi yapmaktadır. Fakat Sınıflama ve Regresyon Ağaçlan Analizinin avantajı, veri yapısı hakkında hiçbir varsayımda bulunmamasıdır. Bu tezin amacı, Sınıflama ve Regresyon Ağaçlan hakkındaki teorik bilgileri vermek ve analizin performansım Diskriminant Analizi ile karşılaştırmaktır. Tezin taslağı şu şekildedir: Birinci ve ikinci bölümde ağaç yapısı hakkında bilgi ve formül verilmiştir ; Üçüncü bölümde Doğru boyutlandınlmış ağaçlar ve güvenilir tahminler hakkında bilgi verilmiştir ; Dördüncü bölümde Ayırma kurallan anlatılmıştır; Beşinci bölümde Regresyon ağaçlan anlatılmıştır ; Altıncı bölümde Bayes kurallan ve dağılımı anlatılmıştır ; Yedinci bölümde Optimal budama anlatılmıştır, Sekizinci bölümde Herhangi bir örnekten bir ağacın yapılandınlması anlatılmıştır ; Dokuzuncu bölümde yapılan uygulama ve sonuçlarından bahsedilmiştir ; Onuncu bölümde ise uygulamalardan çıkan sonuçların yorumu yapılmış ve uygulamada kullanılan iki yöntem olan CART ve Diskriminant Analizi sonuçlan karşılaştınlmıştır. Uygulama için ortaokul öğrencileri ile anket yapılmış ve öğrencilerin not ortalamalan bağımlı değişken olarak kullanılmıştır. Sonuçta CART, Diskriminant analizinden daha başarılı sonuçlar vermiştir. Anahtar Kelimeler : Sınıflama ve Regresyon Ağaçlan, CART, Çapraz-geçerlilik, Ayırma IV

Özet (Çeviri)

ABSTRACT Classification and Regression Tree, CART, is a binary decision tree algorithm, which has exactly two branches at each internal node. Classification trees are statistical procedures that produce prediction algorithms for dichotomous outcomes (i.e., presence or absence of a condition). Classification trees are used to predict membership of cases or objects in the classes of a categorical dependent variable from their measurements on one or more predictor variables. Classification tree analysis is one of the main techniques used in so-called Data Mining. Since dependent variable is continious, classification trees algorithm is called Regression Trees. Regression Trees finds several intervals for dependent variable. The goal of Classification and Regression Trees is to predict or explain responses on categorical or continious dependent variable, and as such, the available techniques have much in common with the techniques used in the more traditional methods of Discriminant Analysis, Cluster Analysis, Nonparametric Statistics and Nonlinear Estimation. The flexibility of classification trees make them a very attractive analysis option, but this is not to say that their use is recommended to the exclusion of more traditional methods. The purpose of this thesis is to give theoretical informations about Classification and Regression Trees and compare their performance with Discriminant Analysis. The layout of this thesis is, as follows in Chapters 1 and 2; Tree structured methodology in classification, in Chapter 3 ; Right sized trees and honest estimates, in Chapter 4 ; Splitting Rules, in Chapter 5 ; Regression Trees, in Chapter 6 ; Bayes rules and partitions, in Chapter 7 ; Optimal pruning,, in Chapter 8 ; Construction of trees from a learning sample, in Chapter 9 ; Application, in Chapter 10 ; Conclusion and Discussion. As an application, A survey has been made on secondory school students. The survey results have been used to compare CART and Discriminant Analysis.

Benzer Tezler

  1. Finansal başarısızlık ve finansal başarısızlığın tahmini: Hisse senetleri İstanbul Menkul Kıymetler Borsasında işlem gören sınai işletmeler üzerinde bir uygulama

    Financial failure and prediciton of financial failure: An application on industry companies trading in Istanbul Stock Exchange

    ÜMİT DOĞRUL

    Yüksek Lisans

    Türkçe

    Türkçe

    2009

    İşletmeMersin Üniversitesi

    İşletme Bölümü

    DOÇ. DR. AYŞE GÜL YILGÖR

  2. Şirket küçülme stratejileri ve küçülme stratejilerinin işletme performansı açısından değerlendirilmesi: Hisse senetleri İstanbul Menkul Kıymetler Borsasında işlem gören işletmeler üzerinde bir uygulama

    Downsizing strategies and an analysis of downsizing strategies from the perspective of business performance: An application on companies trading in Istanbul Stock Exchange

    ASLI YIKILMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    İşletmeMersin Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. AYŞE GÜL YILGÖR

  3. Lojistik regresyon ve CART analizi teknikleriyle Sosyal Güvenlik Kurumu İlaç Provizyon Sistemi verileri üzerinde bir uygulama

    An application on Pharmacy Provision System data of Social Security Institution by logistic regression and CART analysis technics

    ZEYNEP BURCU KIRAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    İstatistikGazi Üniversitesi

    İstatistik Ana Bilim Dalı

    YRD. DOÇ. DR. NECLA GÜNDÜZ TEKİN

  4. Sıralı lojistik regresyon ve sınıflandırma ağaçlarının performans karşılaştırması

    Performance comparison between ordinal logistic regression and classification tree

    SİMAY MİRGEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    İstatistikEskişehir Teknik Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. BETÜL KAN KILINÇ

  5. İşletmelerde finansal başarısızlık tahmininde veri madenciliği yöntemlerinin karşılaştırılması: BIST'de bir uygulama

    A comparison of data mining methods in financial failure prediction of businesses: An application in BIST

    BARIŞ AKSOY

    Doktora

    Türkçe

    Türkçe

    2018

    İşletmeErciyes Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. DERVİŞ BOZTOSUN