Geri Dön

A filter-based feature selection method for web page classification

Web sayfası sınıflandırması için filtre-tabanlı nitelik seçim yöntemi

  1. Tez No: 414345
  2. Yazar: AYŞE YELTEKİN
  3. Danışmanlar: DOÇ. DR. SELMA AYŞE ÖZEL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2016
  8. Dil: İngilizce
  9. Üniversite: Çukurova Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 84

Özet

Bu çalışmada, Web sayfası sınıflandırma problemindeki sınıflayıcı doğruluğunu arttırmak ve sınıflandırma için gereken zamanı azaltmak amacıyla en iyi nitelikleri seçmek için filtre tabanlı yöntemler önerilmiştir. Kısmi sorgu genişletme algoritmalarında kullanılan sıralama kuralları ve IDF yöntemi kullanılarak seçilen en iyi niteliklerle Web sayfaları sınıflandırılmıştır. LibSvm, NaiveBayes Multinomial ve J48 sınıflayıcıları kullanılmıştır. Önerilen sıralama kuralı algoritmaları WebKB, Conference, Bank Search ve Syskill Webert veri kümeleri üzerinde test edilmiştir. Aynı zamanda önerilen sıralama kuralı tabanlı nitelik seçimi algoritmalarının performans değerlendirilmesi için popüler iki nitelik seçme tekniği olan Ki-kare (ChiSquare), ve Bilgi Kazancı (Information Gain) ile karşılaştırılması yapılmıştır. Bu çalışmada elde edilen deney sonuçları, Web sayfası sınıflandırmasında kısmi sorgu genişletmede kullanılan sıralama kuralı algoritmalarının nitelik seçiminde de başarılı olduğunu göstermiştir.

Özet (Çeviri)

In this study, filter based methods are proposed to select best features for Web page classification problem to improve accuracy and to reduce time required for classification. Web pages are classified by selecting the best features using Sort Orders at Partial Query Expansion algorithms and IDF method. LibSvm, NaiveBayes Multinomial and J48 classifiers are used. The proposed Sort Order algorithms are experimented on the WebKB, Conference, Bank Search and Syskill Webert datasets. The feature selection algorithms are also compared with the two most popular attribute selection methods that are Information Gain and ChiSquare to evaluate their performance. The experimental results of this study showed that, Sort Orders at Partial Query Expansion are good at with feature selection for Web page classification tasks.

Benzer Tezler

  1. Dimensionality reduction for web page classification

    Web sayfası sınıflandırması için boyut indirgenmesi

    MOHAMED BASSIROU CISSE

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇukurova Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    Assoc. Prof. Dr. SELMA AYŞE ÖZEL

  2. Kullanıcı tarayıcı geçmişine dayanarak müşteri yorumlarının özetlenmesi

    Personalized feature based summarization

    FATMA ZEHRA KAVASOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ŞULE GÜNDÜZ ÖĞÜDÜCÜ

  3. Öznitelik seçme teknikleri ve genetik algoritma kullanılarak etkin arapça metin sınıflandırması

    Efficient arabic text classification using feature selection techniques and genetic algorithm

    AHMED HASHIM KAREEM AL-DULAIMI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYalova Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MURAT OKKALIOĞLU

  4. Kamu spotlarının etkisinin EEG sinyalleri ölçümü ile değerlendirilmesi

    Studying with EEG signal measuring the impact of public spots

    ÇİĞDEM AFACAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilişim Teknolojileri Mühendisliği Ana Bilim Dalı

    PROF. DR. FATİH BAŞÇİFTÇİ

  5. Web ortamında coğrafi verilerin birlikte çalışabilirliğine yönelik yaklaşımların belirlenmesi: Ulaşım veri teması örneği

    Determining approaches for geo-data interoperability on the web: Transportation data theme example

    SERCAN ERHAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Coğrafyaİstanbul Teknik Üniversitesi

    Bilişim Ana Bilim Dalı

    DOÇ. DR. ARİF ÇAĞDAŞ AYDINOĞLU