A filter-based feature selection method for web page classification
Web sayfası sınıflandırması için filtre-tabanlı nitelik seçim yöntemi
- Tez No: 414345
- Danışmanlar: DOÇ. DR. SELMA AYŞE ÖZEL
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: İngilizce
- Üniversite: Çukurova Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 84
Özet
Bu çalışmada, Web sayfası sınıflandırma problemindeki sınıflayıcı doğruluğunu arttırmak ve sınıflandırma için gereken zamanı azaltmak amacıyla en iyi nitelikleri seçmek için filtre tabanlı yöntemler önerilmiştir. Kısmi sorgu genişletme algoritmalarında kullanılan sıralama kuralları ve IDF yöntemi kullanılarak seçilen en iyi niteliklerle Web sayfaları sınıflandırılmıştır. LibSvm, NaiveBayes Multinomial ve J48 sınıflayıcıları kullanılmıştır. Önerilen sıralama kuralı algoritmaları WebKB, Conference, Bank Search ve Syskill Webert veri kümeleri üzerinde test edilmiştir. Aynı zamanda önerilen sıralama kuralı tabanlı nitelik seçimi algoritmalarının performans değerlendirilmesi için popüler iki nitelik seçme tekniği olan Ki-kare (ChiSquare), ve Bilgi Kazancı (Information Gain) ile karşılaştırılması yapılmıştır. Bu çalışmada elde edilen deney sonuçları, Web sayfası sınıflandırmasında kısmi sorgu genişletmede kullanılan sıralama kuralı algoritmalarının nitelik seçiminde de başarılı olduğunu göstermiştir.
Özet (Çeviri)
In this study, filter based methods are proposed to select best features for Web page classification problem to improve accuracy and to reduce time required for classification. Web pages are classified by selecting the best features using Sort Orders at Partial Query Expansion algorithms and IDF method. LibSvm, NaiveBayes Multinomial and J48 classifiers are used. The proposed Sort Order algorithms are experimented on the WebKB, Conference, Bank Search and Syskill Webert datasets. The feature selection algorithms are also compared with the two most popular attribute selection methods that are Information Gain and ChiSquare to evaluate their performance. The experimental results of this study showed that, Sort Orders at Partial Query Expansion are good at with feature selection for Web page classification tasks.
Benzer Tezler
- Dimensionality reduction for web page classification
Web sayfası sınıflandırması için boyut indirgenmesi
MOHAMED BASSIROU CISSE
Yüksek Lisans
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇukurova ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
Assoc. Prof. Dr. SELMA AYŞE ÖZEL
- Kullanıcı tarayıcı geçmişine dayanarak müşteri yorumlarının özetlenmesi
Personalized feature based summarization
FATMA ZEHRA KAVASOĞLU
Yüksek Lisans
Türkçe
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ŞULE GÜNDÜZ ÖĞÜDÜCÜ
- Öznitelik seçme teknikleri ve genetik algoritma kullanılarak etkin arapça metin sınıflandırması
Efficient arabic text classification using feature selection techniques and genetic algorithm
AHMED HASHIM KAREEM AL-DULAIMI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYalova ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MURAT OKKALIOĞLU
- Kamu spotlarının etkisinin EEG sinyalleri ölçümü ile değerlendirilmesi
Studying with EEG signal measuring the impact of public spots
ÇİĞDEM AFACAN
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk ÜniversitesiBilişim Teknolojileri Mühendisliği Ana Bilim Dalı
PROF. DR. FATİH BAŞÇİFTÇİ
- Web ortamında coğrafi verilerin birlikte çalışabilirliğine yönelik yaklaşımların belirlenmesi: Ulaşım veri teması örneği
Determining approaches for geo-data interoperability on the web: Transportation data theme example
SERCAN ERHAN
Yüksek Lisans
Türkçe
2013
Coğrafyaİstanbul Teknik ÜniversitesiBilişim Ana Bilim Dalı
DOÇ. DR. ARİF ÇAĞDAŞ AYDINOĞLU