Çizgelerde etiket yayılımı ile belgelerin yarı eğitimli sınıflandırılması
Semi-supervised classification of documentsvia label propagation in graphs
- Tez No: 579584
- Danışmanlar: DOÇ. DR. MURAT CAN GANİZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Marmara Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 56
Özet
Doğal dil işleme alanının genel sorunlarından biri de kelimenin cümle içerisinde hangi anlamda kullanıldığının tespitidir. Makine öğrenmesi tabiri ile bu bir gözetimlisınıflandırma sorunudur. Buna alternatif olarak eğer elimizde çok az etiketli veri bulunuyorsa ve çok sayıda etiketsiz veri varsa yarı gözetimli sınıflandırıcılar kullanılabilir. Biz bu çalışmamızda kelime anlam ayrımı için en bilinen sınıflandırma algoritmalarından biri olan Label Propagation algoritmasını iyileştirmeyi amaçladık. Yaklaşımımız ise semantik diffusion kernel kullanmak olacaktır. Geliştirdiğimiz bu algoritmayı diffused label propagation algorithm (DILP) olarak adlandırdık. Algoritmamızı belirginleştirilmiş yapıda bulunan farklı boyutlardaki eğitim kümeleri ile denedik. Yaptığımız bu deneyler ile şu sorulara cevap vermeye çalıştık: 1. Ürettiğimiz semantic kernel formülü mevcut popüler kernellerden daha iyi performans sağlıyor mu? 2. Hangi koşullarda diğer kernellerden daha iyi sonuç vermektedir? 3. Ne tür regülasyon metodu daha iyi sonuç verir? Deneylerimiz sonucunda bazı koşullarda yaklaşımımızın daha iyi performans gösterdiği gözlemlenmiştir.
Özet (Çeviri)
Word sense disambiguation is the one of major natural language processing problems. It is used to identify the correct sense of a many sense word based on its context. In terms of machine learning, this can be considered as a supervised classification problem. A better alternative can be the use of semi-supervised classifiers since labeled data is usually scarce yet we can access large quantities of unlabeled textual data. We propose an improvement to Label Propagation which is a well-known transductive classification algorithm for word sense disambiguation. Our approach make use of a semantic diffusion kernel. We name this new algorithm as Diffused Label Propagation Algorithm (DILP). We evaluate our proposed algorithm with experiments utilizing various sizes of training sets of disambiguated corpora. Our experiments help us to answer the following questions: 1. Does our algorithm with semantic kernel formulation yield higher classification performance than the popular kernels? 2. Under which conditions does a kernel design perform better than others? 3. What kind of regularization methods result with better performance? Our experiments demonstrate that our approach can outperform baseline in terms of accuracy in several conditions.
Benzer Tezler
- Analysis of feature pattern mining approaches on social network: A case study on Facebook
Sosyal ağlarda özellik örüntü madenciliği yaklaşımlarının analizi: Facebook üzerinde durum çalışması
ELİFE ÖZTÜRK
Yüksek Lisans
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Yüksek Teknoloji EnstitüsüBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. SERAP ŞAHİN
- Kutsalından arındırılmış din: Helal gıda'nın ekonomi-politik analizi
Religion that had purified from its sacred: Politicial economy analysis of halal food
DENİZ PARLAK
Yüksek Lisans
Türkçe
2012
Siyasal BilimlerAkdeniz ÜniversitesiKamu Yönetimi Ana Bilim Dalı
PROF. DR. ALİ ÖZTEKİN
- Ortaokul temel ders kitaplarının eğitsel ve grafiksel açıdan değerlendirilmesi
Başlık çevirisi yok
AYŞE DÜNDAR
- Predicting informative spatio-temporal neurodevelopmental windows and gene risk for autism spectrum disorder
Otizm spektrum bozukluğu ̇için bilgi ̇verici zaman-uzamsal sinir gelişim aralığı ve gen riski tahmini
OĞUZHAN KARAKAHYA
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ABDULLAH ERCÜMENT ÇİÇEK
- Türkiye'de moda tasarımı eğitimi programlarının değerlendirilmesi ve Japonya-Hiroshima örneği
Başlık çevirisi yok
SIDIKA BİLGEN