Geri Dön

Çizgelerde etiket yayılımı ile belgelerin yarı eğitimli sınıflandırılması

Semi-supervised classification of documentsvia label propagation in graphs

  1. Tez No: 579584
  2. Yazar: GÖKHAN KOCAMAN
  3. Danışmanlar: DOÇ. DR. MURAT CAN GANİZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Marmara Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 56

Özet

Doğal dil işleme alanının genel sorunlarından biri de kelimenin cümle içerisinde hangi anlamda kullanıldığının tespitidir. Makine öğrenmesi tabiri ile bu bir gözetimlisınıflandırma sorunudur. Buna alternatif olarak eğer elimizde çok az etiketli veri bulunuyorsa ve çok sayıda etiketsiz veri varsa yarı gözetimli sınıflandırıcılar kullanılabilir. Biz bu çalışmamızda kelime anlam ayrımı için en bilinen sınıflandırma algoritmalarından biri olan Label Propagation algoritmasını iyileştirmeyi amaçladık. Yaklaşımımız ise semantik diffusion kernel kullanmak olacaktır. Geliştirdiğimiz bu algoritmayı diffused label propagation algorithm (DILP) olarak adlandırdık. Algoritmamızı belirginleştirilmiş yapıda bulunan farklı boyutlardaki eğitim kümeleri ile denedik. Yaptığımız bu deneyler ile şu sorulara cevap vermeye çalıştık: 1. Ürettiğimiz semantic kernel formülü mevcut popüler kernellerden daha iyi performans sağlıyor mu? 2. Hangi koşullarda diğer kernellerden daha iyi sonuç vermektedir? 3. Ne tür regülasyon metodu daha iyi sonuç verir? Deneylerimiz sonucunda bazı koşullarda yaklaşımımızın daha iyi performans gösterdiği gözlemlenmiştir.

Özet (Çeviri)

Word sense disambiguation is the one of major natural language processing problems. It is used to identify the correct sense of a many sense word based on its context. In terms of machine learning, this can be considered as a supervised classification problem. A better alternative can be the use of semi-supervised classifiers since labeled data is usually scarce yet we can access large quantities of unlabeled textual data. We propose an improvement to Label Propagation which is a well-known transductive classification algorithm for word sense disambiguation. Our approach make use of a semantic diffusion kernel. We name this new algorithm as Diffused Label Propagation Algorithm (DILP). We evaluate our proposed algorithm with experiments utilizing various sizes of training sets of disambiguated corpora. Our experiments help us to answer the following questions: 1. Does our algorithm with semantic kernel formulation yield higher classification performance than the popular kernels? 2. Under which conditions does a kernel design perform better than others? 3. What kind of regularization methods result with better performance? Our experiments demonstrate that our approach can outperform baseline in terms of accuracy in several conditions.

Benzer Tezler

  1. Analysis of feature pattern mining approaches on social network: A case study on Facebook

    Sosyal ağlarda özellik örüntü madenciliği yaklaşımlarının analizi: Facebook üzerinde durum çalışması

    ELİFE ÖZTÜRK

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Yüksek Teknoloji Enstitüsü

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. SERAP ŞAHİN

  2. Kutsalından arındırılmış din: Helal gıda'nın ekonomi-politik analizi

    Religion that had purified from its sacred: Politicial economy analysis of halal food

    DENİZ PARLAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Siyasal BilimlerAkdeniz Üniversitesi

    Kamu Yönetimi Ana Bilim Dalı

    PROF. DR. ALİ ÖZTEKİN

  3. Ortaokul temel ders kitaplarının eğitsel ve grafiksel açıdan değerlendirilmesi

    Başlık çevirisi yok

    AYŞE DÜNDAR

    Yüksek Lisans

    Türkçe

    Türkçe

    1995

    Eğitim ve ÖğretimGazi Üniversitesi

    Y.DOÇ.DR. SERAP ETİKE

  4. Predicting informative spatio-temporal neurodevelopmental windows and gene risk for autism spectrum disorder

    Otizm spektrum bozukluğu ̇için bilgi ̇verici zaman-uzamsal sinir gelişim aralığı ve gen riski tahmini

    OĞUZHAN KARAKAHYA

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ABDULLAH ERCÜMENT ÇİÇEK