Geri Dön

Artımlı metin kümeleme

Incremental text clustering

  1. Tez No: 479632
  2. Yazar: DUYGU SELİN BALLI
  3. Danışmanlar: DOÇ. DR. BURAK ORDİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Matematik, Mathematics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: Türkçe
  9. Üniversite: Ege Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Matematik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 99

Özet

İnsanoğlu doğası gereği nesneleri gruplandırmaya yatkın bir varlıktır. Örneğin yaşadığımız evler odalara ayrılmıştır. Evlerin odaları, eşyaların özelliklerine ve odaların kullanım amaçlarına uygun şekilde benzerlikler bulunarak dizayn edilir. Tabaklar mutfağa yerleştirilirken, havlular banyoya yerleştirilir. Hatta tabaklar bile renk, boyut veya kullanım amacına göre gruplandırılabilir. Bunlar dışında bilgisayarlarda bulunan dosyalar konularına göre veya gelen e-postalar gönderen kişisine göre kümelenebilir. Tüm bunlara bakıldığında kümeleme tekniğinin önemi göz ardı edilemezdir. Gelişen teknolojiyle birlikte, büyüyen veritabanları ve veritabanlarında biriken verilerin büyük bir çoğunluğunun metin veri olduğu dikkate alındığında metin kümeleme probleminin önemide göze çarpmaktadır. Bu tez çalışmasında, dökümanları benzerliklerine göre gruplandıran metin kümeleme algoritmaları incelenmiştir. Klasik şekilde, dokümanlar önişlemden geçirilir, vektörler ile gösterilir ve ardından kümeleme işlemi yapılır. Tez çalışması boyunca kümeleme işlemi için artımlı k-means algoritması kullanılmıştır. Bu klasik yönteme ek olarak üç farklı yöntem tasarlanmış ve tasarlanan yöntemler Java ve C programlama dillerinde programlanmıştır. İki veri seti üzerinde hesaplama denemeleri yapılmış ve tasarlanan yöntemlerin, klasik yöntemekıyasla daha iyi sonuç verebildiği gösterilmiştir.

Özet (Çeviri)

Mankind is a being that tend to grouping objects. For example, the houses we live in are seperated by rooms. Rooms of houses are designed finding similarity according to properties of objects and use of rooms. While dishes are placed in kitchen, towels are placed in bathroom. Dishes can be even grouping in terms of topics of them, or incoming e-mails can be clustered in terms of senders.When taking into account all of these, signifinance of clustering method is non-negligible. With developing technology, when taking into account growing databases and considering that most of cumulative data in databases are text data, importance of text clustering problem draws the attention. In this thesis study, text clustering algorithms that group documents in terms of similarity are investigated. Classically, documents are preprocessed represented by vectors and then clustering process is made. Incremenal k-means algorithm is used for clustering operation through thesis study. Apart from the classic method, three different methods are proposed and proposed methods are programmed in Java and C programming language. Calculation experiments are made on two data sets and it is demonstrated thar proposed methods can beter yield results compared with classic method.

Benzer Tezler

  1. Exploring concept drift in technology by tweets mining

    Tweetlerin metin madenciliği yoluyla teknolojideki kavram sapmasını keşfetme

    MOHAMAD NACİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Endüstri ve Endüstri MühendisliğiGaziantep Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ALPTEKİN DURMUŞOĞLU

  2. Libraries and tools for viewing and editing biological maps in sbgn

    Sbgn ile biyolojik haritaların gösterimi ve dÜzenlenmesi için kütüphane ve araçlar

    METİN CAN SİPER

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. UĞUR DOĞRUSÖZ

  3. Deneysel tip 1 diyabetes mellitus'ta aerobik egzersizin lipopolisakkarit ile hasar oluşturulmuş sıçan akciğerleri üzerine etkisi

    The effect of aerobic exercise in TYPE 1 diabetes mellitus on lipopolysaccharide induced rat lung injury

    GÖKTUĞ ÖMERCİOĞLU

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2018

    FizyolojiAnkara Üniversitesi

    Fizyoloji Ana Bilim Dalı

    PROF. METİN BAŞTUĞ

  4. Political engagement patterns of ıslamist movements: The case of the nizam/selamet movement

    İslamcı hareketlerin siyasete katılma örüntüleri: Nizam/selamet hareketi örneği

    İPEK GENCEL SEZGİN

    Doktora

    İngilizce

    İngilizce

    2011

    Siyasal Bilimlerİhsan Doğramacı Bilkent Üniversitesi

    Siyaset Bilimi ve Kamu Yönetimi Bölümü

    PROF. DR. METİN HEPER

  5. Sabit mıknatıslı senkron motorların servo uygulamalarında PID kontrolör parametrelerinin otomatik ayarlanması

    Auto tuning of PID controller parameters for permanent magnet synchronous motor servo applications

    GÖKHAN ERÜNLÜ

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    PROF. DR. METİN GÖKAŞAN