Geri Dön

Metin kümelemede alternatif yöntemler ve bildirim yönetimi üzerine bir uygulama

An application on alternative methods in text clustering and notification management

  1. Tez No: 741380
  2. Yazar: EMRE RIDVAN MURATLAR
  3. Danışmanlar: DR. ÖĞR. ÜYESİ DOĞAN YILDIZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: İstatistik Bilim Dalı
  13. Sayfa Sayısı: 73

Özet

Bildirim yönetimi sistemleri CRM çalışmaları kapsamında önemli bir yere sahiptir. Müşterilerden gelen geri bildirimler değerlendirilmeli, şikayetler giderilmeli ve müşteri memnuniyeti sağlanmalıdır. Son yıllarda sosyal medya kullanımının artması ile bildirimlerin büyük bir çoğunluğu sosyal medya kanalları üzerinden gelmektedir. Bu bildirimlerin fazla sayıda olması durumunda, uygulanacak stratejilerin belirlenmesi için verilerin otomatik şekilde gruplandırılması gerekmektedir. Bu konu kapsamında çeşitli metin madenciliği ve makine öğrenmesi algoritmaları kullanılmaktadır. Veri sayısı fazla olduğunda verilerin etiketlenmesi oldukça fazla iş yükü getirmektedir. Bu gibi durumlarda kümeleme yöntemleri, benzer verilerin gruplanması için kullanılabilir. Metin verilerinin kümelenmesi yüksek veri boyutu nedeniyle zorlayıcı bir problemdir. Veri boyutunun fazla olması küme kalitesinin düşmesine ve algoritma çalışma sürelerinin uzamasına neden olmaktadır. Bu sorunun çözümü için farklı yöntemler üzerinde çalışılmaktadır. Tez kapsamında, öncelikle metin madenciliği süreçlerine değinilecek, sonrasında k-means algoritmasına alternatif olarak Küresel k-means ve Mini-Batch k-means algoritmaları incelenecektir. Tezin son aşamasında Python programlama dili kullanılarak özel bir bankayı etiketleyerek atılan tweet'lere metin madenciliği yöntemlerinden veri temizleme, kelime kökü tespiti, kelimelerin dizginciklere ayrılması, durdurma kelimelerinin elenmesi ve kelimelerin vektörleştirilmesi işlemleri yapılacaktır. Metin verileri, makine öğrenmesi algoritmalarında kullanılabilir hale getirildikten sonra k-means, Küresel k-means ve Mini-Batch k-means algoritmaları ile kümeleme yapılacaktır. Uygulama sonuçları hata kareleri toplamı(SSE), silüet katsayısı ve algoritma çalışma süreleri açısından değerlendirilecektir.

Özet (Çeviri)

Notification management systems have an important place within the scope of CRM studies. Feedbacks from customers should be evaluated, complaints should be resolved and customer satisfaction should be ensured. With the increasing usage of social media in recent years, most of the notifications come from social media channels. In the case of large numbers of these notifications, data should be grouped automatically to determine the strategies to be applied to the notifications. Various text mining and machine learning algorithms are used within the scope of this topic. When the number of data is large, tagging the data brings a lot of workloads. In such cases, clustering methods can be used to group similar data. The clustering of text data is a challenging problem due to the high data size. Excessive data size causes a decrease in cluster quality and an increase in algorithm run times. Different methods are being worked on to solve these problems. Within the scope of the thesis, firstly, text mining processes will be discussed, then Spherical k-means and Mini-Batch k-means algorithms will be examined as an alternative to the k-means algorithm. At the last stage of the thesis, by using the Python programming language data clearing, stemming, tokenization, stopwords elimination, and vectorization will be done to tweets sent by tagging a bank. Text data will be clustered with k-means, Spherical k-means, and Mini-Batch k-means algorithms after the text mining process. The application results will be evaluated in terms of the sum of squared errors(SSE), silhouette coefficient, and algorithm run times.

Benzer Tezler

  1. Esnek hesaplama yöntemlerinin jeodezide uygulamaları

    Applications of soft computing methods in geodesy

    ORHAN AKYILMAZ

    Doktora

    Türkçe

    Türkçe

    2005

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Jeodezi ve Fotogrametri Mühendisliği Ana Bilim Dalı

    PROF.DR. TEVFİK AYAN

  2. Derin öğrenme yöntemleri ile zaman serisi tahmini

    Time series classification with deep learning methods

    HAKAN GÜNDÜZ

    Doktora

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ZEHRA ÇATALTEPE

  3. Psikoaktif maddelerden mefedronun antikolinerjik etkinliğinin in vitro araştırılması

    In vitro investigation of anticholinergic efficacy of mephedrone, a psychoactive substance

    BEGÜM YURDAKÖK DİKMEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Adli TıpAnkara Üniversitesi

    Disiplinlerarası Adli Bilimler Ana Bilim Dalı

    PROF. DR. HALİT SİNAN SÜZEN

  4. KeNet: A comprehensive Turkish wordnet and its applications in text clustering

    KeNet: Kapsamlı Türkçe wordnet ve metin kümelemede kullanılması

    RAZIEH EHSANI

    Doktora

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolIşık Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. OLCAY TANER YILDIZ

    PROF. DR. ERCAN SOLAK

  5. Metin madenciliği için iyileştirilmiş bir kümeleme yapısının tasarımı ve uygulaması

    Design and application of an improved clustering algorithm for text mining

    VOLKAN TUNALI

    Doktora

    Türkçe

    Türkçe

    2011

    Bilgi ve Belge YönetimiMarmara Üniversitesi

    Elektronik-Bilgisayar Eğitimi Ana Bilim Dalı

    PROF. DR. A. YILMAZ ÇAMURCU

    YRD. DOÇ. DR. T. TUGAY BİLGİN