Metin kümelemede alternatif yöntemler ve bildirim yönetimi üzerine bir uygulama
An application on alternative methods in text clustering and notification management
- Tez No: 741380
- Danışmanlar: DR. ÖĞR. ÜYESİ DOĞAN YILDIZ
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: İstatistik Bilim Dalı
- Sayfa Sayısı: 73
Özet
Bildirim yönetimi sistemleri CRM çalışmaları kapsamında önemli bir yere sahiptir. Müşterilerden gelen geri bildirimler değerlendirilmeli, şikayetler giderilmeli ve müşteri memnuniyeti sağlanmalıdır. Son yıllarda sosyal medya kullanımının artması ile bildirimlerin büyük bir çoğunluğu sosyal medya kanalları üzerinden gelmektedir. Bu bildirimlerin fazla sayıda olması durumunda, uygulanacak stratejilerin belirlenmesi için verilerin otomatik şekilde gruplandırılması gerekmektedir. Bu konu kapsamında çeşitli metin madenciliği ve makine öğrenmesi algoritmaları kullanılmaktadır. Veri sayısı fazla olduğunda verilerin etiketlenmesi oldukça fazla iş yükü getirmektedir. Bu gibi durumlarda kümeleme yöntemleri, benzer verilerin gruplanması için kullanılabilir. Metin verilerinin kümelenmesi yüksek veri boyutu nedeniyle zorlayıcı bir problemdir. Veri boyutunun fazla olması küme kalitesinin düşmesine ve algoritma çalışma sürelerinin uzamasına neden olmaktadır. Bu sorunun çözümü için farklı yöntemler üzerinde çalışılmaktadır. Tez kapsamında, öncelikle metin madenciliği süreçlerine değinilecek, sonrasında k-means algoritmasına alternatif olarak Küresel k-means ve Mini-Batch k-means algoritmaları incelenecektir. Tezin son aşamasında Python programlama dili kullanılarak özel bir bankayı etiketleyerek atılan tweet'lere metin madenciliği yöntemlerinden veri temizleme, kelime kökü tespiti, kelimelerin dizginciklere ayrılması, durdurma kelimelerinin elenmesi ve kelimelerin vektörleştirilmesi işlemleri yapılacaktır. Metin verileri, makine öğrenmesi algoritmalarında kullanılabilir hale getirildikten sonra k-means, Küresel k-means ve Mini-Batch k-means algoritmaları ile kümeleme yapılacaktır. Uygulama sonuçları hata kareleri toplamı(SSE), silüet katsayısı ve algoritma çalışma süreleri açısından değerlendirilecektir.
Özet (Çeviri)
Notification management systems have an important place within the scope of CRM studies. Feedbacks from customers should be evaluated, complaints should be resolved and customer satisfaction should be ensured. With the increasing usage of social media in recent years, most of the notifications come from social media channels. In the case of large numbers of these notifications, data should be grouped automatically to determine the strategies to be applied to the notifications. Various text mining and machine learning algorithms are used within the scope of this topic. When the number of data is large, tagging the data brings a lot of workloads. In such cases, clustering methods can be used to group similar data. The clustering of text data is a challenging problem due to the high data size. Excessive data size causes a decrease in cluster quality and an increase in algorithm run times. Different methods are being worked on to solve these problems. Within the scope of the thesis, firstly, text mining processes will be discussed, then Spherical k-means and Mini-Batch k-means algorithms will be examined as an alternative to the k-means algorithm. At the last stage of the thesis, by using the Python programming language data clearing, stemming, tokenization, stopwords elimination, and vectorization will be done to tweets sent by tagging a bank. Text data will be clustered with k-means, Spherical k-means, and Mini-Batch k-means algorithms after the text mining process. The application results will be evaluated in terms of the sum of squared errors(SSE), silhouette coefficient, and algorithm run times.
Benzer Tezler
- Esnek hesaplama yöntemlerinin jeodezide uygulamaları
Applications of soft computing methods in geodesy
ORHAN AKYILMAZ
Doktora
Türkçe
2005
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiJeodezi ve Fotogrametri Mühendisliği Ana Bilim Dalı
PROF.DR. TEVFİK AYAN
- Derin öğrenme yöntemleri ile zaman serisi tahmini
Time series classification with deep learning methods
HAKAN GÜNDÜZ
Doktora
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ZEHRA ÇATALTEPE
- Psikoaktif maddelerden mefedronun antikolinerjik etkinliğinin in vitro araştırılması
In vitro investigation of anticholinergic efficacy of mephedrone, a psychoactive substance
BEGÜM YURDAKÖK DİKMEN
Yüksek Lisans
Türkçe
2022
Adli TıpAnkara ÜniversitesiDisiplinlerarası Adli Bilimler Ana Bilim Dalı
PROF. DR. HALİT SİNAN SÜZEN
- KeNet: A comprehensive Turkish wordnet and its applications in text clustering
KeNet: Kapsamlı Türkçe wordnet ve metin kümelemede kullanılması
RAZIEH EHSANI
Doktora
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolIşık ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. OLCAY TANER YILDIZ
PROF. DR. ERCAN SOLAK
- Metin madenciliği için iyileştirilmiş bir kümeleme yapısının tasarımı ve uygulaması
Design and application of an improved clustering algorithm for text mining
VOLKAN TUNALI
Doktora
Türkçe
2011
Bilgi ve Belge YönetimiMarmara ÜniversitesiElektronik-Bilgisayar Eğitimi Ana Bilim Dalı
PROF. DR. A. YILMAZ ÇAMURCU
YRD. DOÇ. DR. T. TUGAY BİLGİN