E-posta listelerinde metin kümeleme ve sosyal ağ analizi uyumu
Coherence between text clustering and social network analysis in e-mail lists
- Tez No: 271575
- Danışmanlar: YRD. DOÇ. DR. MEHMET GÖKTÜRK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2010
- Dil: Türkçe
- Üniversite: Gebze Yüksek Teknoloji Enstitüsü
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 65
Özet
E-posta listeleri birbirleriyle herkese açık içerikler aracılığıyla iletişim kuran kişiler tarafından ve açık kaynak kod topluluğunca popüler olarak kullanılmaktadır. Bu listeler veri madenciliği için büyük miktarda veri sunmaktadır. Sadece e-postaların içeriklerinin değil, bunun yanında e-posta gönderen bireylerin birbirleriyle bağlantılarının (gönderen alan ilişkisi içerisinde) yapısı da ilgili e-posta alt gruplarının daha önceden gözlemlenmemiş ancak önemli olan bilgilerini ortaya çıkarabilir.Metin kümeleme yapılırken e-posta listelerindeki metinler doküman verisi gibi ele alınarak alt kümeler tespit edilmiştir. Vektör uzay modelinde kelimelerin normalize edilmiş frekansları kullanılarak k-means algoritması ile kümeleme yapılmıştır. Sosyal ağ analizinde ise CONCUR algoritması ile alt kümeler bulunmuştur. Metin madenciliği ile tespit edilen alt gruplar ile sosyal ağ analizinin tespit ettiği alt gruplar arasında aynı sosyal yapıyı dokudukları için benzer küme varlıklarına sahip olmaları beklenmektedir. Bu sosyal yapıda, e-posta göndericilerin genellikle benzer konularda yazdıklarını ve benzer konuların genellikle benzer kişiler tarafından cevaplandığını öne sürmekteyiz. Metin madenciliği ve sosyal ağ analizi metotları teker teker uygulandığında (ör. sosyal ağ analizi için CONCUR, metin madenciliği için k-means) oluşan kümelerin uyumu, kullanılan algoritmalara ve oluşması beklenen küme sayısına göre değiştiği gözlemlenmiştir. Çalışmamızda sosyal ağ analizinin ve metin madenciliğinin tespit ettiği alt gruplar yaklaşık %60 birbiriyle aynı sonucu verdi. Ek olarak uygun olmayan algoritma ve/veya küme sayısı seçildiğinde ise uyumun etkileyici şekilde düştüğü gözlemlenmiştir.
Özet (Çeviri)
E-mail listings are popularly used in open source community and by individuals that contact each other with publicly reachable contexts. This listings serve vast amounts of data that could be used for data mining. Not only textual context in e-mails but also structure of links between e-mail senders (individuals) could reveal previously unobserved and also important information about related e-mail subgroups.In order to find clusters in e-mail lists, e-mail contents threated as document data. Normalized values of frequences of terms used in vector space model, and k-means algorithm used for clustering the e-mails. CONCUR algorithm is used to find clusters while analysing social network of e-mail lists. It is expected to appear a relation between entities of clusters found by text mining and social network analysis as they weave the similar social subgroupings. At this social structure, we propose that senders mostly write about similar topics, and similar topics are mostly responded by similar senders. When text mining and social network analysis methots are taken one by one (such as CONCUR for SNA and k-means for text mining), it is observed that coherence of resulting clusters depend on used algorithms and number of clusters expected. In our work, coherence of social network analysis and text mining subgroups are matched about %60. In addition, when inappropriate algorithms and/or number of clusters are chosen, results will decrease dramatically.
Benzer Tezler
- Eğitimde toplam kalite yönetiminde karşılaşılan güçlükler
The obstacles met in total quality management in education
YASEMİN DÜZAĞAÇ
Yüksek Lisans
Türkçe
2005
Eğitim ve ÖğretimMarmara ÜniversitesiTeknoloji Eğitimi Ana Bilim Dalı
PROF.DR. SEMRA ÜNAL
- Lise öğrencilerinde problemli internet kullanımının akademik güdülenmeye etkisinin incelenmesi
Investigation of the effect on academic motivation of problemed internet use in high school students
TANER AKBABA
Yüksek Lisans
Türkçe
2019
Eğitim ve ÖğretimBayburt ÜniversitesiRehberlik ve Psikolojik Danışmanlık Ana Bilim Dalı
DR. ÖĞR. ÜYESİ METİN KAYA
- İzinli e-posta aracılığıyla pazarlamaya ilişkin Anadolu Üniversitesi İ. İ .B .F. öğrencilerinin görüşlerinin belirlenmesine yönelik bir araştırma
Authorized for marketing via e-mail at Anadolu University Faculty of Economics and Administrative Sciences research aimed at determining the views of students
YASEMİN OKAY
- Mobilya ve levha sektöründe veri zarflama analizi yardımıyla etkinlik ölçümü
Activity analysis with data envelopment analysis in the furniture and panelboard sectors
GİZEM ÇAMUR
Yüksek Lisans
Türkçe
2014
Ağaç İşleriKaradeniz Teknik ÜniversitesiOrman Endüstri Mühendisliği Ana Bilim Dalı
PROF. DR. KADRİ CEMİL AKYÜZ
- Otelcilik ve turizm meslek liselerinde çalışan öğretmenlerin toplam kalite yönetimi anlayışı
Working in hospitality and tourism vocational high school teachers' understanding of total quality management
ALİ SOLUNOĞLU
Yüksek Lisans
Türkçe
2013
TurizmGazi ÜniversitesiTurizm İşletmeciliği Eğitimi Ana Bilim Dalı
PROF. DR. KURBAN ÜNLÜÖNEN