Mikroblog hizmetlerindeki örtük bilginin veri madenciliği teknikleri ile keşfi
Discovery of tacit knowledge in the microblogging services by data mining techniques
- Tez No: 444175
- Danışmanlar: PROF. DR. SEVİNÇ GÜLSEÇEN
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: Türkçe
- Üniversite: İstanbul Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Enformatik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 163
Özet
Günümüzde internet, mobil teknolojiler ve sosyal medya günlük yaşamın ayrılmaz birer parçalarıdır. Bu ortamlarda üretilen veriler üzerinden kişi veya kurumlar için değerli olacak bilgiye veri madenciliği ve makine öğrenmesi teknikleri ile ulaşılabilir. Bu tez çalışmasında sosyal medya ortamı Twitter mikroblog hizmetini kullanan insanların ürettiği görüşlerin analizini yapan ve analiz sonuçlarına göre mesajlar içindeki örtük bilgiyi keşfedebilen bir veri analiz aracı geliştirilmiştir. Geliştirilen yazılım aracı ile insanların ürünler, hizmetler, kuruluşlar, bireyler, sorunlar ve toplumsal olaylar ile ilgili duygularının, fikirlerinin, görüşlerinin, tepkilerinin ve değerlendirmelerinin analizi gerçekleştirilmektedir. Analiz işlemi esnasında metin madenciliğine yönelik veri madenciliği ve doğal dil işleme teknikleri kullanılmaktadır. Web tabanlı bir yazılım uygulaması olarak geliştirilen analiz aracı ile belirtilen anahtar kelime (kilit terim) veya kelime gruplarını içeren görüşler Twitter mikroblog uygulamasından alınmakta, Türkçeye özel olarak geliştirilen Anahtar Kelime ve Fiil Tabanlı model ile alınan görüşler üzerinden kişilerin/fikir gruplarının/toplumun olumlu/olumsuz yorum veya istek gibi duyguları belirlenmektedir. Analiz aracına ayrıca N-gram tekniği ile oluşturulmuş eğitim verisi ile çalışan Naïve Bayes ve Maksimum Entropi makine öğrenmesi teknikleri yazılım olarak entegre edilmiştir. Entegre edilen bu modeller ile analiz aracı Twitter mikroblog uygulamasından alınan görüşler üzerinde duygu analizi yapmaktadır. Modellerin geçerliliği için performans ölçümleri hesaplanmış, modellerin başarı seviyesi değerlendirilmiştir. Anahtar Kelime ve Fiil Tabanlı model ile N-gram yapılı Naïve Bayes ve Maksimum Entropi modellerinin karşılaştırılması yapılmış, elde edilen bulgulara göre Naïve Bayes ve Maksimum Entropi modellerinin Anahtar Kelime ve Fiil Tabanlı modele göre daha başarılı sonuçlar ürettikleri görülmüştür.
Özet (Çeviri)
Today, internet, mobile technology and social media are integral parts of daily life. The valuable knowledge for individuals and organizations can be reached by data mining and machine learning techniques from generated data via social media. In this thesis, a data analysis tool has been developed, makes the analysis of opinions produced by the people who use the Twitter microblogging service, is a social media environment, and discovers the tacit knowledge in the messages according to analysis results. The developed software tool is realized analysis of people's sentiments (ideas, opinions, reactions, evaluations) about products, services, organizations, individuals, problems, and social events. Data mining and natural language processing techniques towards text mining are used during the analysis process. The data analysis tool was developed as a web-based software application. The opinions (messages), contain specified keyword (key term) or phrase, are taken from the Twitter microblogging application with this tool. On opinions, are taken with Keyword and Verb Based model is developed for Turkish language, to determine sentiments of people / opinion groups / society. Naïve Bayes and Maximum Entropy models, are machine learning techniques and work with training dataset was established with N-gram structures, have been integrated a software in the data analysis tool. By these integrated models, the data analysis tool makes sentiment analysis over opinions are taken from the Twitter microblogging application. The performance metrics of models have been calculated for the validity of the models, the success levels of the models have been evaluated. Keyword and Verb Based model was compared with N-gram models (Naïve Bayes and Maximum Entropy models). According to the findings, Naïve Bayes and Maximum Entropy models have produced more successful results by Keyword and Verb Based model.
Benzer Tezler
- Analysis of relations between microblogging messages and stock prices
Mikroblog mesajlar ile hisse fiyatları arasındaki ilişkinin analizi
SERHAT TAŞ
Yüksek Lisans
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. CEMAL OKAN ŞAKAR
- Emergency situation notification based on social networks for mobile devices
Mobil cihazlar için sosyal medya tabanlı acil durum bildirimi
HAKAN ANIT
Yüksek Lisans
İngilizce
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. SUZAN ÜSKÜDARLI
- Detection of topic-based opinion leaders in microblogging environments
Mikroblog çevrelerinde konu tabanlı fikir öncülerinin tespit edilmesi
GÖZDE KAYMAZ
Yüksek Lisans
İngilizce
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ARZUCAN ÖZGÜR
- S3-TM: Scalable streaming short text matching
Ölçeklenebilir akan kısa metin eşleme
FUAT BASIK
Yüksek Lisans
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HAKAN FERHATOSMANOĞLU
YRD. DOÇ. DR. BUĞRA GEDİK
- An analysis of news on microblogging systems
Mikroblog sistemlerinde haber analizi
OKAY ASLAN
Yüksek Lisans
İngilizce
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. SUZAN ÜSKÜDARLI