Geri Dön

Mikroblog hizmetlerindeki örtük bilginin veri madenciliği teknikleri ile keşfi

Discovery of tacit knowledge in the microblogging services by data mining techniques

  1. Tez No: 444175
  2. Yazar: FERİDUN CEMAL ÖZÇAKIR
  3. Danışmanlar: PROF. DR. SEVİNÇ GÜLSEÇEN
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2016
  8. Dil: Türkçe
  9. Üniversite: İstanbul Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Enformatik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 163

Özet

Günümüzde internet, mobil teknolojiler ve sosyal medya günlük yaşamın ayrılmaz birer parçalarıdır. Bu ortamlarda üretilen veriler üzerinden kişi veya kurumlar için değerli olacak bilgiye veri madenciliği ve makine öğrenmesi teknikleri ile ulaşılabilir. Bu tez çalışmasında sosyal medya ortamı Twitter mikroblog hizmetini kullanan insanların ürettiği görüşlerin analizini yapan ve analiz sonuçlarına göre mesajlar içindeki örtük bilgiyi keşfedebilen bir veri analiz aracı geliştirilmiştir. Geliştirilen yazılım aracı ile insanların ürünler, hizmetler, kuruluşlar, bireyler, sorunlar ve toplumsal olaylar ile ilgili duygularının, fikirlerinin, görüşlerinin, tepkilerinin ve değerlendirmelerinin analizi gerçekleştirilmektedir. Analiz işlemi esnasında metin madenciliğine yönelik veri madenciliği ve doğal dil işleme teknikleri kullanılmaktadır. Web tabanlı bir yazılım uygulaması olarak geliştirilen analiz aracı ile belirtilen anahtar kelime (kilit terim) veya kelime gruplarını içeren görüşler Twitter mikroblog uygulamasından alınmakta, Türkçeye özel olarak geliştirilen Anahtar Kelime ve Fiil Tabanlı model ile alınan görüşler üzerinden kişilerin/fikir gruplarının/toplumun olumlu/olumsuz yorum veya istek gibi duyguları belirlenmektedir. Analiz aracına ayrıca N-gram tekniği ile oluşturulmuş eğitim verisi ile çalışan Naïve Bayes ve Maksimum Entropi makine öğrenmesi teknikleri yazılım olarak entegre edilmiştir. Entegre edilen bu modeller ile analiz aracı Twitter mikroblog uygulamasından alınan görüşler üzerinde duygu analizi yapmaktadır. Modellerin geçerliliği için performans ölçümleri hesaplanmış, modellerin başarı seviyesi değerlendirilmiştir. Anahtar Kelime ve Fiil Tabanlı model ile N-gram yapılı Naïve Bayes ve Maksimum Entropi modellerinin karşılaştırılması yapılmış, elde edilen bulgulara göre Naïve Bayes ve Maksimum Entropi modellerinin Anahtar Kelime ve Fiil Tabanlı modele göre daha başarılı sonuçlar ürettikleri görülmüştür.

Özet (Çeviri)

Today, internet, mobile technology and social media are integral parts of daily life. The valuable knowledge for individuals and organizations can be reached by data mining and machine learning techniques from generated data via social media. In this thesis, a data analysis tool has been developed, makes the analysis of opinions produced by the people who use the Twitter microblogging service, is a social media environment, and discovers the tacit knowledge in the messages according to analysis results. The developed software tool is realized analysis of people's sentiments (ideas, opinions, reactions, evaluations) about products, services, organizations, individuals, problems, and social events. Data mining and natural language processing techniques towards text mining are used during the analysis process. The data analysis tool was developed as a web-based software application. The opinions (messages), contain specified keyword (key term) or phrase, are taken from the Twitter microblogging application with this tool. On opinions, are taken with Keyword and Verb Based model is developed for Turkish language, to determine sentiments of people / opinion groups / society. Naïve Bayes and Maximum Entropy models, are machine learning techniques and work with training dataset was established with N-gram structures, have been integrated a software in the data analysis tool. By these integrated models, the data analysis tool makes sentiment analysis over opinions are taken from the Twitter microblogging application. The performance metrics of models have been calculated for the validity of the models, the success levels of the models have been evaluated. Keyword and Verb Based model was compared with N-gram models (Naïve Bayes and Maximum Entropy models). According to the findings, Naïve Bayes and Maximum Entropy models have produced more successful results by Keyword and Verb Based model.

Benzer Tezler

  1. Analysis of relations between microblogging messages and stock prices

    Mikroblog mesajlar ile hisse fiyatları arasındaki ilişkinin analizi

    SERHAT TAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. CEMAL OKAN ŞAKAR

  2. Emergency situation notification based on social networks for mobile devices

    Mobil cihazlar için sosyal medya tabanlı acil durum bildirimi

    HAKAN ANIT

    Yüksek Lisans

    İngilizce

    İngilizce

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. SUZAN ÜSKÜDARLI

  3. Detection of topic-based opinion leaders in microblogging environments

    Mikroblog çevrelerinde konu tabanlı fikir öncülerinin tespit edilmesi

    GÖZDE KAYMAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ARZUCAN ÖZGÜR

  4. S3-TM: Scalable streaming short text matching

    Ölçeklenebilir akan kısa metin eşleme

    FUAT BASIK

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HAKAN FERHATOSMANOĞLU

    YRD. DOÇ. DR. BUĞRA GEDİK

  5. An analysis of news on microblogging systems

    Mikroblog sistemlerinde haber analizi

    OKAY ASLAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. SUZAN ÜSKÜDARLI