Geri Dön

Application of text mining to technology management domain to extract topics and trends

Konuların ve eğilimlerin bulunması amacıyla metin madenciliğinin teknoloji yönetimi alanına uygulanması

  1. Tez No: 711071
  2. Yazar: YAŞAR TEKİN
  3. Danışmanlar: PROF. DR. PINAR KARAGÖZ
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Computer Engineering and Computer Science and Control, Science and Technology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: Bilim ve Teknoloji Politikası Çalışmaları Anabilm Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 136

Özet

Konu modelleme, büyük belge topluluklarındaki gizli konuların tespitinde yaygın olarak kullanılan bir yöntemdir. En dikkat çekici kullanımlarından birisi bilimsel alanlardaki uygulamalarıdır. Konu modelleme, bir bilimsel alanda yayınlanan tüm makalelere uygulandığında, incelenen dönem için konuların ve eğilimlerinin genel bir görünümünü ortaya koyar. Yalnızca bir konferans veya dergiye uygulandığında ise, söz konusu konferans veya derginin global eğilimlerden farklılıklarını ortaya çıkarır. Konu modellemede kullanılan en popüler yöntem Gizli Dirichlet Ayrımı (GDA)'dır. Birçok farklı alanda kullanılıyor olmasına rağmen model parametrelerinin nasıl eniyileneceği ve kararsızlığın nasıl giderileceği soruları tam olarak yanıtlanabilmiş değildir. Bu tez iki ana bölümden oluşmaktadır: 1) Birinci bölümde bir deneysel çalışma gerçekleştirilerek a) sıralı dokümanlarda kararsızlık seviyesi, b) kararsızlığı önlemek (mümkün değilse hafifletmek) için kullanılabilecek yöntemler ve c) GDA parametrelerinin eniyilenmesinde sözcük vektör temsillerinin kullanımı araştırılmıştır. Araştırma sonucunda: a) sıralı dokümanlarda da kararsızlık seviyesinin yüksek olduğu, b) konu kararsızlığını hafifletmek için çoğaltılmış konu modellerinin ortalama puanlarının kullanılabileceği ve c) GDA parametrelerinin eniyilenmesinde Skip-gram benzerlik puanının kabul edilebilir bir ölçü olduğu tespit edilmiştir. 2) İkinci bölümde, ilk bölümde önerilen yöntem kullanılarak, konu modelleme Teknoloji Yönetimi (TY) alanına uygulanmıştır. TY literatürünün zirvedeki konuları, en çok çalışılan endüstri dalları, en çok kullanılan yöntemleri ve şaşırtıcı konuları belirlenmiştir.

Özet (Çeviri)

Topic modeling is a widely used technique to extract latent topics from large document collections. One of the most remarkable uses of it is its application to scientific fields. If topic modeling is applied to all articles published in a specific scientific field, it provides an overall view of topics and trends for the time period under consideration. If it is applied to a single conference or journal, it reveals differences from global trends. The most popular method used for topic modeling is Latent Dirichlet Allocation (LDA). Although LDA is used in many different fields, the problems of how to optimize model parameters and how to eliminate topic instability have not been fully solved yet. This thesis consists of two main parts: 1) An empirical investigation is conducted: a) to investigate the level of topic instability in ordered documents, b) to search for methods to eliminate (if not possible, to alleviate) the effects of the topic instability, c) to evaluate the use of word vector representations to optimize LDA parameters. It is found out that: a) the level of instability is high even in ordered documents, b) average scores of replicated topic models can be used to alleviate the effects of topic instability, c) Skip-gram similarity score is an acceptable measure in optimizing LDA parameters. 2) By using the method proposed, topic modeling is applied to Technology Management (TM) domain. Top topics, the most studied industries, the most used methods and surprising topics of TM literature are identified.

Benzer Tezler

  1. Sosyal medya üzerinden metin madenciliği ve duygu analizi ile pazar değerlendirme

    Market analysis based over social networks using text mining and cluster analysis

    HATİME DİLEK BEYHAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. BAŞAR ÖZTAYŞİ

  2. Yapılacak işler yaklaşımı ile sistem tasarımı

    System design with jobs to be done approach

    GONCA ÖZDEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BAŞAR ÖZTAYŞİ

  3. Sosyal medyada markaların itibarlar analizi

    Reputation analysis of brands in social media

    BAHAR ŞARDAĞI

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Bilgi ve Belge YönetimiDokuz Eylül Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    DOÇ. DR. ÇİĞDEM TARHAN

  4. Leveraging ai in construction management

    İnşaat proje yönetiminde yapay zekadan faydalanma

    BARAN AKOL

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    DOÇ. DR. FATMA PINAR ÇAKMAK

  5. Kırsal bölgelerde bilgi sistemlerinin uygulanması olanakları

    Başlık çevirisi yok

    DURSUN ZAFER ŞEKER

    Doktora

    Türkçe

    Türkçe

    1993

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    PROF.DR. M. ORHAN ALTAN