Geri Dön

Veri madenciliğinde bir metin madenciliği uygulaması

A text mining application in data mining

  1. Tez No: 307439
  2. Yazar: HARUN BAYER
  3. Danışmanlar: YRD. DOÇ. DR. GÖKHAN SİLAHTAROĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Veri madenciliği, Metin madenciliği, Veritabanı, Kelime ilişkileri, Metin analizi, Data mining, Text mining, Database, Word Relations, Text Analysis
  7. Yıl: 2011
  8. Dil: Türkçe
  9. Üniversite: Beykent Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 103

Özet

Veri madenciliğinin alt dallarından olan metin madenciliği ile yüksek kapasiteli metinler içerisindeki istenilen öz bilgilere ulaşılmaktadır. Verilerin çoğunlukla metinsel halde bulunmalarından ötürü veri madenciliği uygulamalarının büyük bir çoğunluğu metin madenciliği ile gerçekleştirilmektedir. Bu çerçevede metin madenciliği aslında veri madenciliğinin yansımasıdır diyebiliriz.Bu tez çalışmasında; son yıllarda birçok alanda kullanılan veri madenciliği ve alt dalı olan metin madenciliğinin gelişim süreçleri, kullanılan modeller ve bu uygulamaların çözüm getirebilecekleri alanlar üzerinde durulmuştur. Veri ve metin madenciliği teknikleri ile veritabanlarında bulunan gizli ilişkiler açığa çıkarılabilecektir.Metin madenciliğinin yaygın olarak kullanıldığı alan; Türkçe metinlerin analiz edilmesidir.Metin madenciliği teknikleri kullanılarak Türkçe kelimelerin anlam haritalarının çıkarılması üzerine iki modülden oluşan bir uygulama geliştirilmiştir. Uygulama bölümünde ilk olarak metin içerisinde yer alan kelimeler, açık kaynak kodlu ?zemberek? programı yardımıyla köklerine ayrılmıştır. Köklerine ayrılan kelimeler arasındaki gizli ilişkiler bu tez kapsamı süresince geliştirilen bilgisayar programı yardımıyla keşfedilmiştir. Keşfedilen bu bilgiler ışığında kelimeler arası anlamsal bağ durumu analiz edilmiş ve analiz sonucunda kelimelerin anlam bilgisi tahmini gerçekleştirilmiştir. Ayrıca metin madenciliği alanında, ileriye dönük çalışmalar için bir dizi öneride bulunulmuştur.

Özet (Çeviri)

By using text mining which is one of the sub-branches of data mining, the desired core information within the high capacity texts can be reached. Since the data are mostly in text form, most of the data mining applications are performed through text mining. In this scope, we can actually say that text mining is a reflection of data mining.In this thesis; the development processes of the data mining which has been used in many areas in recent years and the text mining which is the sub-branch of data mining, the models used and the areas where these applications may bring solutions are emphasized. The hidden relations in the databases can be revealed with data and text mining techniques.The area at which the text mining is commonly used is analysing the Turkish texts. An application consisting of 2 modules has been developed on extracting the significance charts of the Turkish words. At the application phase, the words in the text are separated into their roots by using open source software ? zemberek?. The hidden relations between the texts which are separated into their roots are discovered with the help of the software developed within the scope of this thesis. In light of these discovered data, the semantic relation status between the words are analysed and the estimation of the meaning of the words is performed as the result of the analysis. Furthermore a range of suggestions have been made for the further studies on text mining.

Benzer Tezler

  1. Metin madenciliğinde kullanılan yöntemlerin karşılaştırılması: Siyasi parti liderlerinin grup genel toplantı konuşmaları ile bir uygulama

    Comparison of techniques and methodologies used in text mining: An application with group meeting speeches of Turkish political part leaders

    KEZİBAN SEÇKİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2011

    Siyasal BilimlerSakarya Üniversitesi

    İşletme Ana Bilim Dalı

    DOÇ. DR. ERMAN COŞKUN

  2. Veri analitiğinin ekonomik etkileri: İnternet yayıncılığında metin tabanlı öneri motoru örneği

    Economic effects of data analytics: Text based recommendation engine example in internet publishing

    AHMET TEZCAN TEKİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    PROF. DR. NEDİME LERZAN ÖZKALE

    DOÇ. DR. BAŞAR ÖZTAYŞİ

  3. Metin madenciliği ve sağlık alanında bir uygulama

    Text mining and an application in health

    SELÇUK GÖKSEL TOPLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    BiyoistatistikDüzce Üniversitesi

    Biyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı

    DOÇ. DR. ŞENGÜL CANGÜR

  4. Dengesiz veri setlerinde sınıflandırma problemlerinin çözümünde melez yöntem uygulaması

    Hybrid method application to solve classification problems in imbalanced datasets

    MESTAN ŞAHİN PİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Endüstri ve Endüstri MühendisliğiBursa Uludağ Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. DUYGU YILMAZ EROĞLU

  5. Mikroblog hizmetlerindeki örtük bilginin veri madenciliği teknikleri ile keşfi

    Discovery of tacit knowledge in the microblogging services by data mining techniques

    FERİDUN CEMAL ÖZÇAKIR

    Doktora

    Türkçe

    Türkçe

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi

    Enformatik Ana Bilim Dalı

    PROF. DR. SEVİNÇ GÜLSEÇEN