Geri Dön

Makine öğrenmesi ile veri madenciliği teknikleri kullanılarak anahtar kelime tahmini ve tezlerdeki anahtar kelimelerin doğruluk oranı tespiti

Keyword estimation and accuracy of keywords in theses using machine learning and data mining techniques

  1. Tez No: 779347
  2. Yazar: AYNUR GÜNAY
  3. Danışmanlar: DR. ÖĞR. ÜYESİ FATİH ŞAHİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Nişantaşı Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgi Teknolojileri Bilim Dalı
  13. Sayfa Sayısı: 90

Özet

Günümüzde bilgisayar çağında istenilen veriye ulaşım kolaylaşmakla birlikte kirli verilerden dolayı doğru ve güvenilir veriye ulaşmak zorlaşmıştır. Anahtar kelimeler metnin konusunu anlamamızı kolaylaştırdığı için, metinlerde tanımı büyük önem arz etmektedir. Uzun metinleri ya da dokümanların tamamını okumaya gerek kalmadan metin ya da doküman hakkında genel bilgi sahibi olabilir, çıkarımlar yapılabilir. Arama işlemlerinde doğru anahtar kelimelerin seçimi ve veri ambarlarındaki verilerde belirtilen anahtar kelimelerin doğru bir şekilde tanımlanmış olması bizi doğru sonuçlara götürür. Böylelikle anahtar kelimelerle bir metnin ne ile alakalı olduğu konusunda hızlı bir şekilde tahminde bulunulabilir ve amacımızla alakalı olmayan metinleri okumakla zaman kaybedilmemiş olunur. Bu çalışmada metin madenciliğinde doğal dil işleme tekniği olan metin işleme ve analizi konusunda çalışma yapılmıştır. Tez dosyalarından elde edilen metin üzerinden, en çok kullanılan anahtar kelimeler bulunarak kullanıcılara öneri olarak sunulması amaçlanmıştır. Anahtar kelime çıkarımında, tez dosyaları üzerinden toplanan veri seti üzerinden hareketle çalışılmıştır. Bu işlem için yazım dili Türkçe olan 900 tez incelenmiştir. Öncelikle her bir tez dosyası için normalizasyon işlemleri yapılmış, tez özetinde belirtilen orjinal anahtar kelimeler de metinden alınarak txt dosyalarına ayrı ayrı kaydedilmiştir. Normalizasyon işleminden geçirilen tez içerikleri ve anahtar kelimeler tek bir txt dosyasına aktarılmıştır. Yinelemeli sinir ağı modeli olan derin öğrenme yöntemi Uzun-Kısa Süreli Bellek (LSTM) anahtar kelime çıkarımı için kullanılmıştır. LSTM'de eğitilen modelle, anahtar kelime önerilmiştir.

Özet (Çeviri)

Today, although it is easier to reach the desired data in the computer age, it has become difficult to reach accurate and reliable data due to dirty data. Since keywords make it easier for us to understand the subject of the text, its definition is of great importance in the texts. Without having to read long texts or entire documents, we can have general information about the text or document and make inferences. Choosing the right keywords in search operations and correctly defining the keywords specified in the data in the data warehouses will lead us to the right results. In this way, keywords can quickly predict what a text is related to, and time is not wasted on reading texts that are not relevant to our purpose. In this study, a study was conducted on text processing and analysis, which is a natural language processing technique in text mining. Based on the text obtained from the thesis files, it is aimed to present the most used keywords to the users as suggestions. In keyword inference, the data set collected through the thesis files was studied. For this process, 900 theses with Turkish written language were examined. First of all, normalization procedures were carried out for each thesis file, and the original keywords specified in the thesis abstract were taken from the text and recorded separately in the txt files. Thesis contents and keywords that were normalized were transferred to a single txt file. The deep learning method, an iterative neural network model, was used for Long-Short-Term Memory (LSTM) keyword inference. With the model trained in LSTM, the keyword is suggested.

Benzer Tezler

  1. Veri madenciliği teknikleri ile bulut bilişim tabanlı giyilebilir hareket tanı sistemi oluşturulması

    Creating cloud computing based wearable motion diagnostic system with data mining techniques

    ERHAN KAVUNCUOĞLU

    Doktora

    Türkçe

    Türkçe

    2022

    Mühendislik BilimleriErciyes Üniversitesi

    Biyomedikal Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ESMA UZUNHİSARCIKLI

    DOÇ. DR. AHMET TURAN ÖZDEMİR

  2. Veri madenciliği ve makine öğrenmesi yaklaşımı ile tiroit kanserinin tanılanması

    Diagnosis of thyroid cancer using data mining and machine learning approach

    MEHMET EMİN ASAN

    Doktora

    Türkçe

    Türkçe

    2024

    Endüstri ve Endüstri MühendisliğiSakarya Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. HARUN TAŞKIN

  3. RFMLP based customer segmentation and customer churn analysis in heavy equipment industry using customer transactions data

    İş makinesi sektöründe müşteri işlem verilerini kullanarak RFMLP tabanlı müşteri segmentasyonu ve müşteri kayıp analizi

    MUSTAFA ÇAMLICA

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. FETHİ ÇALIŞIR

  4. Tam koşullu üretim benzetim modellemesi ile veri madenciliği teknikleri kullanılarak kestirimci bakım ve makine öğrenmesi analizleri

    Predictive maintenance and machine learning analysisusing data mining techniques with full conditionalproduction simulation modelling

    ERGİN UĞURLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Katip Çelebi Üniversitesi

    Sistem Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AYŞEGÜL ALAYBEYOĞLU

  5. Veri madenciliği teknikleri ile sağlık turizminde rezervasyon iptallerinin tahmini

    Prediction of reservation cancellations in health tourism with data mining techniques

    EROKAN CANBAZOĞLU

    Doktora

    Türkçe

    Türkçe

    2024

    EkonometriAkdeniz Üniversitesi

    Ekonometri Ana Bilim Dalı

    PROF. DR. EMRE İPEKÇİ ÇETİN