Makine öğrenmesi ile veri madenciliği teknikleri kullanılarak anahtar kelime tahmini ve tezlerdeki anahtar kelimelerin doğruluk oranı tespiti
Keyword estimation and accuracy of keywords in theses using machine learning and data mining techniques
- Tez No: 779347
- Danışmanlar: DR. ÖĞR. ÜYESİ FATİH ŞAHİN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Nişantaşı Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgi Teknolojileri Bilim Dalı
- Sayfa Sayısı: 90
Özet
Günümüzde bilgisayar çağında istenilen veriye ulaşım kolaylaşmakla birlikte kirli verilerden dolayı doğru ve güvenilir veriye ulaşmak zorlaşmıştır. Anahtar kelimeler metnin konusunu anlamamızı kolaylaştırdığı için, metinlerde tanımı büyük önem arz etmektedir. Uzun metinleri ya da dokümanların tamamını okumaya gerek kalmadan metin ya da doküman hakkında genel bilgi sahibi olabilir, çıkarımlar yapılabilir. Arama işlemlerinde doğru anahtar kelimelerin seçimi ve veri ambarlarındaki verilerde belirtilen anahtar kelimelerin doğru bir şekilde tanımlanmış olması bizi doğru sonuçlara götürür. Böylelikle anahtar kelimelerle bir metnin ne ile alakalı olduğu konusunda hızlı bir şekilde tahminde bulunulabilir ve amacımızla alakalı olmayan metinleri okumakla zaman kaybedilmemiş olunur. Bu çalışmada metin madenciliğinde doğal dil işleme tekniği olan metin işleme ve analizi konusunda çalışma yapılmıştır. Tez dosyalarından elde edilen metin üzerinden, en çok kullanılan anahtar kelimeler bulunarak kullanıcılara öneri olarak sunulması amaçlanmıştır. Anahtar kelime çıkarımında, tez dosyaları üzerinden toplanan veri seti üzerinden hareketle çalışılmıştır. Bu işlem için yazım dili Türkçe olan 900 tez incelenmiştir. Öncelikle her bir tez dosyası için normalizasyon işlemleri yapılmış, tez özetinde belirtilen orjinal anahtar kelimeler de metinden alınarak txt dosyalarına ayrı ayrı kaydedilmiştir. Normalizasyon işleminden geçirilen tez içerikleri ve anahtar kelimeler tek bir txt dosyasına aktarılmıştır. Yinelemeli sinir ağı modeli olan derin öğrenme yöntemi Uzun-Kısa Süreli Bellek (LSTM) anahtar kelime çıkarımı için kullanılmıştır. LSTM'de eğitilen modelle, anahtar kelime önerilmiştir.
Özet (Çeviri)
Today, although it is easier to reach the desired data in the computer age, it has become difficult to reach accurate and reliable data due to dirty data. Since keywords make it easier for us to understand the subject of the text, its definition is of great importance in the texts. Without having to read long texts or entire documents, we can have general information about the text or document and make inferences. Choosing the right keywords in search operations and correctly defining the keywords specified in the data in the data warehouses will lead us to the right results. In this way, keywords can quickly predict what a text is related to, and time is not wasted on reading texts that are not relevant to our purpose. In this study, a study was conducted on text processing and analysis, which is a natural language processing technique in text mining. Based on the text obtained from the thesis files, it is aimed to present the most used keywords to the users as suggestions. In keyword inference, the data set collected through the thesis files was studied. For this process, 900 theses with Turkish written language were examined. First of all, normalization procedures were carried out for each thesis file, and the original keywords specified in the thesis abstract were taken from the text and recorded separately in the txt files. Thesis contents and keywords that were normalized were transferred to a single txt file. The deep learning method, an iterative neural network model, was used for Long-Short-Term Memory (LSTM) keyword inference. With the model trained in LSTM, the keyword is suggested.
Benzer Tezler
- Veri madenciliği teknikleri ile bulut bilişim tabanlı giyilebilir hareket tanı sistemi oluşturulması
Creating cloud computing based wearable motion diagnostic system with data mining techniques
ERHAN KAVUNCUOĞLU
Doktora
Türkçe
2022
Mühendislik BilimleriErciyes ÜniversitesiBiyomedikal Mühendisliği Ana Bilim Dalı
DOÇ. DR. ESMA UZUNHİSARCIKLI
DOÇ. DR. AHMET TURAN ÖZDEMİR
- Veri madenciliği ve makine öğrenmesi yaklaşımı ile tiroit kanserinin tanılanması
Diagnosis of thyroid cancer using data mining and machine learning approach
MEHMET EMİN ASAN
Doktora
Türkçe
2024
Endüstri ve Endüstri MühendisliğiSakarya ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. HARUN TAŞKIN
- RFMLP based customer segmentation and customer churn analysis in heavy equipment industry using customer transactions data
İş makinesi sektöründe müşteri işlem verilerini kullanarak RFMLP tabanlı müşteri segmentasyonu ve müşteri kayıp analizi
MUSTAFA ÇAMLICA
Yüksek Lisans
İngilizce
2022
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. FETHİ ÇALIŞIR
- Tam koşullu üretim benzetim modellemesi ile veri madenciliği teknikleri kullanılarak kestirimci bakım ve makine öğrenmesi analizleri
Predictive maintenance and machine learning analysisusing data mining techniques with full conditionalproduction simulation modelling
ERGİN UĞURLU
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Katip Çelebi ÜniversitesiSistem Mühendisliği Ana Bilim Dalı
DOÇ. DR. AYŞEGÜL ALAYBEYOĞLU
- Veri madenciliği teknikleri ile sağlık turizminde rezervasyon iptallerinin tahmini
Prediction of reservation cancellations in health tourism with data mining techniques
EROKAN CANBAZOĞLU