Akademik yayınlar için makine öğrenmesi tabanlı arama motoru tasarlanması ve uygulanması
Design and implementation of a machine learning based search engine for academic publications
- Tez No: 518080
- Danışmanlar: DR. ÖĞR. ÜYESİ ASIM SİNAN YÜKSEL
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: Türkçe
- Üniversite: Süleyman Demirel Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 56
Özet
Dikey arama motoru üzerine hazırlanan bu tez çalışmasında, makine öğrenmesi metotları ile metin sınıflandırma işlemi yapılmıştır. Arama motorunun sadece akademik yayınları bulması için kısıtlayıcı bir ağ örümceği tasarlanmıştır. Yapılan uygulamada arama sonuçlarının en doğru şekilde bulunabilmesi için metin sınıflandırma işlemi gerçekleştirilmiştir. Bu alanda en çok kullanılan sınıflandırıcılardan olan Sade Bayes ve Destek Vektör Makineleri sınıflandırıcıları uygulanarak elde edilen sonuçlar karşılaştırılmıştır. Geliştirilen uygulamada akademik yayınlar 14 ana konu başlığı, 450 adet metin özeti ile eğitilerek makine öğrenmesi sınıfları için kullanılmıştır. Yapılan deneylerde metin sınıflandırma için eğitim setinin ve konu başlıklarının kesin değerler içermesi gerektiği ve sınıflandırma sonuçlarını doğrudan etkilediği görülmüştür. Birden çok bilim dalıyla ilişkili olan veya başka bilim dalı terimlerine hitap eden çalışmalarda sınıflandırmanın daha zor olduğu sonucuna varılmıştır. Aynı test verisi uygulandığında Sade Bayes sınıflandırıcıda %80, Destek Vektör Makineleri sınıflandırıcısında ise %70 başarı oranı elde edilmiştir.
Özet (Çeviri)
In this thesis study on vertical search engine, text classification was performed with machine learning methods. A restrictive web crawler was designed for the search engine to find only academic publications. The text classification was performed in order to find the most accurate search results. The results that are obtained by applying Naive Bayesian and Support Vector Machine classifiers, which are the most used classifiers, are compared. In the developed application, academic publications were used for machine learning classification and application was trained with 450 text summaries 14 scientific fields. It was observed that the training set for the text classification and the scientific fields should contain precise values and the classification results have a direct effect on the experiments performed. It was concluded that it was more difficult to classify the studies involving more than one science discipline or addressing other scientific disciplines. Naive Bayesian classifier achieved 80% success rate and Support Vector machine classifier achieved 70% succes rate when the same test data were applied.
Benzer Tezler
- Graph-based keyword extraction method for scientific publications
Bilimsel yayınlar için grafik tabanlı anahtar kelime çıkartma yönetemi
ABDIRAHMAN MOHAMED ALI
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Ticaret ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ARZU KAKIŞIM
- Açık kaynak istihbaratında sosyal medya kullanımının analizi
Analysis of social media use in open source intelligence
ELİF TİRYAKİ
Yüksek Lisans
Türkçe
2020
Uluslararası İlişkilerMilli Savunma Üniversitesiİstihbarat Çalışmaları Ana Bilim Dalı
PROF. DR. BARIŞ ÖZDAL
- Use of deep learning for research paper recommendation
Araştırma makale önerisi için derin öğrenmenin kullanımı
DONIAZAD BEN SAYAH
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBEYKOZ ÜNİVERSİTESİBilgisayar Mühendisliği Ana Bilim Dalı
Assist. Prof. Dr. ÖZLEM FEYZA ERKAN
- Repatriation both ways: A theoretical approach to the repatriation policies of Turkey through case studies
Örnek vakalar ışığında Türkiye Cumhuriyeti'nin yasa dışı yollarla yurt dışına çıkarılan kültür varlıklarının ülkeye iadesi politikalarının incelenmesi
ÖZKAN ATMIŞ
Yüksek Lisans
İngilizce
2023
Arkeolojiİhsan Doğramacı Bilkent ÜniversitesiArkeoloji Ana Bilim Dalı
PROF. DR. DOMINIQUE KASSAB TEZGÖR
- Modeling educational data with machine learning methods
Eğitim verilerinin makine oğrenmesi algoritmaları kullanılarak modellenmesi
AYŞE İLKNUR DİLEK
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Kültür ÜniversitesiMatematik ve Bilgisayar Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET FATİH UÇAR