Geri Dön

Akademik yayınlar için makine öğrenmesi tabanlı arama motoru tasarlanması ve uygulanması

Design and implementation of a machine learning based search engine for academic publications

  1. Tez No: 518080
  2. Yazar: MUHAMMED ABDULHAMİD KARABIYIK
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ASIM SİNAN YÜKSEL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Süleyman Demirel Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 56

Özet

Dikey arama motoru üzerine hazırlanan bu tez çalışmasında, makine öğrenmesi metotları ile metin sınıflandırma işlemi yapılmıştır. Arama motorunun sadece akademik yayınları bulması için kısıtlayıcı bir ağ örümceği tasarlanmıştır. Yapılan uygulamada arama sonuçlarının en doğru şekilde bulunabilmesi için metin sınıflandırma işlemi gerçekleştirilmiştir. Bu alanda en çok kullanılan sınıflandırıcılardan olan Sade Bayes ve Destek Vektör Makineleri sınıflandırıcıları uygulanarak elde edilen sonuçlar karşılaştırılmıştır. Geliştirilen uygulamada akademik yayınlar 14 ana konu başlığı, 450 adet metin özeti ile eğitilerek makine öğrenmesi sınıfları için kullanılmıştır. Yapılan deneylerde metin sınıflandırma için eğitim setinin ve konu başlıklarının kesin değerler içermesi gerektiği ve sınıflandırma sonuçlarını doğrudan etkilediği görülmüştür. Birden çok bilim dalıyla ilişkili olan veya başka bilim dalı terimlerine hitap eden çalışmalarda sınıflandırmanın daha zor olduğu sonucuna varılmıştır. Aynı test verisi uygulandığında Sade Bayes sınıflandırıcıda %80, Destek Vektör Makineleri sınıflandırıcısında ise %70 başarı oranı elde edilmiştir.

Özet (Çeviri)

In this thesis study on vertical search engine, text classification was performed with machine learning methods. A restrictive web crawler was designed for the search engine to find only academic publications. The text classification was performed in order to find the most accurate search results. The results that are obtained by applying Naive Bayesian and Support Vector Machine classifiers, which are the most used classifiers, are compared. In the developed application, academic publications were used for machine learning classification and application was trained with 450 text summaries 14 scientific fields. It was observed that the training set for the text classification and the scientific fields should contain precise values and the classification results have a direct effect on the experiments performed. It was concluded that it was more difficult to classify the studies involving more than one science discipline or addressing other scientific disciplines. Naive Bayesian classifier achieved 80% success rate and Support Vector machine classifier achieved 70% succes rate when the same test data were applied.

Benzer Tezler

  1. Graph-based keyword extraction method for scientific publications

    Bilimsel yayınlar için grafik tabanlı anahtar kelime çıkartma yönetemi

    ABDIRAHMAN MOHAMED ALI

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Ticaret Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ARZU KAKIŞIM

  2. Açık kaynak istihbaratında sosyal medya kullanımının analizi

    Analysis of social media use in open source intelligence

    ELİF TİRYAKİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Uluslararası İlişkilerMilli Savunma Üniversitesi

    İstihbarat Çalışmaları Ana Bilim Dalı

    PROF. DR. BARIŞ ÖZDAL

  3. Use of deep learning for research paper recommendation

    Araştırma makale önerisi için derin öğrenmenin kullanımı

    DONIAZAD BEN SAYAH

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBEYKOZ ÜNİVERSİTESİ

    Bilgisayar Mühendisliği Ana Bilim Dalı

    Assist. Prof. Dr. ÖZLEM FEYZA ERKAN

  4. Repatriation both ways: A theoretical approach to the repatriation policies of Turkey through case studies

    Örnek vakalar ışığında Türkiye Cumhuriyeti'nin yasa dışı yollarla yurt dışına çıkarılan kültür varlıklarının ülkeye iadesi politikalarının incelenmesi

    ÖZKAN ATMIŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Arkeolojiİhsan Doğramacı Bilkent Üniversitesi

    Arkeoloji Ana Bilim Dalı

    PROF. DR. DOMINIQUE KASSAB TEZGÖR

  5. Modeling educational data with machine learning methods

    Eğitim verilerinin makine oğrenmesi algoritmaları kullanılarak modellenmesi

    AYŞE İLKNUR DİLEK

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Kültür Üniversitesi

    Matematik ve Bilgisayar Bilimleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET FATİH UÇAR