Geri Dön

Innovative cluster–based smart approaches to enhance information retrieval

Bilgi erişimi iyileştirmek için yenilikçi küme tabanlı akıllı yaklaşımlar

  1. Tez No: 942724
  2. Yazar: ZAHIR MOHAMED ELKHATIM MAHADI EDREES
  3. Danışmanlar: DR. ÖĞR. ÜYESİ YASİN ORTAKCI
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: Karabük Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 112

Özet

Bu tez, gelişmiş kümeleme ve merkezilik odaklı teknikler aracılığıyla metin özetleme ve bilgi erişimini geliştirmek için yenilikçi metodolojiler önermektedir. İlk bölüm, kümeleme tabanlı cümle seçimini transformer tabanlı modellerle entegre ederek metin özetlemeyi optimize etmeye odaklanmaktadır. Özellik çıkarma ve K-means kümelemesi için TF-IDF'den yararlanılarak temsili cümleler belirlenir ve bunlar daha sonra özlü ve tutarlı özetler oluşturmak için BART modelinin girdisi olur. Yaklaşım, CNN/DailyMail ve XSum gibi örnek veri kümeleri üzerinde değerlendirilmiş ve ROUGE metriklerine dayalı özetlemede önemli gelişmeler göstermiştir. İkinci bölümde, PageRank algoritmasını merkezilik ölçütleriyle birleştirerek bilgi erişimi ve soru cevaplama sistemleri için yeni bir merkezilik odaklı kümeleme algoritması tanıtılmaktadır. Bu metodoloji, Quora Soruları gibi gerçek dünya veri kümeleri kullanılarak doğrulanmış, BM25, LocalRank ve LeaderRank gibi yöntemlere kıyasla hassasiyet ve geri çağırma ölçütleri açısından daha iyi performans göstermiştir. Araştırma, ölçeklenebilirlik, bağlam farkındalığı ve kullanıcı memnuniyeti konularındaki zorlukları ele alarak ve alanlarına katkıda bulunmaktadır. Etkili bilgi keşfi için gelişmiş erişim algoritmalarının yanı sıra, çıkarımcı ve soyutlayıcı teknikleri harmanlayan hibrit modellerin artan önemini vurgulamaktadır. Gelecekteki çalışmalar, multimedya içeriğini keşfetmeyi ve daha fazla optimizasyon için kullanıcı geri bildirimini hesaba katmayı içermektedir.

Özet (Çeviri)

This thesis suggests novel approaches to improve information retrieval (IR) and text summarization using centrality-driven and clustering techniques. By combining transformer-based model with clustering-based sentence selection, the first section optimizes text summarization. Representative sentences are found by using TF-IDF for feature extraction and K-means clustering. These sentences are then fed into the BART model to provide succinct and logical summaries. The method shows notable improvements in summarization quality based on ROUGE criteria when tested on benchmark datasets like CNN/Daily Mail and XSum. By combining the PageRank algorithm with centrality measurements, the second approach presents a unique centrality-driven clustering technique for IR and question-answering systems. Real-world datasets like Quora questions are used to validate this methodology, which outperforms techniques like BM25, LocalRank, and LeaderRank in terms of of precision and recall. The research contributes to the fields of NLP and IR by addressing challenges in scalability, context-awareness, and user satisfaction. It emphasizes the growing importance of hybrid models that blend extractive and abstractive techniques, as well as advanced retrieval algorithms for efficient knowledge discovery. Future work includes exploring multimedia content and incorporating user feedback for further optimization.

Benzer Tezler

  1. Etkin sorgu önerileri için kullanıcı sorgularının görev tabanlı yönetilmesi

    Task based management of user queries for effective query suggestions

    NURULLAH ATEŞ

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. YUSUF YASLAN

  2. Çevrim içi platformlarda sunulan ikinci el lüksün tüketici perspektifinden değerlendirilmesi

    Evaluating second-hand luxury on online platforms from a consumer perspective

    FATMA NUR SARIKAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    İşletmeGalatasaray Üniversitesi

    İşletme Ana Bilim Dalı

    DOÇ. DR. NİLŞAH CAVDAR AKSOY

  3. Elektronik kart üretiminde çizelgeleme problemleri için süreç akışını dikkate alan bütünleşik bir yaklaşım ve uygulama

    An integrated approach and application considering process flow for scheduling problems in electronic card production

    ÖMER FARUK ÜNAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ŞEYDA SERDAR ASAN

  4. New forms of the creative economy: Creative hubs in Istanbul

    Yaratıcı ekonomı̇nı̇n yenı̇ formları: İstanbul'dakı̇ yaratıcı merkezler

    MELTEM PARLAK

    Doktora

    İngilizce

    İngilizce

    2021

    Şehircilik ve Bölge Planlamaİstanbul Teknik Üniversitesi

    Şehir ve Bölge Planlama Ana Bilim Dalı

    PROF. DR. TÜZİN BAYCAN

  5. Akıllı uzmanlaşma stratejisi Fırat teknokent örneği

    Smart specialization strategy Firat technopolis example

    SEMA AKIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilim ve TeknolojiFırat Üniversitesi

    Teknoloji ve Bilgi Yönetimi Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖZCAN DEMİR