Innovative cluster–based smart approaches to enhance information retrieval
Bilgi erişimi iyileştirmek için yenilikçi küme tabanlı akıllı yaklaşımlar
- Tez No: 942724
- Danışmanlar: DR. ÖĞR. ÜYESİ YASİN ORTAKCI
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: Karabük Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 112
Özet
Bu tez, gelişmiş kümeleme ve merkezilik odaklı teknikler aracılığıyla metin özetleme ve bilgi erişimini geliştirmek için yenilikçi metodolojiler önermektedir. İlk bölüm, kümeleme tabanlı cümle seçimini transformer tabanlı modellerle entegre ederek metin özetlemeyi optimize etmeye odaklanmaktadır. Özellik çıkarma ve K-means kümelemesi için TF-IDF'den yararlanılarak temsili cümleler belirlenir ve bunlar daha sonra özlü ve tutarlı özetler oluşturmak için BART modelinin girdisi olur. Yaklaşım, CNN/DailyMail ve XSum gibi örnek veri kümeleri üzerinde değerlendirilmiş ve ROUGE metriklerine dayalı özetlemede önemli gelişmeler göstermiştir. İkinci bölümde, PageRank algoritmasını merkezilik ölçütleriyle birleştirerek bilgi erişimi ve soru cevaplama sistemleri için yeni bir merkezilik odaklı kümeleme algoritması tanıtılmaktadır. Bu metodoloji, Quora Soruları gibi gerçek dünya veri kümeleri kullanılarak doğrulanmış, BM25, LocalRank ve LeaderRank gibi yöntemlere kıyasla hassasiyet ve geri çağırma ölçütleri açısından daha iyi performans göstermiştir. Araştırma, ölçeklenebilirlik, bağlam farkındalığı ve kullanıcı memnuniyeti konularındaki zorlukları ele alarak ve alanlarına katkıda bulunmaktadır. Etkili bilgi keşfi için gelişmiş erişim algoritmalarının yanı sıra, çıkarımcı ve soyutlayıcı teknikleri harmanlayan hibrit modellerin artan önemini vurgulamaktadır. Gelecekteki çalışmalar, multimedya içeriğini keşfetmeyi ve daha fazla optimizasyon için kullanıcı geri bildirimini hesaba katmayı içermektedir.
Özet (Çeviri)
This thesis suggests novel approaches to improve information retrieval (IR) and text summarization using centrality-driven and clustering techniques. By combining transformer-based model with clustering-based sentence selection, the first section optimizes text summarization. Representative sentences are found by using TF-IDF for feature extraction and K-means clustering. These sentences are then fed into the BART model to provide succinct and logical summaries. The method shows notable improvements in summarization quality based on ROUGE criteria when tested on benchmark datasets like CNN/Daily Mail and XSum. By combining the PageRank algorithm with centrality measurements, the second approach presents a unique centrality-driven clustering technique for IR and question-answering systems. Real-world datasets like Quora questions are used to validate this methodology, which outperforms techniques like BM25, LocalRank, and LeaderRank in terms of of precision and recall. The research contributes to the fields of NLP and IR by addressing challenges in scalability, context-awareness, and user satisfaction. It emphasizes the growing importance of hybrid models that blend extractive and abstractive techniques, as well as advanced retrieval algorithms for efficient knowledge discovery. Future work includes exploring multimedia content and incorporating user feedback for further optimization.
Benzer Tezler
- Etkin sorgu önerileri için kullanıcı sorgularının görev tabanlı yönetilmesi
Task based management of user queries for effective query suggestions
NURULLAH ATEŞ
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. YUSUF YASLAN
- Çevrim içi platformlarda sunulan ikinci el lüksün tüketici perspektifinden değerlendirilmesi
Evaluating second-hand luxury on online platforms from a consumer perspective
FATMA NUR SARIKAYA
Yüksek Lisans
Türkçe
2024
İşletmeGalatasaray Üniversitesiİşletme Ana Bilim Dalı
DOÇ. DR. NİLŞAH CAVDAR AKSOY
- Elektronik kart üretiminde çizelgeleme problemleri için süreç akışını dikkate alan bütünleşik bir yaklaşım ve uygulama
An integrated approach and application considering process flow for scheduling problems in electronic card production
ÖMER FARUK ÜNAL
Yüksek Lisans
Türkçe
2023
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. ŞEYDA SERDAR ASAN
- New forms of the creative economy: Creative hubs in Istanbul
Yaratıcı ekonomı̇nı̇n yenı̇ formları: İstanbul'dakı̇ yaratıcı merkezler
MELTEM PARLAK
Doktora
İngilizce
2021
Şehircilik ve Bölge Planlamaİstanbul Teknik ÜniversitesiŞehir ve Bölge Planlama Ana Bilim Dalı
PROF. DR. TÜZİN BAYCAN
- Akıllı uzmanlaşma stratejisi Fırat teknokent örneği
Smart specialization strategy Firat technopolis example
SEMA AKIN
Yüksek Lisans
Türkçe
2019
Bilim ve TeknolojiFırat ÜniversitesiTeknoloji ve Bilgi Yönetimi Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖZCAN DEMİR