Improving educational search and question answering
Eğitsel arama ve soru cevaplandırmanın geliştirilmesi
- Tez No: 434215
- Danışmanlar: PROF. DR. ÖZGÜR ULUSOY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 101
Özet
Öğrenciler, okulla ilgili soruları için ilk tercih olarak arama motorlarını kullanırlar. Arama motorları, her ne kadar genel popülasyon için oldukça kullanışlı olsa da eğitim kurgusunun dışında yanıtlar getirebilir. Bir başka eğilim, sosyal ağ soru-cevap web siteleri ise emsallerinden cevaplar almak isteyen öğrenciler için ikinci bir seçenek olarak karşımıza çıkmaktadır. Çalışmamızda, bu iki bilgi kaynağının birbirlerinden faydalanılarak geliştirilmesi üzerinde durulmuştur. Çalışmamızın ilk kısmı soru-cevap web siteleri ile ilgilidir. Eğitsel soru-cevap web siteleri üzerinde bağlamsal ve davranışsal anlayışa sahip olmak için bir soru-cevap web sitesinin içeriği toplanmıştır. Bu içerik, kullanıcı davranışları ve eğitsel soru-cevap sitelerinin genel soru-cevap sitelerinden ne derece farklı olduğunu anlamak açısından analiz edilmiştir. İkinci kısımda, eğitsel sorular için bir sınıflandırıcı geliştirilmiştir. Bu sınıflandırıcı makine öğrenmesi tabanlı bir kaç algoritma ile dış kaynaklar üzerinde oluşturulmuş bir kaç arama tabanlı sınıflandırıcıdan oluşan bir“ensemble”sınıflandırıcıdır. Ayrıca, sınıflandırmayı güçlendirmek için bir sorgu genişletme yöntemi geliştirilip kullanılmıştır. Oluşan bu sınıflandırıcı, son olarak arama motoru sonuç sayfaları da kullanılarak daha da geliştirilmiştir. Üçüncü kısımda, eğitsel arama motoru sıralamasının sınıflandırma modeli kullanılarak geliştirilebilirliğini test etmek için, bir arama motorundan alınan sonuç sayfaları toplanıp etiketlenmiştir. Sorgu-doküman sınıf ilişkisinin ilgi düzeyi ile alakalı olduğu varsayımından yola çıkarak, arama motoru sıralamasını geliştirmek üzere beş yöntem kullanılmıştır. Bu yöntemler, çeşitli sorgu setleri üzerinde uygulanıp eğitsel sıralama bağlamında kayda değer gelişme olduğu görülmüştür. Son olarak, eğitsel yazım denetimi üzerinde durulmuştur. Eğitsel arama sistemlerinde, kullanıcıların yazım hataları yapması sık rastlanan bir durumdur. İlk olarak iki ticari arama motorunun sorgu kayıtları, eğitsel amaçlı tasarlanmamış ve eğitsel kelimeleri içermeyen fakat genel olarak iyi bilinen beş sorgu denetimi ve düzeltmesi yazılımı kullanılarak denetlenmiştir. Bu yazılımlardan bir tanesinin sözlüğünün, küçük boyutlu bir eğitsel kelime listesi ile bile desteklendiğinde“precision”,“recall”ve F1 değerlerinin gelişme gösterdiği görülmüştür.
Özet (Çeviri)
Students use general web search engines (GSEs) as their primary source of research while trying to find answers to school related questions. Although GSEs are highly relevant for the general population, they may return results that are out of education context. Another rising trend; social community question answering websites (CQ&A) are the secondary choice for students who try to get answers from other peers online. We focus on discovering possible improvements on educational search by leveraging both of the two information sources. The first part of our work involves Q&A websites. In order to gain contextual and behavioral insights, we extract the content of a commonly used educational Q&A website with a scraper we implement. We analyze the content in terms of user behavior and try to understand to what extent the educational Q&A differs from the general purpose Q&A. In the second part, we implement a classifier for educational questions. This classifier is built by an ensemble method that employs several regular learning algorithms and retrieval based ones that utilize external resources. We also build a query expander to facilitate classification. We further improve the classification using search engine results. In the third part, in order to find out whether search engine ranking can be improved in the education domain using the classification model, we collect and label a set of query results retrieved from a GSE. We propose five ad-hoc methods to improve search ranking based on the idea that the query-document category relation is an indicator of relevance. We evaluate these methods on various query sets and show that some of the methods significantly improve the rankings in the education domain. In the last part, we focus on educational spell checking. In educational search systems, it is common for users to make spelling mistakes. Actual query logs of two commercial search engines in the education domain are analyzed in terms of spelling mistakes using 5 well-known spell correction software that are not education specific and lack the terms that are used in the education field. It is shown that by extending the spell-check dictionary of one of them, even with a small-sized education oriented word-list, one can improve the precision, recall and F1 values of a spell-checker.
Benzer Tezler
- Yaz Kur'an kursları dinimi öğreniyorum ve etkinlik kitabım ders kitaplarının biçim ve içerik yönünden karşılaştırmalı incelenmesi
Comparative investigation of the textbooks of religious learning and activity a summer quran courses books in terms of form and content
AMİNA NURİYE ÇITIRIK
Yüksek Lisans
Türkçe
2018
DinAnkara Yıldırım Beyazıt ÜniversitesiFelsefe ve Din Bilimleri Ana Bilim Dalı
PROF. ZEKİ SALİH ZENGİN
- Yabancı dil olarak Türkçenin öğretiminde halk hikayelerinden yararlanma
Using folk tales while teaching Turkish as foreing language
SERPİL ÖZDEMİR
Yüksek Lisans
Türkçe
2010
Eğitim ve ÖğretimDokuz Eylül ÜniversitesiTürkçe Eğitimi Ana Bilim Dalı
YRD. DOÇ. DR. NEVİN AKKAYA
- Lisansüstü öğrencilerin bilgi arama davranışları ve problem çözme becerileri: Zihin haritaları ve görüşleri
Graduate students' information seeking behaviors and problem solving skills: Mind maps and opinions
İLKAY TANRIKULU
Yüksek Lisans
Türkçe
2023
Eğitim ve ÖğretimGazi ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
PROF. DR. GÜLGÜN ALPAN
- Sağlık personeline yönelik 'anne sütünü tamamlayıcı beslenme eğitimi' geliştirilmesi
'promoting complementary feeding education' for healtcare providers
BETÜL YAMAN ÖZÇELİK
Tıpta Uzmanlık
Türkçe
2012
Beslenme ve Diyetetikİstanbul ÜniversitesiÇocuk Sağlığı ve Hastalıkları Ana Bilim Dalı
PROF. DR. MÜBECCEL DEMİRKOL
- Sağlık iletişimi perspektifinden Türkiye'deki 65 yaş ve üstü bireyleri anlamak: Sağlık ve yaşlanmaya ilişkin algı, tutum ve davranışlar üzerine bir araştırma
Understanding people aged 65 and over in Türkiye from a health communication perspective: A Study on perceptions, attitudes, and behaviors regarding health and aging
YAŞAR ŞEKERCİ
Doktora
Türkçe
2024
Halk SağlığıGalatasaray ÜniversitesiRadyo Televizyon ve Sinema Ana Bilim Dalı
DOÇ. DR. GAYE ASLI SANCAR DEMREN