Semantic search on turkish news domain with automatic query expansion
Otomatik sorgu genişletmesi ile türkçe haber için semantik arama
- Tez No: 442118
- Danışmanlar: PROF. DR. FEHİME NİHAN ÇİÇEKLİ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 70
Özet
Bu tezde sorgu genişletme ile Türkçe haber alanında yapılan anlamsal arama- lar sunulmaktadır. Hedefimiz kullanıcıya arama yaptıkları anahtar kelimeler ile en ilgili haberleri sunmaktır. Sistemimiz Hürriyet, Milliyet, Sabah, vb. haber sitelerinin veri kaynaklarını kullanmaktadır. Sistemimiz, kullanıcının sorgusunu kelime gömme ve anlamsal ilişkilendirme tekniklerini kullanarak genişletmekte- dir. Dahası, önemli bilgiler barındıran isimsel varlıklar, haber kaynaklarından ve kullanıcı sorgularından çıkarılmakta ve bu isimsel varlıklar, haberlerin en üstünde döndürülmek üzere sıralanmaktadır. Arama işleminin devamında ise geleneksel bilgi çıkarma (IR) tekniklerine bağlı kalınmaktadır. Türkçe dili için, bilinen kadarıyla, sistemimiz haber verileri üzerinde sorgu genişletme ve arama tekniklerini kullanan ilk girişimdir
Özet (Çeviri)
In this thesis, semantic search on Turkish news domain with query expansion is proposed. Our aim is to provide the user with the most relevant documents related to their entered keywords. Our system uses data sources from Turkish news websites such as Hürriyet, Milliyet, Sabah, etc. Our system extends the user's query with word embeddings and semantic relatedness. Furthermore, named entities, containing precious information, are extracted from news sources and user query and ranked to return on top of the results. In the rest of search process, it relies on traditional information retrieval (IR) techniques. For Turkish language, to the best of our knowledge, our system is the first attempt to use such search and query extension techniques on news data.
Benzer Tezler
- Arama sorguları üzerinde görev tabanlı kümeleme
Task-based clustering on search queries
ALMILA SELCEN AKGÜN
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YUSUF YASLAN
- Derin öğrenme yöntemleri kullanılarak Türkçe haber metinlerinden haber başlığı üretilmesi
Generating news headline from Turkish news using deep learning methods
ENİSE KARAKOÇ
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGebze Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BURCU YILMAZ
- Haber kaynaklarından makine öğrenmesi ile Türkiye genelinde zaman bazlı elektrik enerjisi tüketim modeli
Time based electrical energy consumption model in Turkey using machine learning on news data
HÜSEYİN KEÇELİ
Yüksek Lisans
Türkçe
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTürk Hava Kurumu ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ENGİN DEMİR
YRD. DOÇ. DR. TAYFUN KÜÇÜKYILMAZ
- Tweets on a tree: Index-based clustering of tweets
Ağaçtaki tweetler: Tweetlerin dizin bazlı kümelenmesi
MERT KEMAL ERPAM
Yüksek Lisans
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
PROF. DR. YÜCEL SAYGIN
- Türkçe metinlerden anlamsal bilgi çıkarımı için bir veri madenciliği uygulaması
A data mining application for extracting semantic information from Turkish texts
ABDULLAH ALPHAN ARSLAN
Yüksek Lisans
Türkçe
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBaşkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HASAN OĞUL