Bağlı veri kaynakları ve ilişkileri kullanılarak haberlerin öbeklendirilmesi
News clustering using linked data resources and their relationships
- Tez No: 450647
- Danışmanlar: PROF. DR. ERDOĞAN DOĞDU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: Türkçe
- Üniversite: TOBB Ekonomi ve Teknoloji Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 65
Özet
Metin veya doküman öbeklendirilmesi, aynı konuyla ilgili olan metin belgelerinin belirlenerek gruplandırılması işlemidir. Bu işlem, metin belgelerinin sayısının artmaya devam ettiği sürekli büyüyen Web için özellikle önemlidir. Haber öbeklendirilmesi bu alanda, haber belgelerinin konu bazında sınıflandırılmasının hedeflendiği özel bir konudur. Bu probleme ilişkin daha önce geliştirilmiş çözümler, belgelerin içlerinde geçen kelimelerle ve bu kelimelerin sıklıklarıyla temsil edildiği ``sözcük çantası'' yaklaşımını kullanmıştır ve öbeklendirme işlemi belgelerin bu gösterimi kullanılarak ölçülen benzerlikler kullanılarak yapılmıştır. Bununla birlikte, bu yaklaşım sözcüklerin anlamını veya önemini dikkate almaz ve sözcüklerdeki muğlaklık çözümlenmez. Bu çalışmada doküman veya haber öbeklendirilmesi konusunda ``bağlı veri'' kullanan yeni bir yaklaşım geliştirilmiştir. Bu yaklaşımda haber belgelerindeki sözcükler ve cümleler, DBpedia gibi bağlı veri bilgi tabanlarındaki gerçek dünya karşılıklarına eşlenir ve belgeler sahip oldukları bağlı veri varlıklarıyla temsil edilmektedir. Daha sonra haberler bu varlıklar ve bu varlıkların kategori hiyerarşisi benzerlikleri kullanılarak öbeklendirilmektedir. Değerlendirme sonuçları, geliştirilen yaklaşımın kelime çantasına göre daha iyi sonuç verdiğini göstermektedir.
Özet (Çeviri)
Text clustering or document clustering is the task of identifying and grouping text documents that are about the same topic. This is especially important for the ever growing Web where the number of free-text documents just keep increasing. News clustering is a special task in this domain in which the goal is to classify news documents by topic. Earlier solutions on this problem utilized ``bag of words'' approach in which documents are represented with words and their frequencies in documents, and the clustering task measures the similarity of documents using this representation. However, this approach does not take into consideration the meaning or the importance of words and ambiguity in words is not resolved. We present a new approach to document or news clustering, we utilize ``linked data''. We map words or phrases in news documents to their real-world counterparts in ``linked data'' knowledge bases such as DBpedia and represent documents with linked data entities they have. Then we cluster documents using these entities and their category hierarchy similarities. Evaluation results show that our approach performs better than the bag of words approach.
Benzer Tezler
- Denizcilik işletmelerine yönelik entelektüel sermaye değerlemesi üzerine bir model önerisi
A model proposal on valuation for intellectual capital of maritime businesses
GİZEM ÇEVİK
Doktora
Türkçe
2023
Denizcilikİstanbul Teknik ÜniversitesiDeniz Ulaştırma Mühendisliği Ana Bilim Dalı
PROF. DR. ÖZCAN ARSLAN
- Networked computing-based system identification and control of electromechanical systems with industrial IoT
Endüstriyel IoT ile elektromekanik sistemlerin ağ hesaplama tabanlı sistem tanıma ve kontrolü
RAMAZAN KAYA
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
DOÇ. DR. ALİ FUAT ERGENÇ
- Mobil telefon kullanımına bağlı oluşan 900-1800 mhz radyo frekans dalgalarının meydana getirdiği elektromanyetik alanın iliak kanat kemik mineral yoğunluğuna etkisi
The effect of electromagnetic fields on bone mineral density of iliac bone produced by 900-1800 mhz radio frequency waves dependent on cellular phone usage
BEŞİR ANDAÇ AKSOY
Tıpta Uzmanlık
Türkçe
2006
Ortopedi ve TravmatolojiSüleyman Demirel ÜniversitesiOrtopedi ve Travmatoloji Ana Bilim Dalı
PROF.DR. NEVRES HÜRRİYET AYDOĞAN
- Deep learning-based building segmentation using high-resolution aerial images
Yüksek çözünürlüklü hava görüntüleri kullanarak derin öğrenme temelli bina bölütlemesi
BATUHAN SARITÜRK
Doktora
İngilizce
2022
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. DURSUN ZAFER ŞEKER
- Transnational agency or economic empowerment? Experiences of Kyrgyz domestic workers in Turkey
Ulusötesi faillik veya ekonomik güçlenme? Türkiye'deki Kırgız ev işçilerinin deneyimleri
ARAILYM GAIPOVA
Yüksek Lisans
İngilizce
2022
SosyolojiOrta Doğu Teknik ÜniversitesiSosyoloji Ana Bilim Dalı
PROF. DR. FATMA UMUT BEŞPINAR AKGÜNER