Bağlı veri kaynakları ve ilişkileri kullanılarak haberlerin öbeklendirilmesi
News clustering using linked data resources and their relationships
- Tez No: 450647
- Danışmanlar: PROF. DR. ERDOĞAN DOĞDU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: Türkçe
- Üniversite: TOBB Ekonomi ve Teknoloji Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 65
Özet
Metin veya doküman öbeklendirilmesi, aynı konuyla ilgili olan metin belgelerinin belirlenerek gruplandırılması işlemidir. Bu işlem, metin belgelerinin sayısının artmaya devam ettiği sürekli büyüyen Web için özellikle önemlidir. Haber öbeklendirilmesi bu alanda, haber belgelerinin konu bazında sınıflandırılmasının hedeflendiği özel bir konudur. Bu probleme ilişkin daha önce geliştirilmiş çözümler, belgelerin içlerinde geçen kelimelerle ve bu kelimelerin sıklıklarıyla temsil edildiği ``sözcük çantası'' yaklaşımını kullanmıştır ve öbeklendirme işlemi belgelerin bu gösterimi kullanılarak ölçülen benzerlikler kullanılarak yapılmıştır. Bununla birlikte, bu yaklaşım sözcüklerin anlamını veya önemini dikkate almaz ve sözcüklerdeki muğlaklık çözümlenmez. Bu çalışmada doküman veya haber öbeklendirilmesi konusunda ``bağlı veri'' kullanan yeni bir yaklaşım geliştirilmiştir. Bu yaklaşımda haber belgelerindeki sözcükler ve cümleler, DBpedia gibi bağlı veri bilgi tabanlarındaki gerçek dünya karşılıklarına eşlenir ve belgeler sahip oldukları bağlı veri varlıklarıyla temsil edilmektedir. Daha sonra haberler bu varlıklar ve bu varlıkların kategori hiyerarşisi benzerlikleri kullanılarak öbeklendirilmektedir. Değerlendirme sonuçları, geliştirilen yaklaşımın kelime çantasına göre daha iyi sonuç verdiğini göstermektedir.
Özet (Çeviri)
Text clustering or document clustering is the task of identifying and grouping text documents that are about the same topic. This is especially important for the ever growing Web where the number of free-text documents just keep increasing. News clustering is a special task in this domain in which the goal is to classify news documents by topic. Earlier solutions on this problem utilized ``bag of words'' approach in which documents are represented with words and their frequencies in documents, and the clustering task measures the similarity of documents using this representation. However, this approach does not take into consideration the meaning or the importance of words and ambiguity in words is not resolved. We present a new approach to document or news clustering, we utilize ``linked data''. We map words or phrases in news documents to their real-world counterparts in ``linked data'' knowledge bases such as DBpedia and represent documents with linked data entities they have. Then we cluster documents using these entities and their category hierarchy similarities. Evaluation results show that our approach performs better than the bag of words approach.
Benzer Tezler
- Denizcilik işletmelerine yönelik entelektüel sermaye değerlemesi üzerine bir model önerisi
A model proposal on valuation for intellectual capital of maritime businesses
GİZEM ÇEVİK
Doktora
Türkçe
2023
Denizcilikİstanbul Teknik ÜniversitesiDeniz Ulaştırma Mühendisliği Ana Bilim Dalı
PROF. DR. ÖZCAN ARSLAN
- Social vulnerability analysis of the cities affected by the february 6 kahramanmaras earthquakes
6 şubat Kahramanmaraş depreminden etkilenen şehirlerin sosyal hasar görebilirlik analizi
HİLAL AKIN
Yüksek Lisans
İngilizce
2025
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. HİMMET KARAMAN
- Disinformation in the post-truth era: A comparative analysis of the European Union, Türkiye and Brazil's instruments and practices for combating online disinformation
Hakikat sonrası çağda dezenformasyon: Avrupa Birliği, Türkiye ve Brezilya'nın çevrim içi dezenformasyonla mücadeleye yönelik araç ve pratiklerinin karşılaştırmalı analizi
İREM ŞARDAŞLAR
Yüksek Lisans
İngilizce
2025
HukukAnkara ÜniversitesiLatin Amerika Çalışmaları Ana Bilim Dalı
PROF. DR. BESİME PINAR ÖZDEMİR
- Evidence-based analysis of Türkiye's energy efficiency obligation scheme: sectoral applications, energy poverty, flexibility options and policy implications
Türkiye enerji verimliliği yükümlülükleri sisteminin kanita dayali analizi: sektörel uygulamalar, enerji yoksulluğu, esneklik seçenekleri ve politika çikarimlari
RABİA CİN
Doktora
İngilizce
2025
Enerjiİstanbul Teknik ÜniversitesiEnerji Bilim ve Teknoloji Ana Bilim Dalı
PROF. DR. SERMİN ONAYGİL
- Networked computing-based system identification and control of electromechanical systems with industrial IoT
Endüstriyel IoT ile elektromekanik sistemlerin ağ hesaplama tabanlı sistem tanıma ve kontrolü
RAMAZAN KAYA
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
DOÇ. DR. ALİ FUAT ERGENÇ