Geri Dön

Bağlı veri kaynakları ve ilişkileri kullanılarak haberlerin öbeklendirilmesi

News clustering using linked data resources and their relationships

  1. Tez No: 450647
  2. Yazar: MEHMET MERT YÜCESAN
  3. Danışmanlar: PROF. DR. ERDOĞAN DOĞDU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2016
  8. Dil: Türkçe
  9. Üniversite: TOBB Ekonomi ve Teknoloji Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 65

Özet

Metin veya doküman öbeklendirilmesi, aynı konuyla ilgili olan metin belgelerinin belirlenerek gruplandırılması işlemidir. Bu işlem, metin belgelerinin sayısının artmaya devam ettiği sürekli büyüyen Web için özellikle önemlidir. Haber öbeklendirilmesi bu alanda, haber belgelerinin konu bazında sınıflandırılmasının hedeflendiği özel bir konudur. Bu probleme ilişkin daha önce geliştirilmiş çözümler, belgelerin içlerinde geçen kelimelerle ve bu kelimelerin sıklıklarıyla temsil edildiği ``sözcük çantası'' yaklaşımını kullanmıştır ve öbeklendirme işlemi belgelerin bu gösterimi kullanılarak ölçülen benzerlikler kullanılarak yapılmıştır. Bununla birlikte, bu yaklaşım sözcüklerin anlamını veya önemini dikkate almaz ve sözcüklerdeki muğlaklık çözümlenmez. Bu çalışmada doküman veya haber öbeklendirilmesi konusunda ``bağlı veri'' kullanan yeni bir yaklaşım geliştirilmiştir. Bu yaklaşımda haber belgelerindeki sözcükler ve cümleler, DBpedia gibi bağlı veri bilgi tabanlarındaki gerçek dünya karşılıklarına eşlenir ve belgeler sahip oldukları bağlı veri varlıklarıyla temsil edilmektedir. Daha sonra haberler bu varlıklar ve bu varlıkların kategori hiyerarşisi benzerlikleri kullanılarak öbeklendirilmektedir. Değerlendirme sonuçları, geliştirilen yaklaşımın kelime çantasına göre daha iyi sonuç verdiğini göstermektedir.

Özet (Çeviri)

Text clustering or document clustering is the task of identifying and grouping text documents that are about the same topic. This is especially important for the ever growing Web where the number of free-text documents just keep increasing. News clustering is a special task in this domain in which the goal is to classify news documents by topic. Earlier solutions on this problem utilized ``bag of words'' approach in which documents are represented with words and their frequencies in documents, and the clustering task measures the similarity of documents using this representation. However, this approach does not take into consideration the meaning or the importance of words and ambiguity in words is not resolved. We present a new approach to document or news clustering, we utilize ``linked data''. We map words or phrases in news documents to their real-world counterparts in ``linked data'' knowledge bases such as DBpedia and represent documents with linked data entities they have. Then we cluster documents using these entities and their category hierarchy similarities. Evaluation results show that our approach performs better than the bag of words approach.

Benzer Tezler

  1. Denizcilik işletmelerine yönelik entelektüel sermaye değerlemesi üzerine bir model önerisi

    A model proposal on valuation for intellectual capital of maritime businesses

    GİZEM ÇEVİK

    Doktora

    Türkçe

    Türkçe

    2023

    Denizcilikİstanbul Teknik Üniversitesi

    Deniz Ulaştırma Mühendisliği Ana Bilim Dalı

    PROF. DR. ÖZCAN ARSLAN

  2. Networked computing-based system identification and control of electromechanical systems with industrial IoT

    Endüstriyel IoT ile elektromekanik sistemlerin ağ hesaplama tabanlı sistem tanıma ve kontrolü

    RAMAZAN KAYA

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ALİ FUAT ERGENÇ

  3. Mobil telefon kullanımına bağlı oluşan 900-1800 mhz radyo frekans dalgalarının meydana getirdiği elektromanyetik alanın iliak kanat kemik mineral yoğunluğuna etkisi

    The effect of electromagnetic fields on bone mineral density of iliac bone produced by 900-1800 mhz radio frequency waves dependent on cellular phone usage

    BEŞİR ANDAÇ AKSOY

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2006

    Ortopedi ve TravmatolojiSüleyman Demirel Üniversitesi

    Ortopedi ve Travmatoloji Ana Bilim Dalı

    PROF.DR. NEVRES HÜRRİYET AYDOĞAN

  4. Deep learning-based building segmentation using high-resolution aerial images

    Yüksek çözünürlüklü hava görüntüleri kullanarak derin öğrenme temelli bina bölütlemesi

    BATUHAN SARITÜRK

    Doktora

    İngilizce

    İngilizce

    2022

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. DURSUN ZAFER ŞEKER

  5. Transnational agency or economic empowerment? Experiences of Kyrgyz domestic workers in Turkey

    Ulusötesi faillik veya ekonomik güçlenme? Türkiye'deki Kırgız ev işçilerinin deneyimleri

    ARAILYM GAIPOVA

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    SosyolojiOrta Doğu Teknik Üniversitesi

    Sosyoloji Ana Bilim Dalı

    PROF. DR. FATMA UMUT BEŞPINAR AKGÜNER