Geri Dön

Varlık isimleri arasındaki ilişkiler kullanılarak haberlerin öbeklenmesi

News clustering using relations between named entities

  1. Tez No: 333199
  2. Yazar: SALİH ATILAY OTO
  3. Danışmanlar: DOÇ. DR. ERDOĞAN DOĞDU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Varlık İsmi, Haber öbekleme Anlamsal Ağ(Semantic Web), Açık Veri (Linked Data), Named Entity, News Clustering, Semantic Web, Linked Data
  7. Yıl: 2012
  8. Dil: Türkçe
  9. Üniversite: TOBB Ekonomi ve Teknoloji Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilişim Sistemleri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 76

Özet

Haberlerin öbeklenmesi, birbirleriyle içerik olarak benzer olan haberlerin bir araya getirilmesi işlemidir. İnternet'in büyümesiyle çok dağıtık ve devamlı güncellenen haberlerin öbeklenmesi önemli bir problemdir. Bu problem için çok çeşitli çalışmalar yapılmaktadır. Bu çalışmaların başında Google News gelmektedir. Google News, dünya genelinde binlerce kaynaktan haberleri topladıktan sonra, birbirleriyle ilgili olanları kümeleyip kullanıcıya sunar. Haber öbekleme probleminin çözümü için en bilindik yöntem“bag of words”yöntemidir. Bu yöntem, doküman içinde geçen kelimelerin sıklıklarına bakarak öbekleme yapmaktadır. Son zamanlarda haberleri Wikipedia ve WordNet gibi kaynaklardan çıkartılan bilgilerle ilişkilendirerek öbekleme yapan yöntemler de vardır. Bu yöntemlerin“bag of words”yöntemine göre daha iyi sonuç verdiği gözlemlenmiştir. Anlamsal ağın (Semantic Web) gelişiyle birlikte internet artık bir dokümanlar ağından (web of documents), bir veri ağına (web of data) dönüşmektedir. Bu teknoloji internette aranılan bilgiye daha hızlı bir şekilde erişmemize olanak sağlayacaktır. Açık Verilerin Bağlanması (Linking Open Data) projesi, internette açık verilerin semantik web yaklaşımı ile yayınlanması ve birbirine bağlanması için geliştirilen bir projedir. Bu proje sayesinde semantik web veri ağı ve bağlı veriler (linked data) gün geçtikçe büyümektedir. Bu bağlı veriler (linked data), pek çok bilgi çıkarma ve yapay zeka uygulamasında kullanılmaya başlamıştır.Bu tez çalışmasında, haberlerde geçen ve bağlı verilerde (linked data) bulunan varlık isimlerinin (yer, kişi, olay, vb.), birbirleriyle olan anlamsal ilişkilerini kullanarak haber öbekleme problemine yeni bir yaklaşım geliştirilmiştir. Yaptığımız testler geliştirdiğimiz yaklaşımın ?bag of words? yöntemine göre daha iyi sonuçlar verdiğini göstermektedir.

Özet (Çeviri)

News clustering is the process of bringing together news articles which are similar in content. By the growth of the Internet, it is an important problem to cluster distributed and constantly updated news. There are a lot of studies for this problem. Google News is one of the major works to cluster news articles. After collecting thousands of news from the sources in the world, it provides user those that relate to each other. ?Bag of wrods? is the most well-known method for solving news clustering. This method makes clustering operation by looking at the frequency of words in the document. Recently, there are some approaches for clustering documents by the information extracted from news sources such as Wikipedia and Wordnet. It is observed that these kind of methods gives beter results than ?bag of words?. With the advent of Semantic Web, Internet is no longer document network (web of document) and becomes data network (web of data). This technology allows us to reach information more quickly on the internet. Linking Open Data, is a project developed for the publication and interconnection of open data with the approach of the semantic web. Through this project the semantic web data network and linked data is growing day by day. Linked data was used in several information extraction and artifical intelligence application.In this thesis, we developed a new approach to the problem of news clustering by using semantic relations of the named entites in the document. According to the experiments, it is obtained that, our approach shows beter results than ?bag of word? approach.

Benzer Tezler

  1. Un regard sur l'image du corps dans la littérature française des XXe et XXIe siècles

    20. ve 21. yüzyıl Fransız edebiyatında beden imgesine bir bakış

    KAMAR ARARAT KALPAKÇİYAN

    Yüksek Lisans

    Fransızca

    Fransızca

    2012

    Fransız Dili ve EdebiyatıGalatasaray Üniversitesi

    Fransız Dili ve Edebiyatı Ana Bilim Dalı

    YRD. DOÇ. DR. SEZA YILANCIOĞLU

  2. İmam hatip lisesi öğrencilerinin 'din-toplum ilşkleri' konusunda ki mülahazaları (Erzurum örneği)

    The vocational religius high school?s students considered there about relation between religius and public (as an example of Erzurum)

    LOKMAN CERRAH

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    DinAtatürk Üniversitesi

    Disiplinlerarası Bölümü

    DOÇ. DR. FAZLI POLAT

  3. Yazılı belgeler üzerinden kişi ve olayları ilişkilendirerek bilgi çıkarımı yapmak

    Information extraction from written documents by relating people and events

    GİZEM PAZIR

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Uluslararası Bilgisayar Ana Bilim Dalı

    PROF. DR. BAHAR KARAOĞLAN

  4. Fârâbî, İbn Sînâ ve İbn Rüşd'de estetik

    Aesthetics in al-Farabi, Ibn Sina and Ibn Rushd

    AYŞE TAŞKENT

    Doktora

    Türkçe

    Türkçe

    2009

    FelsefeMarmara Üniversitesi

    İlahiyat Ana Bilim Dalı

    PROF. DR. İLHAN KUTLUER

  5. La Transformation des Fonctions Sociales et de la Perception de Galerie d'Art comme Lieu d'Interaction et Espace de Consommation: Le Cas Des Galeries d'Art à Istanbul

    Bir etkileşim ve tüketim mekanı olarak sanat galerisi algısının ve sosyal işlevlerinin dönüşümü: İstanbul'daki sanat galerileri olgusu

    DİCLE KOYLAN

    Yüksek Lisans

    Fransızca

    Fransızca

    2013

    SosyolojiGalatasaray Üniversitesi

    Sosyoloji Ana Bilim Dalı

    PROF. DR. ALİ ERGUR