Varlık isimleri arasındaki ilişkiler kullanılarak haberlerin öbeklenmesi
News clustering using relations between named entities
- Tez No: 333199
- Danışmanlar: DOÇ. DR. ERDOĞAN DOĞDU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Varlık İsmi, Haber öbekleme Anlamsal Ağ(Semantic Web), Açık Veri (Linked Data), Named Entity, News Clustering, Semantic Web, Linked Data
- Yıl: 2012
- Dil: Türkçe
- Üniversite: TOBB Ekonomi ve Teknoloji Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilişim Sistemleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 76
Özet
Haberlerin öbeklenmesi, birbirleriyle içerik olarak benzer olan haberlerin bir araya getirilmesi işlemidir. İnternet'in büyümesiyle çok dağıtık ve devamlı güncellenen haberlerin öbeklenmesi önemli bir problemdir. Bu problem için çok çeşitli çalışmalar yapılmaktadır. Bu çalışmaların başında Google News gelmektedir. Google News, dünya genelinde binlerce kaynaktan haberleri topladıktan sonra, birbirleriyle ilgili olanları kümeleyip kullanıcıya sunar. Haber öbekleme probleminin çözümü için en bilindik yöntem“bag of words”yöntemidir. Bu yöntem, doküman içinde geçen kelimelerin sıklıklarına bakarak öbekleme yapmaktadır. Son zamanlarda haberleri Wikipedia ve WordNet gibi kaynaklardan çıkartılan bilgilerle ilişkilendirerek öbekleme yapan yöntemler de vardır. Bu yöntemlerin“bag of words”yöntemine göre daha iyi sonuç verdiği gözlemlenmiştir. Anlamsal ağın (Semantic Web) gelişiyle birlikte internet artık bir dokümanlar ağından (web of documents), bir veri ağına (web of data) dönüşmektedir. Bu teknoloji internette aranılan bilgiye daha hızlı bir şekilde erişmemize olanak sağlayacaktır. Açık Verilerin Bağlanması (Linking Open Data) projesi, internette açık verilerin semantik web yaklaşımı ile yayınlanması ve birbirine bağlanması için geliştirilen bir projedir. Bu proje sayesinde semantik web veri ağı ve bağlı veriler (linked data) gün geçtikçe büyümektedir. Bu bağlı veriler (linked data), pek çok bilgi çıkarma ve yapay zeka uygulamasında kullanılmaya başlamıştır.Bu tez çalışmasında, haberlerde geçen ve bağlı verilerde (linked data) bulunan varlık isimlerinin (yer, kişi, olay, vb.), birbirleriyle olan anlamsal ilişkilerini kullanarak haber öbekleme problemine yeni bir yaklaşım geliştirilmiştir. Yaptığımız testler geliştirdiğimiz yaklaşımın ?bag of words? yöntemine göre daha iyi sonuçlar verdiğini göstermektedir.
Özet (Çeviri)
News clustering is the process of bringing together news articles which are similar in content. By the growth of the Internet, it is an important problem to cluster distributed and constantly updated news. There are a lot of studies for this problem. Google News is one of the major works to cluster news articles. After collecting thousands of news from the sources in the world, it provides user those that relate to each other. ?Bag of wrods? is the most well-known method for solving news clustering. This method makes clustering operation by looking at the frequency of words in the document. Recently, there are some approaches for clustering documents by the information extracted from news sources such as Wikipedia and Wordnet. It is observed that these kind of methods gives beter results than ?bag of words?. With the advent of Semantic Web, Internet is no longer document network (web of document) and becomes data network (web of data). This technology allows us to reach information more quickly on the internet. Linking Open Data, is a project developed for the publication and interconnection of open data with the approach of the semantic web. Through this project the semantic web data network and linked data is growing day by day. Linked data was used in several information extraction and artifical intelligence application.In this thesis, we developed a new approach to the problem of news clustering by using semantic relations of the named entites in the document. According to the experiments, it is obtained that, our approach shows beter results than ?bag of word? approach.
Benzer Tezler
- Un regard sur l'image du corps dans la littérature française des XXe et XXIe siècles
20. ve 21. yüzyıl Fransız edebiyatında beden imgesine bir bakış
KAMAR ARARAT KALPAKÇİYAN
Yüksek Lisans
Fransızca
2012
Fransız Dili ve EdebiyatıGalatasaray ÜniversitesiFransız Dili ve Edebiyatı Ana Bilim Dalı
YRD. DOÇ. DR. SEZA YILANCIOĞLU
- İmam hatip lisesi öğrencilerinin 'din-toplum ilşkleri' konusunda ki mülahazaları (Erzurum örneği)
The vocational religius high school?s students considered there about relation between religius and public (as an example of Erzurum)
LOKMAN CERRAH
- Yazılı belgeler üzerinden kişi ve olayları ilişkilendirerek bilgi çıkarımı yapmak
Information extraction from written documents by relating people and events
GİZEM PAZIR
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge ÜniversitesiUluslararası Bilgisayar Ana Bilim Dalı
PROF. DR. BAHAR KARAOĞLAN
- La Transformation des Fonctions Sociales et de la Perception de Galerie d'Art comme Lieu d'Interaction et Espace de Consommation: Le Cas Des Galeries d'Art à Istanbul
Bir etkileşim ve tüketim mekanı olarak sanat galerisi algısının ve sosyal işlevlerinin dönüşümü: İstanbul'daki sanat galerileri olgusu
DİCLE KOYLAN
Yüksek Lisans
Fransızca
2013
SosyolojiGalatasaray ÜniversitesiSosyoloji Ana Bilim Dalı
PROF. DR. ALİ ERGUR