Geri Dön

Türkçe içeriklerden otomatik etiket bulutu oluşturma

Automatic tag cloud generation from Turkish contents

  1. Tez No: 295864
  2. Yazar: SERDAR SAVAŞAN
  3. Danışmanlar: YRD. DOÇ. DR. BANU DİRİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2011
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 78

Özet

Bilgi teknolojileri ve internetin gelişmesiyle şekillenen iletişim ortamı, her geçen gün daha da yoğun bir bilgi trafiği ile karşı karşıya kalmamıza neden olmaktadır. Bilginin zaman ve mekândan bağımsız bir şekilde paylaşılabilmesi de beraberinde bilgi kirliliğini getirmektedir. Bu konularda yapılan çalışmalarda, kişilerin ihtiyaç duydukları, değerli, güvenilir ve güncel bilgiye ulaşmaları hedeflenmektedir. Yapısal olmayan verilerin işlendiği Metin Madenciliğinde, bilgisayar destekli metin analizi yapılarak yüksek kalitede bilgi elde edilmesi sağlanmaktadır. Metin özetlerinin çıkarılması ve dokümanların etiketlenmesi gibi işlemler sayesinde, kullanıcılar bilgiye daha rahat bir şekilde ulaşabilmektedir. Etiket Bulutları, kelimelerin farklı yazı biçimlerinde sunulduğu ağırlıklı listelerdir. Bu görsel erişim araçları metin madenciliği tekniklerinden faydalanarak, kullanıcıları internet ortamında sunulan bilgilere yönlendirir. Gazetelerin internet sitelerinden günlük haberleri okumak, internetin en yaygın kullanım alanlarından birisidir. Genel olarak kullanıcılar gündemi, tercih ettikleri tek bir haber kaynağından takip ederler. Ancak basılı ortamda yayınlanmayan düşük öneme sahip çok sayıda haber, gazetelerin internet sitelerinde kendilerine yer bulmakta ve bilgi kirliliği oluşturmaktadır. Bu ve benzeri sorunların ortaya çıkardığı ihtiyaçlar göz önüne alınarak, bu çalışmada, bilgiye erişim sistemleri, metin madenciliği ve etiket bulutları konularında araştırma yapılmıştır. Elde edilen bilgiler ışığında, internet ortamındaki günlük haberlere erişimi daha işlevsel hale getiren Gündem Bulutu adında bir haber derleme ve erişim aracı geliştirilmiştir. Bu sistem yayınlanan yeni içerikleri sürekli takip ederek derlemi anlık olarak güncellemektedir. Toplanan haber içerikleri Türkçe diline özgü analiz edilmekte ve otomatik oluşturulan bir etiket bulutu gösteriminde kullanıcıya sunulmaktadır. Böylece farklı gazetelerde yayınlanan aynı konulu haberlere tek bir noktadan erişmek mümkün olmuş ve gündemin takip edilmesi sağlanmıştır.

Özet (Çeviri)

Every day we are faced with an intense traffic of information that is caused by the communication medium, shaping by the growth and development of information technologies and the Internet. Information pollution is posed by the time and location independent sharing of information. Studies on these issues aim to provide the needed, valuable, reliable and updated information to the people. Text Mining works on unstructured data to achieve high-quality information by using computer-aided text analysis. Users can access to information in a more comfortable way by the help of text summarization, information extraction and document tagging operations. Tag clouds are visual weighted lists composed of words, presented in different fonts and positions. These visual tools direct users to the information provided on the internet by taking advantage of text mining techniques. One of the most common uses of Internet is reading daily news from the newspaper sites. Generally the users prefer to follow the agenda from a single news source. But a large number of unimportant news items that are not published in newspaper printed version, find place for themselves on internet sites and cause information pollution. Considering the needs posed by these and other problems, a research on information retrieval systems, text mining and tag clouds, has been made in this study. With the aid of gathered information, a news compilation and retrieval tool called Agenda Cloud is developed, which makes it more functional to access news on the Internet. The system updates the compilation by tracking the newly published content continuously. The collected news contents are analyzed according to Turkish language and they are presented to the user by means of an automatically generated tag cloud. As an outcome of this study, it has been possible to follow the agenda and to access to similar news published in different newspapers from a single point.

Benzer Tezler

  1. Türkçe hedef tabanlı duygu analizi için alt görevlerin incelenmesi–hedef terim, hedef kategori ve duygu sınıfı belirleme

    Inspecting sub tasks of aspect based sentiment analysis in Turkish language–opinion target expression, aspect category and sentiment polarity detection

    FATİH SAMET ÇETİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. GÜLŞEN ERYİĞİT

  2. Türkçe metinlerde çıkarım tabanlı otomatik metin özetleme

    Extractive based automatic text summarization in Turkish texts

    ERTÜRK ERDAĞI

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMaltepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ VOLKAN TUNALI

  3. Panorama ile üretilen plevral efüzyon sitopatoloji görüntüleri üzerinde yolov3 ile otomatik çekirdek algılama

    Automatic nuclei detection with yolov3 algorithm on pleural effusion cytopatology images produced by panorama method

    BÜŞRANUR KILIÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKaradeniz Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MURAT EKİNCİ

  4. Orta ölçekli topografik haritalarda binaların bağlamsal genelleştirilmesi

    Contextual generalization of buildings in medium scale topographic maps

    KADİR ŞAHBAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Jeodezi ve FotogrametriYıldız Teknik Üniversitesi

    Harita Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ALİ MELİH BAŞARANER

  5. Hizmet sektörü veri setlerinde dilsel özetleme ve duygu analizi

    Linguistic summarization and opinion mining applications on service industry datasets

    BETÜL DÜNDAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. SUAT ÖZDEMİR