Geri Dön

Metin madenciliği yöntemi ile haber sitelerindeki köşe yazılarının sınıflandırılması

Classification of online newspapers articles through text mining method

  1. Tez No: 316285
  2. Yazar: MEHMET FATİH KARACA
  3. Danışmanlar: YRD. DOÇ. DR. SALİH GÖRGÜNOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2012
  8. Dil: Türkçe
  9. Üniversite: Karabük Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 117

Özet

İnternetin günümüzde hayatımızın her alanına girmiş olmasıyla birlikte verilerin yaşantımızdaki boyutu ve değeri artmıştır. Büyük miktarlardaki verilerden anlamlı bilgi çıkarmak günümüzde kişi ve firmaları bilgi temelli ekonomi çağında diğerlerinden bir adım öne geçirmektedir. İnternette bulunan bütün veriler bir çok kişi için gerekli veya faydalı değildir. Verilerden katkı sağlayacak bilgilerin elde edilmesi için çeşitli madencilik teknikleri uygulanmalıdır. Veri madenciliği yapısal veriler üzerinde işlemleri gerçekleştirir. Metinler yapısal veriler değildir. Metinlerin, veri madenciliği tekniklerinin uygulanabileceği yapısal veri haline dönüştürülmesi işlemi metin madenciliği ile gerçekleştirilir. Veri madenciliği teknikleri uygulanmadan önce verilerin hazırlanması, ön işlemden geçirilmesi gerekmektedir. Metinlerden bilgi çıkarmak, metni sınıflandırmak, aranan bilgiye kısa sürede ulaşmak metin madenciliğinin popülaritesini arttırmış, bu konuda çalışmalar yapılmasını gerekli hale getirmiştir.Metin sınıflandırma, sistemin önceden tanımlanmış kategorilere eğitim dokümanlarını kullanarak verilen metnin sınıfına karar vermesi işlemidir.Bu çalışmada haber sitelerindeki köşe yazılarının otomatik olarak alınması ve ekonomi, spor, sağlık, eğitim, yaşam olarak sınıflandırılması gerçekleştirilmiştir.

Özet (Çeviri)

With the access of internet to every aspect of the community, the volume and value of data has increased. Extracting meaningful information out of vast volumes of data makes one or a firm go one step further than the others in this information-oriented age of economy. All data, available on the internet, is not essential or useful to most. A range of mining techniques must be implemented to acquire useful information out of data. Data mining operates on structural data. Texts are not structural data. The process that texts are transformed into structural data to which data mining can be applied is realized through data mining. It is a must that data be ready and exposed to pre-processing before data mining techniques are applied. Acquiring information out of texts and classifying them, and getting an instant access to the information have given rise to text mining, necessitating the studies on it.Text classification is the process in which the class of text is determined through system?s using the training documents given into pre-determined categories.In this study, it has been achieved that articles of online newspapers are automatically extracted and classified into categories as economy, sports, health, education and life.

Benzer Tezler

  1. TFEEC : Türkçe finansal olay çıkarım derlemi

    TFEEC : Turkish financial event extraction corpus

    KADİR ŞİNAS KAYNAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET CÜNEYD TANTUĞ

  2. Borsa İstanbul (BİST) 100 endeksi yönünün ekonomi haberleri ile tahmin edilmesi

    Prediction of Borsa Istanbul 100 index direction using financial news articles

    HAKAN GÜNDÜZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ZEHRA ÇATALTEPE

  3. Türkçe için sahte haber tespit modelinin oluşturulması

    A fake news detection model for Turkish language

    UĞUR MERTOĞLU

    Doktora

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BURKAY GENÇ

    PROF. DR. HAYRİ SEVER

  4. Tip 2 diyabet hastalığına ilişkin haberlerin metin madenciliği yöntemi ile incelenmesi

    Analyzing the news on type 2 diabetes by text mining method

    SEMA DÖKME YAĞAR

    Doktora

    Türkçe

    Türkçe

    2022

    Sağlık Kurumları YönetimiAnkara Üniversitesi

    Sağlık Kurumları Yönetimi Ana Bilim Dalı

    DOÇ. DR. ÇAĞDAŞ ERKAN AKYÜREK

  5. Finansal haber makaleleri kullanılarak hisse senetleri fiyat değişimlerinin tahmin edilmesi

    Stock price prediction using financial news articles

    MUSTAFA İDRİS YASEF KAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. M. ELİF KARSLIGİL