Geri Dön

Prediction of stay duration of news on homapage of websites

Haberlerin web sitelerin anasayalarında kalma süreleri tahmini

  1. Tez No: 510208
  2. Yazar: OKAN GÜZELORDU
  3. Danışmanlar: DR. ÖĞR. ÜYESİ TEVFİK AYTEKİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: İngilizce
  9. Üniversite: Bahçeşehir Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 64

Özet

Bu tez çalışmasında, veri madenciliği ile web madenciliği kullanılarak, çevrimiçi haber sitelerinin ana sayfalarında yayınlanan haberlerin süreleri tahmin edilmektedir. Süreç, temel veri madenciliği işlemleriyle başlar. İlk olarak, veriler tarayıcıların yardımıyla toplanır. Veri temizleme ve ön işlemden sonra, veriler işlenebilir ve modellenebilir. Tarama işleminden sonra, kategoriler haber verilerinin Meta anahtar kelimelerine göre tahmin edilir. Kategorizasyon sürecinin sona ermesiyle birlikte, her haber belgesi TF-IDF kullanılarak vektör uzay modeli olarak gösterilmektedir. LSI ve TF-IDF metodları uygulanması ile çıkan sonuçlar karşılaştırılır. Sistemimiz dört ana aşamada çalışır; İlk veriler toplanır, sonra veriler kosinüs benzerliğine bağlı kümelenir ve daha sonra her bir vektör için bu veriler KNN algoritması tarafından bu aşamalardan sonra kümelenir. Son tahmin süreci haberlerin kalma süresini tahmin etmek için uygulanır. Bu yöntemler C # ve makine öğrenme kütüphaneleri ile uygulanmaktadır. Bu tez çalışılan sistemde ihtiyaç duyulan bazı önemli konulara değinmektedir. Bu sistem, çevrimiçi haber alanlarında yayınlanan bazı haberlerde test edilmiştir.

Özet (Çeviri)

In this thesis, stay duration of the news which are published on the homepages of online news websites are predicted using web mining and text mining with data mining. The process begins with basic data mining operations. Firstly, data is collected with the help of crawlers. After data cleansing and preprocessing, the data can be processed and modeled. After the crawling process, categories are estimated according to the Meta keywords of the news data. Along with the end of the categorization process, each news document is shown as a vector space model using TF-IDF or LSI. The results of applying LSI and TF-IDF methods are compared. Our system works in four main stages; first data are collected then data are clustered dependent on cosine similarity and then these data for each vector are clustered after these steps by KNN algorithm. At last prediction process is applied for predicting stay duration of news. These methods are implemented in C# and with their machine learning libraries. This thesis addresses a number of key issues that are needed to the working system. This system has been tested in some news which is published in online news domains.

Benzer Tezler

  1. COVİD-19 tanısı ile Hacettepe Üniversitesi erişkin hastanesinde izlenen hastaların hastalık ile ilgili risk algıları ve yaşam tarzı değişikliği planlarının değerlendirilmesi

    Evaluation of disease-related risk perceptions and lifestyle change plans of patients followed up at Hacettepe University adult hospital with the diagnosis of COVİD-19

    KAMIL ZARNISHANOV

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2021

    İç HastalıklarıHacettepe Üniversitesi

    İç Hastalıkları Ana Bilim Dalı

    PROF. DR. GÜLAY SAİN GÜVEN

    DR. ÖĞR. ÜYESİ NURSEL ÇALIK BAŞARAN

  2. Acil servise kafa travması ile başvuran erişkin hastaların glasgow koma skoru (GKS) ile ulusal erken uyarı skoru (news)'nun mortalite, morbidite ve güvenli taburculuk açısından karşılaştırılması

    Comparison of glasgow coma score and national EARLY warning score in terms of mortality, morbidity, and safe discharge of adult patients admitted to the emergency department with head trauma

    İBRAHİM GÖRMEZ

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2021

    İlk ve Acil YardımEge Üniversitesi

    Acil Tıp Ana Bilim Dalı

    PROF. DR. GÜÇLÜ SELAHATTİN KIYAN

  3. Acil servise dispne şikâyeti ile başvuran KOAH hastalarının klinik durumunu öngörmede news skorlamasının kullanımı

    Use of news scoring to predict clinical status of COPD patients presenting to emergency service with dyspneal complaints

    MUHAMMED EKMEKYAPAR

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2018

    Göğüs Hastalıklarıİnönü Üniversitesi

    Acil Tıp Ana Bilim Dalı

    DOÇ. DR. NESLİHAN YÜCEL

  4. Serebrovasküler enfarkt hastalarında çekilen beyin bilgisayarlı tomografi'de ölçülen optik sinir kılıf çapı ile mortalite ilişkisi

    The relationship between optic nerve sheath diameter measured on computerized tomography and mortality in patients with cerebrovascular infarction

    MEHMET AKİF ÖNAL

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2014

    İlk ve Acil YardımNecmettin Erbakan Üniversitesi

    Acil Tıp Ana Bilim Dalı

    DOÇ. DR. SEDAT KOÇAK

  5. Kardiyopulmoner bypass süresi uzamış kardiyak cerrahilerde postoperatif akut böbrek hasarının erken tespitinde doppler renal rezistif indeksin etkinliği

    Effectiveness of doppler renal resistive index in early detection of postoperative acute kidney injury in prolonged cardiopulmonary bypass cardiac surgeries

    MUSA HARUN UÇAR

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2024

    Anestezi ve ReanimasyonSağlık Bilimleri Üniversitesi

    Anesteziyoloji ve Reanimasyon Ana Bilim Dalı

    DOÇ. DR. CANAN YILMAZ