Prediction of stay duration of news on homapage of websites
Haberlerin web sitelerin anasayalarında kalma süreleri tahmini
- Tez No: 510208
- Danışmanlar: DR. ÖĞR. ÜYESİ TEVFİK AYTEKİN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: İngilizce
- Üniversite: Bahçeşehir Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 64
Özet
Bu tez çalışmasında, veri madenciliği ile web madenciliği kullanılarak, çevrimiçi haber sitelerinin ana sayfalarında yayınlanan haberlerin süreleri tahmin edilmektedir. Süreç, temel veri madenciliği işlemleriyle başlar. İlk olarak, veriler tarayıcıların yardımıyla toplanır. Veri temizleme ve ön işlemden sonra, veriler işlenebilir ve modellenebilir. Tarama işleminden sonra, kategoriler haber verilerinin Meta anahtar kelimelerine göre tahmin edilir. Kategorizasyon sürecinin sona ermesiyle birlikte, her haber belgesi TF-IDF kullanılarak vektör uzay modeli olarak gösterilmektedir. LSI ve TF-IDF metodları uygulanması ile çıkan sonuçlar karşılaştırılır. Sistemimiz dört ana aşamada çalışır; İlk veriler toplanır, sonra veriler kosinüs benzerliğine bağlı kümelenir ve daha sonra her bir vektör için bu veriler KNN algoritması tarafından bu aşamalardan sonra kümelenir. Son tahmin süreci haberlerin kalma süresini tahmin etmek için uygulanır. Bu yöntemler C # ve makine öğrenme kütüphaneleri ile uygulanmaktadır. Bu tez çalışılan sistemde ihtiyaç duyulan bazı önemli konulara değinmektedir. Bu sistem, çevrimiçi haber alanlarında yayınlanan bazı haberlerde test edilmiştir.
Özet (Çeviri)
In this thesis, stay duration of the news which are published on the homepages of online news websites are predicted using web mining and text mining with data mining. The process begins with basic data mining operations. Firstly, data is collected with the help of crawlers. After data cleansing and preprocessing, the data can be processed and modeled. After the crawling process, categories are estimated according to the Meta keywords of the news data. Along with the end of the categorization process, each news document is shown as a vector space model using TF-IDF or LSI. The results of applying LSI and TF-IDF methods are compared. Our system works in four main stages; first data are collected then data are clustered dependent on cosine similarity and then these data for each vector are clustered after these steps by KNN algorithm. At last prediction process is applied for predicting stay duration of news. These methods are implemented in C# and with their machine learning libraries. This thesis addresses a number of key issues that are needed to the working system. This system has been tested in some news which is published in online news domains.
Benzer Tezler
- COVİD-19 tanısı ile Hacettepe Üniversitesi erişkin hastanesinde izlenen hastaların hastalık ile ilgili risk algıları ve yaşam tarzı değişikliği planlarının değerlendirilmesi
Evaluation of disease-related risk perceptions and lifestyle change plans of patients followed up at Hacettepe University adult hospital with the diagnosis of COVİD-19
KAMIL ZARNISHANOV
Tıpta Uzmanlık
Türkçe
2021
İç HastalıklarıHacettepe Üniversitesiİç Hastalıkları Ana Bilim Dalı
PROF. DR. GÜLAY SAİN GÜVEN
DR. ÖĞR. ÜYESİ NURSEL ÇALIK BAŞARAN
- Acil servise kafa travması ile başvuran erişkin hastaların glasgow koma skoru (GKS) ile ulusal erken uyarı skoru (news)'nun mortalite, morbidite ve güvenli taburculuk açısından karşılaştırılması
Comparison of glasgow coma score and national EARLY warning score in terms of mortality, morbidity, and safe discharge of adult patients admitted to the emergency department with head trauma
İBRAHİM GÖRMEZ
Tıpta Uzmanlık
Türkçe
2021
İlk ve Acil YardımEge ÜniversitesiAcil Tıp Ana Bilim Dalı
PROF. DR. GÜÇLÜ SELAHATTİN KIYAN
- Acil servise dispne şikâyeti ile başvuran KOAH hastalarının klinik durumunu öngörmede news skorlamasının kullanımı
Use of news scoring to predict clinical status of COPD patients presenting to emergency service with dyspneal complaints
MUHAMMED EKMEKYAPAR
Tıpta Uzmanlık
Türkçe
2018
Göğüs Hastalıklarıİnönü ÜniversitesiAcil Tıp Ana Bilim Dalı
DOÇ. DR. NESLİHAN YÜCEL
- Serebrovasküler enfarkt hastalarında çekilen beyin bilgisayarlı tomografi'de ölçülen optik sinir kılıf çapı ile mortalite ilişkisi
The relationship between optic nerve sheath diameter measured on computerized tomography and mortality in patients with cerebrovascular infarction
MEHMET AKİF ÖNAL
Tıpta Uzmanlık
Türkçe
2014
İlk ve Acil YardımNecmettin Erbakan ÜniversitesiAcil Tıp Ana Bilim Dalı
DOÇ. DR. SEDAT KOÇAK
- Kardiyopulmoner bypass süresi uzamış kardiyak cerrahilerde postoperatif akut böbrek hasarının erken tespitinde doppler renal rezistif indeksin etkinliği
Effectiveness of doppler renal resistive index in early detection of postoperative acute kidney injury in prolonged cardiopulmonary bypass cardiac surgeries
MUSA HARUN UÇAR
Tıpta Uzmanlık
Türkçe
2024
Anestezi ve ReanimasyonSağlık Bilimleri ÜniversitesiAnesteziyoloji ve Reanimasyon Ana Bilim Dalı
DOÇ. DR. CANAN YILMAZ