NLP kullanılarak haberlerin yaş gruplarına göre sınıflandırılması
Classification of news according to age groups using NLP
- Tez No: 636429
- Danışmanlar: DR. ÖĞR. ÜYESİ METİN TURAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: Türkçe
- Üniversite: İstanbul Ticaret Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 84
Özet
Çalışma kapsamında haber metinlerinin yaş gruplarına göre Doğal Dil İşleme tekniğinden faydalanılarak sınıflandırılması sağlanmıştır. Çünkü gelişen teknoloji ile beraber özellikle çocuk yaş grubunun, zarar görebileceği içeriklerden uzak tutulması gerekmektedir. Her ne kadar İnternet Servis Sağlayıcıları ailelere filtreleme imkanları sunsa da ailelerin çoğu bu filtrelemeyi uygulamakta zorlanmakta veya kayıtsız kalmaktadırlar. Bu tür olumsuz durumların üstesinden gelmek için internette yayınlanan içerikler üzerinde yasal bir kontrol sistemi gerekmektedir. Python dili kullanılarak geliştirilen çalışmada Türkçe haber metinlerinin Doğal Dil işlemleri için Zemberek Kütüphanesi kullanılmıştır. Havighurst'ün Gelişim Kuramından faydalanılarak Çocukluk, Ergenlik ve Yetişkinlik yaş grupları belirlenmiştir. Belirlenen yaş gruplarına ait haberlerin bulunduğu toplamda 3925 haber öğesini içeren bir veri kümesi oluşturulmuştur. Veri kümesinin eğitim haberleri ile sözlük oluşturulup sınama haberleri ile de sözlük test edilmiştir. İlk test işleminde haberin yaş grubunu belirleme doğruluğu %71 olarak bulunmuştur. Gözlem doğrultusunda, sadece isimleri içeren sözlük ile %73'lük bir başarı elde edilmiştir. Diğer bir gözlem doğrultusunda, Ergenlik yaş grubuna ait kelimelerin diğer iki grupla örtüşmesi nedeniyle, Ergenlik yaş grubu ile Çocukluk yaş grubu birleştirilip yetişkin ve yetişkin olmayan yeni yaş grupları oluşturulmuş, sadece isimleri barındıran bir sözlük ile %83 oranında daha ayrıştırıcı bir sonuç elde edilmiştir.
Özet (Çeviri)
Within the scope of the study, it was provided to classify news texts according to age groups by using Natural Language Processing technique. Because with the developing technology, especially the child age group should be kept away from the content that can be damaged. Although Internet Service Providers provide families with filtering facilities, most families find it difficult to implement this filter or remain indifferent. In order to overcome such negative situations, a legal control system is required on the content published on the internet. In the study developed using Python language, Zemberek Library was used for Natural Language operations of Turkish news texts. Childhood, Adolescence and Adulthood age groups were determined by using Havighurst's Development Theory. A dataset containing 3925 news items was created in which there are news belonging to the determined age groups. The educational news of the dataset was created and a dictionary was tested with the test news. In the first test process, the accuracy of determining the age group of the news was found to be 71%. In line with the observation, a 73% success was achieved with a dictionary containing only names. In line with another observation, since the words belonging to the Adolescence age group overlap with the other two groups, the Adolescence age group and the Childhood age group have been combined to create new adult and non-adult age groups, resulting in a distinctive result of 83% with a dictionary containing only names.
Benzer Tezler
- Otomatik duygu sözlüğü geliştirilmesi ve haberlerin duygu analizi
Automated sentiment lexicon generation and sentiment analysis of news
FATİH SAĞLAM
Doktora
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ FUAT AKAL
PROF. DR. HAYRİ SEVER
- Evaluating the performance of different continous vector representation methods for turkish words
Türkçe sözcükler için farklı sürekli vektör temsilyöntemlerinin başarım değerlendirmesi
GÖKHAN GÜLER
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Twitter'da yanlış bilgi ve dezenformasyon tespiti için yapay zeka tekniklerinin kullanılması ve karşılaştırılması
Using and comparison of artificial intelligence techniques to detect misinformation and disinformation on Twitter
OMAR RAAD MAHMOOD MAHMOOD
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErzincan Binali Yıldırım ÜniversitesiYapay Zeka ve Robotik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ FUNDA AKAR
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- Media representation of ai: Cases of US, US, China and Turkey
Yapay zekanın medya temsiliyeti: ABD, Birleşik Krallık, Çin ve Türkiye vakaları
SERHAT AKKILIÇ
Doktora
İngilizce
2019
İletişim Bilimleriİstanbul Bilgi ÜniversitesiSosyal Bilimler Ana Bilim Dalı
PROF. DR. AHMET SÜERDEM