Measuring bias among text data using nlp methods
Doğal dil işleme metotlarını kullanarak yazılı veri üzerindeki yanlılığı ölçme
- Tez No: 895160
- Danışmanlar: PROF. YÜCEL SAYGIN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Sabancı Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Veri Bilimi Ana Bilim Dalı
- Bilim Dalı: Veri Bilimi Bilim Dalı
- Sayfa Sayısı: 65
Özet
YouTube, pandemi sırasında ana dijital eğitim ortamlarından biri haline geldi. Daha önce, yüz yüze eğitimde erkeklere karşı pozitif önyargının var olduğu bulunmuştu. Örneğin, bir çalışmada, öğretmenlerin sınav kağıtlarına öğrenci isimleriyle aynı anda eriştiklerinde notlandırma tutumlarının değiştiği saptandı. Öğretmenler, pozitif ayrımcılık sergileyerek erkek öğrencileri kadın öğrencilere göre daha cömert bir şekilde notlandırdılar. Başka bir çalışmada, profesörlerin e-postalarına karşı duyarlılığı ölçüldü. Araştırmacılar, profesörlerin beyaz erkekler öğrencilerden gelen e-postalara karşı en fazla duyarlı oldukları sonucuna vardı. Yüz yüze eğitimde bulunan cinsiyet önyargısı, dijital eğitim platformlarına da yansıtılmaktadır. Bir çalışmada, deneyciler bilim, teknoloji, mühendislik, matematik (STEM) ve eğitimin geri kalan alanları (STEM dışı) için bir dizi video topladılar. Cinsiyet önyargısını ölçtüler ve STEM ve STEM dışı videolarda, her iki durumda da erkeklere yönelik bir önyargı olduğunu, ancak önyargı düzeyinin iki grup arasında birbirinden farklılık gösterdiğini öne sürdüler. Bu çalışmanın amacı, bu durumun arkasındaki nedeni keşfetmek ve COVID-19 pandemisinin insanların dijital platformlarda cinsiyet önyargısını sergileme eğilimleri üzerindeki etkisini anlamaktır. Verilerimiz, YouTube'dan toplanan 19867 eğitim videosuna ait detayları ve bu videoların en üst sıradaki yorumlarını içermektedir. Toparlanan videolar, Ocak 2007'den Mart 2021'e kadar farklı video anlatıcıları tarafından yapılmış ve STEM ve STEM dışı sorgulara göre gruplandırılmıştır. Topladığımız video ve yorum detaylarındaki farklılıkları inceleyerek cinsiyet önyargısına dair kanıtlar bulmaya çalıştık. Bu bağlamda, geniş bir veri ön işleme, istatistiksel analiz ve duygu analizi teknikleri kullandık.
Özet (Çeviri)
YouTube became one of the main digital education mediums during the pandemic. Previously, it was found that there exists a positive bias towards males in face-to-face education. For instance, in one study, it was found that the attitude of the teachers while grading changed when they received the exam papers together with the student names. Teachers graded male students more generously compared to their females i.e. exhibited positive discrimination. In another study, the responsiveness of the professors to their emails was measured. The researchers concluded that the professors are the most responsive when the email belongs to a white male student. Gender bias found in face-to-face education is also reflected in digital education platforms. In a study, the experimenters created a set of videos for science, technology, engineering mathematics (STEM), and the remaining fields of education (non-STEM). They gauged the gender bias and suggested that there is a bias towards males in both STEM and non-STEM videos although the the degree between the two differs from each other. The goal of this study is to explore the reason behind this situation and the understand impact of the COVID-19 pandemic on people's tendency to show gender bias on digital platforms. Our data includes 19867 educational video details collected from YouTube as well as their top-ranked comments. These videos were made by different narrators from January 2007 to March 2021, and they were grouped based on STEM, and non-STEM queries. We focus on finding important evidence related to gender bias by working on the differences in the video and comment details such as the number of likes or views they get, the polarity of the comments, and the rank of the most common words. In this regard, we used a large variety of data preprocessing, statistical analyses, and sentiment analysis techniques.
Benzer Tezler
- Tanı testlerinin değerlendirilmesinde kullanılan standartlar ve analitik yöntemler
Standards and analytic techniques used in evaluation of diagnostic tests
İLKER ÜNAL
Doktora
Türkçe
2010
BiyoistatistikÇukurova ÜniversitesiBiyoistatistik Ana Bilim Dalı
PROF. DR. H. REFİK BURGUT
- Measuring and improving interpretability of word embeddings using lexical resources
Sözcüksel kaynaklar kullanarak kelime temsillerinin yorumlanabilirliklerinin ölçülmesi ve iyileştirilmesi
LÜTFİ KEREM ŞENEL
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. TOLGA ÇUKUR
DR. ÖĞR. ÜYESİ AYKUT KOÇ
- İntörn doktorların obezite konusundaki farkındalıklarının, obezite ön yargılarına etkisi
The effect of intern doctors' awareness of obesity on obesity prejudices
FATMA TEZCAN DOĞRU
Tıpta Uzmanlık
Türkçe
2022
Aile HekimliğiSağlık Bilimleri ÜniversitesiAile Hekimliği Ana Bilim Dalı
DOÇ. DR. HÜLYA PARILDAR
- Risk algısı ve demografik özelliklerin yatırımcı davranışlarına etkisi üzerine ampirik bir çalışma
Impact of risk perception and demographic factors on individual investors' behavior: An empirical analysis
FATİH SAĞLIK
- Aile Hekimlerinin Bilgi Düzeyini Araştıran Tezlerin İncelenmesi
A Review of Theses İnvestigating the Level of Knowledge of Family Physicians
FATİH UĞUR
Tıpta Uzmanlık
Türkçe
2023
Aile HekimliğiAnkara Yıldırım Beyazıt ÜniversitesiAile Hekimliği Ana Bilim Dalı
DOÇ. DR. BASRİ FURKAN DAĞCIOĞLU