Geri Dön

Yapay zekâ tarafından üretilen metinleri tespit etme yöntemleri ve zorlukları: Yaygın yapay zekâ tespit araçlarının etkinlik ve tutarlılık analizi

Methods and challenges of detecting artificial intelligence generated texts: Effectiveness and consistency analysis of common artificial intelligence detection tools

  1. Tez No: 885980
  2. Yazar: FATİH MAHMUD KOÇ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ NEGAR SADAT SOLEIMANI ZAKERI
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: İSTANBUL NİŞANTAŞI ÜNİVERSİTESİ
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgi Teknolojileri Bilim Dalı
  13. Sayfa Sayısı: 98

Özet

Bu çalışmada öncelikle yapay zekâ tarafından üretilen metinleri tespit etmenin yöntemleri ve tespit etmenin zorlukları anlatılmıştır. Yöntemler özetle; istatistikler yaklaşımlar, makine öğrenmesi tabanlı modeller, hibrit modeller, insan katılımlı modeller, stilometri, metadata analizi ve çevrimiçi araçlar olarak ele alınmıştır. Zorluklar ise; büyük dil modellerinin karmaşıklığı ve taklit yeteneği, sürekli değişen ve gelişen teknoloji, veri çeşitliliği ve veriye erişim sorunları, dilin öznel yönleri, yanlılık ve hatalı sonuçlar, teknik zorluklar, model uyumsuzluğu, insan kabiliyetleri ve tespit önleme (bypass) araçları olarak ele alınmıştır. Bunlara ek olarak çalışmanın uygulaması olarak 5 adet akademik metin toplanmış ve 9 adet metin yapay zekâ araçları tarafından ürettirilmiştir. Ardından bu metinlerin yapay zekâ tarafından yazılıp yazılmadığını tespit amacıyla ise ZeroGPT, GPTZero, Copyleaks ve Crossplag araçları kullanılmış ve bu araçların etkinlik ve tutarlılıkları incelenmiştir. Çalışmanın sonucunda ise, yapay zekâ tarafından yazılan metinleri tespit etme amacıyla kullanılan araçların genel anlamda doğru sonuçlar vermesine rağmen bazı durumlarda yanlış pozitif veya yanlış negatif sonuçlar verdiği tespit edilmiştir. Dolayısıyla günümüz teknolojisiyle bir metne tamamen yapay zekâ tarafından yazılmıştır demenin mümkün olamayacağı sonucuna varılmıştır. Bu çalışma, yapay zekâ metin tespit araçlarının mevcut durumunu ve geliştirilmesi gereken alanları ortaya koymuştur, bu da gelecekteki araştırmalara yol gösterici olabilir.

Özet (Çeviri)

In this study, firstly, the methods of detecting artificial intelligence-generated texts and the challenges of detecting them are explained. The methods in summary; are statistics approaches, machine learning-based models, hybrid models, human participation models, stylometry, metadata analysis, and online tools. The challenges are; the complexity and imitation ability of large language models, constantly changing and developing technology, data diversity and data access problems, subjective aspects of the language, bias and erroneous results, technical difficulties, model incompatibility, human capabilities and detection prevention (bypass) tools are discussed. In addition, 5 academic texts were collected and 9 texts were produced by artificial intelligence tools, as the application of the study. Then, in order to determine whether these texts were generated by artificial intelligence, ZeroGPT, GPTZero, Copyleaks, and Crossplag tools were used and the effectiveness and consistency of these tools were examined. As a result of the study, it was determined that although the tools used to detect artificial intelligence-generated texts generally gave accurate results, in some cases they gave false positive or false negative results. Therefore, it has been concluded that with today's technology, it is not possible to say that a text was generated entirely by artificial intelligence. This study has revealed the current state of artificial intelligence text detection tools and areas that need improvement, which may guide future research.

Benzer Tezler

  1. Software defect prediction with a personalization focus and challenges during deployment

    Kişiselleştirme odaklı yazılım hata tahmini ve entegrasyon zorlukları

    BEYZA EKEN

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ AYŞE TOSUN KÜHN

  2. Classification of abnormal respiratory sounds using deep learning techniques

    Solunum seslerinin derin öğrenme yöntemleri ile sınıflandırılması

    AHAMADI ABDALLAH IDRISSE

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. OKTAY YILDIZ

  3. Detecting plagiarism from ai language models in education systems

    Değitim sistemlerinde yapay zeka dil modellerinden intihaltespiti

    MARWA NABULSI

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Yapay Zeka Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. SELAMİ BAĞRIYANIK

  4. Gelişmiş makine öğrenimi teknikleri ile çok zamanlı hava ve uydu görüntüleri kullanılarak mısır (Zea mays) türlerinin fenoloji tabanlı sınıflandırılması

    Phenology- based classification of maize (Zea mays) species using multi̇- temporal aerial and satellite imagery with advanced machine learning techniques

    OSMAN YAVUZ ALTUNTAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Jeodezi ve FotogrametriGebze Teknik Üniversitesi

    Harita Mühendisliği Ana Bilim Dalı

    DOÇ. DR. İSMAİL ÇÖLKESEN

  5. Deep learning based road segmentation from multi-source and multi-scale data

    Çok kaynaklı ve çok ölçekli veriyle derin öğrenme tabanlı yol bölütlenmesi

    OZAN ÖZTÜRK

    Doktora

    İngilizce

    İngilizce

    2023

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. DURSUN ZAFER ŞEKER