Geri Dön

AJAX tabanlı web sayfalarından veri çıkarımına bir yaklaşım

An approach to data extraction from AJAX-based web pages

  1. Tez No: 732359
  2. Yazar: OĞUZ KIRAT
  3. Danışmanlar: DR. ÖĞR. ÜYESİ TARIK YERLİKAYA
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Trakya Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 66

Özet

İnternetin yaygınlaşmasıyla birlikte sanal ortama yüklenen veri miktarı oldukça artmıştır. Bu verinin önemli bir bölümü web sayfaları aracılığıyla sunulmaktadır. Ancak web sayfaları çoğu zaman sadece önemli olabilecek veriyi içermemekte ve gün geçtikçe karmaşıklaşmaktadır. Web veri çıkarımı (Web data extraction), değerli ve ilgi çekici bilginin web sayfalarından çıkarılması işlemidir. Veri çıkarımı işlemi, makine öğrenmesi, doğal dil işleme, arama motorları ve büyük veri seti gerektiren işlemler için önem arz etmektedir. Çünkü birçok web sayfası, verilerin bilgisayar programları kullanılarak çekilmesini sağlayan bir arayüz (örneğin; API – Application Programming Interface – Uygulama Programlama Arayüzü) sunmamaktadır. Web veri çıkarımı konusunda birçok mevcut çalışma düzenli ifade (regex) kullanımı ya da DOM (Document Object Model) ağacının üretilmesi ve bu yönde algoritmaları ortaya koymaktadır. Ancak ilerleyen teknolojiyle birlikte birçok web sayfasının içeriği Javascript ile güncellenebilmektedir. Genel olarak AJAX olarak adlandırılan bu teknolojiyle birlikte DOM ağacı sayfanın görüntülenmesi ve scriptlerin işlenmesi sonucunda dinamik olarak değişebilmekte, hatta web sitelerinin tamamı bu yöntemle (SPA – Single Page Application, Tek Sayfa Uygulaması) oluşturulabilmektedir. Bu yüksek lisans tezinin amacı, AJAX veya benzeri istemci tabanlı dinamik içerik teknolojileri kullanan web sayfalarında da belirli kural setleriyle daha hızlı veri çıkarımı yapabilecek bir yaklaşım aramaktır.

Özet (Çeviri)

With the widespread use of the Internet, the amount of data loaded into the virtual environment has increased considerably. An important part of this data is provided through web pages. However, web pages often do not contain only the important data and are getting more complicated day by day. Web data extraction is the process of extracting valuable and interesting information from web pages. The data extraction process is important for machine learning, natural language processing, search engines and processes that require a large data set. Many web pages do not offer an interface (for example; API - Application Programming Interface - Application Programming Interface) that allows data to be retrieved using computer programs, therefore extraction is needed. Many current studies on the web data extraction topic discuss the use of regular expressions (regex) or the generation of DOM (Document Object Model) trees and algorithms. However, with the advancing technology, the content of many web pages can be updated with Javascript. With this technology, which is generally called AJAX, the DOM tree can change dynamically as a result of displaying the page and processing scripts. Even all of the web site can be created with this method (SPA - Single Page Application).

Benzer Tezler

  1. Geleneksel web tabanlı uygulamalardan Ajax ile desteklenen zengin internet uygulamalarına geçiş

    Transition from traditional web-based applications to rich internet applications powered with Ajax

    CÜNEYT KURU

    Yüksek Lisans

    Türkçe

    Türkçe

    2008

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi

    Enformatik Ana Bilim Dalı

    DOÇ. DR. SEVİNÇ GÜLSEÇEN

  2. Soa based form development framework with web 2.0

    Servis tabanlı web 2.0 ile form geliştirme platformu

    HÜSEYİN ERGÜN

    Yüksek Lisans

    İngilizce

    İngilizce

    2008

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolIşık Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. SELAHATTİN KURU

  3. Android ve web tabanlı bir uygulama ile işitme engellilere yönelik sesli dersi yazılı takip sistemi

    Real-time inscriptive follow up system of audible lecture with an Android based and web based application

    EMRE BİÇEK

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Elektrik ve Elektronik MühendisliğiYüzüncü Yıl Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. MEHMET NURİ ALMALI

  4. Web tabanlı öğrenme nesnesi ambarı geliştirilmesi

    Web based learning object repository development

    MURAT İNCE

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TUNCAY YİĞİT

  5. A web based GIS mashup for archaeology

    Arkeoloji için ağ tabanlı CBS melez uygulaması

    BÜLENT ÖZTÜRK

    Yüksek Lisans

    İngilizce

    İngilizce

    2010

    ArkeolojiOrta Doğu Teknik Üniversitesi

    Jeodezi ve Coğrafi Bilgi Teknolojileri Ana Bilim Dalı

    DOÇ. DR. AHMET COŞAR

    PROF. DR. ADNAN YAZICI