Veri analitiğinin ekonomik etkileri: İnternet yayıncılığında metin tabanlı öneri motoru örneği
Economic effects of data analytics: Text based recommendation engine example in internet publishing
- Tez No: 485204
- Danışmanlar: PROF. DR. NEDİME LERZAN ÖZKALE, DOÇ. DR. BAŞAR ÖZTAYŞİ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Ekonomi, Computer Engineering and Computer Science and Control, Science and Technology, Economics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2017
- Dil: Türkçe
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İşletme Mühendisliği Ana Bilim Dalı
- Bilim Dalı: İşletme Mühendisliği Bilim Dalı
- Sayfa Sayısı: 152
Özet
Veri madenciliği konusu, özellikle günümüzde oldukça popüler bir konudur. Veri madenciliği; büyük ölçekli veriler arasından bilgiye ulaşma, bilgiyi madenleme işidir. Literatürdeki en yaygın kullanımı ile büyük miktarda verinin anlamlı örüntüler bulmak amacıyla otomatik veya yarı otomatik yöntemler ile işlenmesidir. İnternet kullanımının yaygınlaşmasının hızına bağlı olarak dijital medya geleneksel medyanın yerini almakta ve bu alanda oluşan verinin büyüklüğü her geçen gün ciddi oranda artmaktadır. Dijital medya içerisinde görsel içeriklerin çokluğu kadar metinsel formlar da oldukça fazladır. Bu nedenle metin incelemesi için metin madenciliği teknikleri kullanılması gerekmektedir. Metin madenciliği, yapılandırılmamış metinlerden önemsiz olarak nitelendirilen, herhangi bir anlam çıkarımı yapılamayacak verilerin otomatik olarak çıkarılarak metnin anlamlandırılmasını sağlayan bilgisayar temelli yollardan biridir. Metin Madenciliği aynı zamanda veri madenciliği, makine öğrenmesi ve istatistik gibi alanların birleşiminden oluşan yeni ve disiplinler arası bir alandır. Bu alanın ticari potansiyeli, çoğu bilgi metin olarak saklandığından oldukça yüksek olarak görülmektedir. Aynı zamanda metin madenciliği alanında hâlihazırdaki en geniş bilgi kaynağı, İnternet ortamındaki yapılandırılmamış metinlerdir. Son dönemde oldukça popüler alanlar olan veri ve metin madenciliği alanlarında ülkemizde de belirli çalışmalar yapılmaktadır. Bu tez çalışmasında özellikle ülkemiz ve dünyada bu alanlara verilen önem, pazar büyüklükleri, bu alanda verilen eğitimlerin başarı üzerindeki etkileri, bu alanda yapılan çalışmaların yaratacağı katma değerler üzerinden ekonomik araştırmalar gerçekleştirilmiştir. Bu çalışmada temel araştırma konuları olarak belirlenen Dünya'da Bilgi ve İletişim Teknolojileri Sektörü, Avrupa Birliği 2020 Yenilik Göstergeleri, Türkiye'de Bilgi ve İletişim Teknolojileri Sektörü, Bilgi ve İletişim Teknolojileri Alanında Hindistan – Türkiye Karşılaştırması, Bilgi ve İletişim Teknolojilerinde Eğitimin Önemi, Bilgi ve İletişim Teknolojilerinde Nitelikli İşgücü konuları incelenmiştir. Bu çalışmanın giriş bölümünde, İnternet ortamındaki artan dijital verinin boyutuna bağlı olarak uygulanan geleneksel öneri sistemleri ve öneri motorları yaklaşımlarından bahsedilmiş olup, bilgi teknolojileri alanındaki güncel konular olan makine öğrenmesi ve yapay zeka kavramlarına değinilmiştir. İkinci bölümde, veri analitiğinin ekonomik etkilerinden bahsedilmiş olup, bu kapsamda dünyada ve Türkiye'de bilgi ve iletişim teknolojilerinin yeri, bu alandaki nitelikli işgücü ve eğitimin öneminden bahsedilip, Hindistan ve Türkiye karşılaştırmalı olarak incelenmiştir. Üçüncü bolümde, veri analitiği kavramından bahsedilmiş olup, bu kapsamda veri madenciliği, metin madenciliği ve öneri motoru ve veri madenciliğinde etik kavramlarından bahsedilmiştir. Dördüncü bölümde, literatür taraması yapılmış olup metin analitiği ve öneri motorlarındaki uygulama adımları kapsamlı bir biçimde irdelenmiştir. Beşinci bölümde, uygulama kapsamında geliştirilmiş olan kişiselleşmiş öneri motorunun amacından, yapısından ve akışından bahsedilmiştir. Altıncı bolümde, uygulama anlatılmış olup bu kapsamda gerçekleştirilen veri toplama, ön işleme ve öneri motoru uygulaması anlatılmıştır. Sonuç bölümünde ise, tezin uygulaması yorumlanıp, değerlendirilmiş ve sonuçlandırılmıştır. Uygulamanın sonuç kısmında gösterilen mikroekonomik etki, Web içerik sitesi olarak faaliyet gösteren“Gazetemsi”nin reklam alanlarında yapılan Türkçe Metin Madenciliği Destekli Öneri Motoru sayesinde site içi etkileşimin artmasına bağlı olarak elde edilen ekstra reklam gelirleri üzerinden çıkarımlar yapılarak elde edilmiştir. Bu çıkarımlar sonucu, projede ulusal kazanım olarak Türkçe Metin Madenciliği Destekli yerli bir öneri motoru geliştirilmiş olup, bu alanda yapılacak çalışmalar ile oluşacak ekonomik etkiler ortaya konmuştur. Sonuç olarak, kullanıcıların site içerisinde geçirdikleri süre ve ilişkili içerik okunma sayısı artırılarak ayda yaklaşık 22.230 TL ek kazanç sağlanmıştır. Dolayısıyla projenin geliştirilme amacına ulaşılmıştır. Çalışma kapsamında ortaya konan Öneri Motoru Projesi,“İçerik Bazlı İnternet Sitesi İçin Metin ve Veri Madenciliği Yaklaşımları ile Desteklenen Kişiselleştirilmiş Öneri Motoru”proje adı ile TÜBİTAK-TEYDEB 1507-Kobi Ar-Ge Başlangıç Destek Programı kapsamında TÜBİTAK tarafından desteklenmiştir.
Özet (Çeviri)
The topic of data mining is a very popular subject, especially nowadays. Data mining is a process which access the information among large-scale data and mine the knowledge. The most widespread use in the literature is to process large amounts of data automatically or semi-automatically to find meaningful patterns. Depending on the pace of the spread of Internet usage, digital media takes the place of traditional media, and the size of the domain is increasing day by day. The number of textual forms in digital media is also quite large. For this reason, Text Mining techniques should be used for text review. Text Mining is one of the computer-based ways that make text meaningful by automatically extracting data that can not be deduced from any meaning, which is regarded as insignificant from unstructured text. Text Mining is a new and interdisciplinary field consisting of a combination of fields such as data mining, machine learning and statistics. The commercial potential of this area seems to be quite high, as most of the information is stored as text. At the same time, the largest source of information currently available in the field of text mining is unstructured text on the Internet. In the field of Data and Text Mining which is a very popular field in the recent period, some studies are also being carried out in our country. In this thesis study, economical researches have been carried out especially on the importance given to these fields in our country and in the world, the market sizes, the successes of the trainings given in this field prior to university education and the added value of the studies made in this field. In this study, Sector of Information and Communication Technologies in the World, European Union 2020 Innovation Indicators, Information and Communication Technologies Sector in Turkey, India - Turkey Comparison in the Field of Information and Communication Technologies, Education in Information and Communication Technologies, Qualified labor issues in communication technologies have been examined. In the introductory part of this work, the traditional suggestion systems and recommendation engines approaches applied according to the size of the increasing digital data on the Internet are mentioned and the concepts of machine learning and artificial intelligence, which are the current topics in information technology, are mentioned. In the second chapter, economic effects of data analysis are mentioned and in this context, the importance of information and communication technologies in the world and Turkey, the importance of qualified labor and education in this area, and India and Turkey are examined comparatively. In the third chapter, the concept of data analysis is mentioned and the concepts of data mining, text mining, suggestion engine and ethics in data mining are mentioned. In the fourth chapter, literature review has been done and the application steps in text analysis and recommendation engines have been extensively discussed. In the fifth chapter, the aim, structure and flow of the personalized recommendation engine developed within the context of the application are mentioned. In the sixth chapter, the application is explained and the data collection, preprocessing and suggestion engine application realized in this context are explained. In the conclusion part, the thesis application was interpreted, evaluated and finalized. The microeconomic effect shown in the conclusion of the application is obtained by deductions from the extra advertising revenues obtained due to the increase of intra-site interaction thanks to the Turkish Text Mining Support Engine which is built on the advertisement areas of“Gazetemsi”, which is a Web content site. As a result of this project, the amount of time spent by users on the site and the number of related content readings were increased, resulting in an additional gain of approximately TL 22.230 per month. Therefore the project has been achieved for the purpose of development. As a result of these conclusions, a local recommendation engine supported by Turkish Text Mining has been developed as a national achievement in the project. The Recommendation Engine Project, which was put into the scope of the study, was supported by TÜBİTAK under the project name“TUBITAK-TEYDEB 1507-SME R & D Start-Up Support Program”with the project name“Personalized Recommendation Engine Supported by Text and Data Mining Approaches for Content Based Website”.
Benzer Tezler
- Sentiment analysis model proposal with deep learning techniques on big data: Portfolio selection with the help of industry indicators
Büyük veri üzerinde derin öğrenme teknikleri ile duygu analizi model önerisi: Sektör göstergeleri yardımıyla portföy seçimi
MAHMUT SAMİ SİVRİ
Doktora
İngilizce
2023
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ALP ÜSTÜNDAĞ
- Yeşil tedarik zinciri yönetiminin sürdürülebilir firma performansı üzerindeki etkisi ve büyük veri analitiği yeteneğinin rolü
The impact of green supply chain management on sustainable firm performance and the role of big data analytics capability
SİNEM GÖK ACAR
Yüksek Lisans
Türkçe
2024
İşletmeYıldız Teknik Üniversitesiİşletme Ana Bilim Dalı
PROF. DR. MURAT ÇEMBERCİ
- Sign predictability of intraday price returns to formulate appropriate trading strategies with optimum set of equities
Optimum hisse senedi kümesi ile uygun işlem stratejileri oluşturmak için gün içi fiyat getirilerinin işaret tahmin edilebilirliği
ABDURRAHMAN KILIÇ
Doktora
İngilizce
2024
Ekonometriİstanbul Teknik Üniversitesiİktisat (İngilizce) Ana Bilim Dalı
PROF. DR. BÜLENT GÜLOĞLU
- Karma frekanslı zaman serilerinin modellenmesi: Büyük veri örneği
Modeling of mixed frequency time series: Big data example
GÖZDE BOZKURT
- Makine öğrenmesi algoritmaları ile suistimallerin belirlenmesi
Fraud detection by machine learning algorithms
HARUN KUTLUAY
Yüksek Lisans
Türkçe
2023
BankacılıkAnkara Sosyal Bilimler ÜniversitesiDenetim ve Risk Yönetimi (Disiplinlerarası) Ana Bilim Dalı
DR. ÖĞR. ÜYESİ FURKAN UYSAL