Veri bilimi meslekleri ve uzmanlık alanları arasındakiilişkilerin veri madenciliği yaklaşımıyla analizi
Analysis of the relationships between data science professions and areas of expertise using a data mining approach
- Tez No: 863390
- Danışmanlar: DOÇ. DR. OSMAN PALA
- Tez Türü: Yüksek Lisans
- Konular: Yönetim Bilişim Sistemleri, Management Information Systems
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Karamanoğlu Mehmetbey Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: Yönetim Bilişim Sistemleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 133
Özet
Günümüzde artan veri nedeniyle veri bilimi alanında farklı uygulama alanlarına sahip meslekler ortaya çıkmıştır. Bu mesleklerin ortak ve farklı uzmanlık alanları bulunmaktadır. Aynı zamanda bu mesleklerde farklı ve ortak yeterlilikler gerekmektedir. Bu tez çalışmasının amacı, veri bilimi mesleklerinin uzmanlık alanları ve yeterlilik gereksinimleri açısından veri madenciliği yöntemleri ile analiz edilerek aralarındaki ilişkilerin ortaya konması ve bu mesleklerde kariyer planı yapacak olan kişiler için yol haritası oluşturulmasına yardımcı olmaktır. Kariyer ilanları barındıran ve aynı zamanda bir iş ağı olan Linkedin'deki veri bazlı meslek ilanları için Dünya genelinde açılmış olan 13.349 iş ilanı veri kazıma yöntemiyle elde edilerek veri seti oluşturulmuştur. Oluşturulan veri setine random forest, decision tree ve support vector machine sınıflandırma algoritmaları uygulanmıştır. Uygulanan algoritmalar içerisinden eğitim ve test verileri üzerinde başarımı en yüksek olan random forest algoritması kullanılmıştır. Random forest algoritması ile öznitelik seçimi veri seti üzerinde uygulanmıştır. Öznitelik seçimi ile belirlenen 29 değişken ile sınıflandırma analizi gerçekleştirilmiştir. Yine aynı veri setine apriori algoritması uygulanarak iş ilanlarına başvuran adayların yetenekleri analiz edilmiştir. Yapılan analizler sonucunda random forest algoritmasının sınıflandırma başarımı eğitim veri seti üzerinde %97.49, test veri seti üzerinde %84.64 olarak sonuçlanmıştır. Apriori algoritması ile ortak ve farklılık gösteren yetenekler belirlenmiştir.
Özet (Çeviri)
Today, due to the increasing data, professions with different application areas have emerged in the field of data science. These professions have common and different areas of specialization. At the same time, these professions require different and common competencies. The aim of this thesis is to analyze data science professions in terms of specialization areas and qualification requirements with data mining methods and to reveal the relationships between them and to help create a road map for people who will make career plans in these professions. A data set was created by obtaining 13.349 job postings opened worldwide for data-based occupational postings on Linkedin, a business network that hosts career postings, by data scraping method. Random forest, decision tree and support vector machine classification algorithms were applied to the data set. Among the applied algorithms, the random forest algorithm with the highest performance on training and test data was used. Feature selection with random forest algorithm was applied on the dataset. Classification analysis was performed with 29 variables determined by feature selection. Apriori algorithm was applied to the same dataset and the skills of the candidates applying to job postings were analyzed. As a result of the analysis, the classification performance of the random forest algorithm was %97.49 on the training data set and %84.64 on the test data set. Common and different capabilities with the Apriori algorithm were identified.
Benzer Tezler
- Using multivariate methods to determine the most important affecting factors for students' admission and their interests in the specializations: A sample of Salahaddin University
Öğrenci kabulünde uzmanlık alanlarını belirlemek için etkili olan en önemli faktörlerin belirlenmesinde çok değişkenli yöntemlerin kullanımı: Salahaddin Üniversitesi örneği
MOHAMMED OTHMAN ABDULLAH ABDULLAH
Yüksek Lisans
İngilizce
2020
İstatistikVan Yüzüncü Yıl Üniversitesiİstatistik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YENER ALTUN
DR. ÖĞR. ÜYESİ RİZGAR MAGHDİD AHMED
- An onto-phenomenological inquiry on the post-industrial maker experiences through the lens of actor network theory
Post-endüstriyel yapan deneyimlerinin, aktör ağ teorisi ile onto-fenomenolojik olarak sorgulanması
ÖZGÜN DİLEK
Doktora
İngilizce
2020
Endüstri Ürünleri Tasarımıİstanbul Teknik ÜniversitesiEndüstri Ürünleri Tasarımı Ana Bilim Dalı
DOÇ. DR. ÇİĞDEM KAYA
- Fibrotik İnterstisyel Akciğer Hastalıkları'nda progresyon görülme sıklığı ve mortaliteye etkisi
Frequency of progression and its effect on mortality in fibrotic Interstitial Lung Diseases
NİLÜFER YİĞİT
Tıpta Uzmanlık
Türkçe
2022
Göğüs HastalıklarıPamukkale ÜniversitesiGöğüs Hastalıkları ve Tüberküloz Ana Bilim Dalı
PROF. DR. GÖKSEL ALTINIŞIK
- Gastronomi rehberliği alanında uzmanlaşma eğitimi alan rehberlerin kişilik özellikleri ve yenilikçilik düzeylerinin belirlenmesi
Determination of personality characteristics and innovation levels of guides who received specialization training in gastronomy guidance
AYGÜL AYRAN
Yüksek Lisans
Türkçe
2024
TurizmMersin ÜniversitesiTurizm Rehberliği Ana Bilim Dalı
DOÇ. DR. SEVDA BİRDİR
- Asistan hekimlerin radyolojik görüntüleme yöntemleri ve radyasyondan korunma hakkında bilgi ve tutumlarının değerlendirilmesi
Evaluation of assistant physicians' knowledge and attitudes about radiological imaging methods and radiation protection
FATMA ARI
Tıpta Uzmanlık
Türkçe
2024
Aile HekimliğiSağlık Bilimleri ÜniversitesiAile Hekimliği Ana Bilim Dalı
DOÇ. DR. SELMA PEKGÖR