Geri Dön

The text-mining based neighboring and automated annotation of pubchem bioassays

Pubchem bioassays için metin madenciliği tabanlı komşuluk ve otomatik anotasyonu

  1. Tez No: 778581
  2. Yazar: TUĞBA SÜZEK
  3. Danışmanlar: PROF. DR. JEFFREY SOLKA
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2012
  8. Dil: İngilizce
  9. Üniversite: George Mason University
  10. Enstitü: Yurtdışı Enstitü
  11. Ana Bilim Dalı: Biyoenformatik Ana Bilim Dalı
  12. Bilim Dalı: Hesaplamalı Bilim ve Mühendislik Bilim Dalı
  13. Sayfa Sayısı: 123

Özet

PubChem'de depolanan Yüksek Verimli Testlerin (HTS), yani BioAssay'lerin sayısı son yıllarda hızla arttı. BioAssay'ler için şu anda mevcut olan gruplama araçlarının ve tekli erişim analizi yaklaşımlarının, hızla artan veri hacmi ile pratik olmadığı ortaya çıktı. Bu çalışmada, yapılandırılmamış metin açıklamaları kullanılarak BioAssay'lerin otomatik komşuluğuna ve ek açıklamasına yönelik metin madenciliği tabanlı bir yaklaşım önerilmiştir. Mevcut test komşu yöntemleriyle karşılaştırıldığında test komşu kümeleme analizinden elde ettiğimiz sonuçlar, biyoanalizler arasındaki güçlü korelasyonların kavramsal ilgilerinden belirlenebileceğini ve PubChem'deki mevcut komşu yöntemleri tamamlayabileceğini göstermektedir. Tek bir yapılandırılmamış metin belgesinden anahtar sözcükler çıkarmak için yeni bir yöntem açıklanmakta ve yöntemin BioAssay açıklamalarına uygulandığında karşılaştırmalı performansı rapor edilmektedir. Son olarak, BioAssay metin açıklamalarının, prob kriterlerini karşılayan kimyasal maddelerin keşfine yönelik otomatik biyomedikal açıklamalarının sonuçları sunulmaktadır.

Özet (Çeviri)

The number of High Throughput Assays (HTS), namely BioAssays, deposited in PubChem has grown quickly in recent years. Currently available grouping tools and single retrieval analysis approaches for the BioAssays turned out to be impractical with the rapidly increasing volume of data. In this work, a text-mining based approach is proposed towards automated neighboring and annotation of BioAssays using their unstructured text descriptions. Our results from assay neighbor clustering analysis compared to the existing assay neighboring methods suggest that strong correlations among the bioassays can be identified from their conceptual relevance and complement existing neighboring methods in PubChem. A novel method to extract keywords from a single unstructured text document is described and the comparative performance of the method when applied to the BioAssay descriptions is reported. Finally results of the automated biomedical annotation of the BioAssay text descriptions towards the discovery of chemical substances that satisfy the probe criteria are presented.

Benzer Tezler

  1. Metin madenciliği tabanlı bildirim takip sistemi

    Text mining based issue tracking system

    MEHMET ALİ KÜÇÜK

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolPamukkale Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. SEZAİ TOKAT

  2. Müşteri memnuniyeti belirlenmesi için metin madenciliği tabanlı bir yazılım aracı

    A text mining based software tool development for detection of customer satisfaction

    KEMAL KUZUCU

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMaltepe Üniversitesi

    Bilgisayar Mühendisliği Bölümü

    YRD. DOÇ. DR. ŞENOL ZAFER ERDOĞAN

  3. Türkçe metinlerde sözlük tabanlı yaklaşımla duygu analizi ve görselleştirme

    Sentiment analysis and visualization by dictionary based approach in Turkish texts

    ABDOULAYE ISSA BABAN CHAWAI

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖNDER DEMİR

    DR. ÖĞR. ÜYESİ BUKET DOĞAN

  4. Eğitimde metin madenciliği: Türkçe metinlerde sözlük tabanlı duygu analizi

    Text mining in education: Dictionary-based in Turkish texts sentiment analysis

    LEYLA KARAKUŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Eğitim ve ÖğretimAkdeniz Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    DOÇ. DR. BİLAL BARIŞ ALKAN

  5. Açık kaynak istihbaratı için metin madenciliği teknikleri kullanılarak insan duygularının analizi

    Analysis of human emotions using text mining techniques for open-source intelligence

    SHAHIN AHMADOV

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMilli Savunma Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ AYTUĞ BOYACI