The text-mining based neighboring and automated annotation of pubchem bioassays
Pubchem bioassays için metin madenciliği tabanlı komşuluk ve otomatik anotasyonu
- Tez No: 778581
- Danışmanlar: PROF. DR. JEFFREY SOLKA
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2012
- Dil: İngilizce
- Üniversite: George Mason University
- Enstitü: Yurtdışı Enstitü
- Ana Bilim Dalı: Biyoenformatik Ana Bilim Dalı
- Bilim Dalı: Hesaplamalı Bilim ve Mühendislik Bilim Dalı
- Sayfa Sayısı: 123
Özet
PubChem'de depolanan Yüksek Verimli Testlerin (HTS), yani BioAssay'lerin sayısı son yıllarda hızla arttı. BioAssay'ler için şu anda mevcut olan gruplama araçlarının ve tekli erişim analizi yaklaşımlarının, hızla artan veri hacmi ile pratik olmadığı ortaya çıktı. Bu çalışmada, yapılandırılmamış metin açıklamaları kullanılarak BioAssay'lerin otomatik komşuluğuna ve ek açıklamasına yönelik metin madenciliği tabanlı bir yaklaşım önerilmiştir. Mevcut test komşu yöntemleriyle karşılaştırıldığında test komşu kümeleme analizinden elde ettiğimiz sonuçlar, biyoanalizler arasındaki güçlü korelasyonların kavramsal ilgilerinden belirlenebileceğini ve PubChem'deki mevcut komşu yöntemleri tamamlayabileceğini göstermektedir. Tek bir yapılandırılmamış metin belgesinden anahtar sözcükler çıkarmak için yeni bir yöntem açıklanmakta ve yöntemin BioAssay açıklamalarına uygulandığında karşılaştırmalı performansı rapor edilmektedir. Son olarak, BioAssay metin açıklamalarının, prob kriterlerini karşılayan kimyasal maddelerin keşfine yönelik otomatik biyomedikal açıklamalarının sonuçları sunulmaktadır.
Özet (Çeviri)
The number of High Throughput Assays (HTS), namely BioAssays, deposited in PubChem has grown quickly in recent years. Currently available grouping tools and single retrieval analysis approaches for the BioAssays turned out to be impractical with the rapidly increasing volume of data. In this work, a text-mining based approach is proposed towards automated neighboring and annotation of BioAssays using their unstructured text descriptions. Our results from assay neighbor clustering analysis compared to the existing assay neighboring methods suggest that strong correlations among the bioassays can be identified from their conceptual relevance and complement existing neighboring methods in PubChem. A novel method to extract keywords from a single unstructured text document is described and the comparative performance of the method when applied to the BioAssay descriptions is reported. Finally results of the automated biomedical annotation of the BioAssay text descriptions towards the discovery of chemical substances that satisfy the probe criteria are presented.
Benzer Tezler
- Metin madenciliği tabanlı bildirim takip sistemi
Text mining based issue tracking system
MEHMET ALİ KÜÇÜK
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolPamukkale ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. SEZAİ TOKAT
- Müşteri memnuniyeti belirlenmesi için metin madenciliği tabanlı bir yazılım aracı
A text mining based software tool development for detection of customer satisfaction
KEMAL KUZUCU
Yüksek Lisans
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMaltepe ÜniversitesiBilgisayar Mühendisliği Bölümü
YRD. DOÇ. DR. ŞENOL ZAFER ERDOĞAN
- Türkçe metinlerde sözlük tabanlı yaklaşımla duygu analizi ve görselleştirme
Sentiment analysis and visualization by dictionary based approach in Turkish texts
ABDOULAYE ISSA BABAN CHAWAI
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖNDER DEMİR
DR. ÖĞR. ÜYESİ BUKET DOĞAN
- Eğitimde metin madenciliği: Türkçe metinlerde sözlük tabanlı duygu analizi
Text mining in education: Dictionary-based in Turkish texts sentiment analysis
LEYLA KARAKUŞ
Yüksek Lisans
Türkçe
2021
Eğitim ve ÖğretimAkdeniz ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
DOÇ. DR. BİLAL BARIŞ ALKAN
- Açık kaynak istihbaratı için metin madenciliği teknikleri kullanılarak insan duygularının analizi
Analysis of human emotions using text mining techniques for open-source intelligence
SHAHIN AHMADOV
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMilli Savunma ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ AYTUĞ BOYACI