Metin işleme: Soru soran bir sistem tasarımı
Text processing: Design of question asking system
- Tez No: 166564
- Danışmanlar: DOÇ.DR. COŞKUN SÖNMEZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2005
- Dil: Türkçe
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 95
Özet
METİN İŞLEME: SORU SORAN BİR SİSTEM TASARIMI ÖZET Günümüzde metin işleme ve anlama tabanlı yapay zeka uygulamaları gün geçtikçe, artan bir şekilde rağbet görmeye başlamıştır. Bunun en temel nedeni, bilgiye olan ihtiyacın daha da artması, dolayısıyla da bilgiye daha hızlı erişme gereksinimin doğmasıdır. Metin işleme ve anlama tabanlı sistemlerde en çok kullanılanlar, sora soran ve soru yanıtlayan sistemlerdir. Soru yanıtlayan sistemlerde bilgisayar, kendisine verilen metinle ilgili, kullanıcı sorularım doğal dilde yanıtlar. Bir nevi kullanıcı ile bilgisayar arasında tam bir etkileşimin sağlandığı sistemlerdir. Burada amaç; kullanıcının erişmek istediği bilgiye, kendi dilinde, adeta aradığım bir insana sorarmış gibi erişmesini sağlamak ve bilgiyi aramak için harcanan zamanı ortadan kaldırmaktır. Soru soran sistemler ise, yeni gelişmekte olan sistemlerdir ve bu tez çalışmasının ana konusunu oluşturmaktadır. Bu sistemlerin en yaygın olarak kullanılabileceği alan, eğitim alanıdır. Şu an doğal dil işleme sistemlerinin geldiği noktaya bakıldığında, henüz ilköğretim seviyesindeki öğrencilere yönelik sistemler geliştirilebilmektedir. Soru soran sistemlerde bilgisayar, öğretmenin girdiği metinle ilgili öğrencilere soru sorabilmekte ve öğrencilerin okuduğunu anlama düzeyleri bu şekilde kontrol edilebilmektedir. Bu tez çalışması, yapay zekatım bir alam olan doğal dil işleme (NLP - Natural Language Processing) teknolojisi kapsamında gerçekleştirilmiştir. Daha önce yapılmış olan projelerden yararlanılmış ve Türkçe doğal dil işleme çalışmasının daha da geliştirilmesi hedeflenmiştir. Bundan sonraki NLP projelerinde hazır olarak kullanılabilecek, internet üzerinde çalışabilen modüler NLP araçları ve dokümanlarının oluşturulması projenin ilk ıxadımını oluşturmuştur. Bu NLP araçları“kelime ayrıştırıcı”,“cümle ayrıştırıcı”,“öğe ayrıştırıcı”ve“sözlük”' dür. Kelime ayrıştırıcı modülde, girilen metindeki tüm kelimeler“kök-gövde-yapımeki- çekimeki”formatmda ayrılmıştır. Cümle ayrıştırıcı modülde, yan cümleler içeren bileşik cümleler basit cümlelere ayrılarak, bu basit cümleler birbirleriyle ilişkilendirilmiştir. Öğe ayrıştırıcı modülde, basit cümlelerin öğeleri bulunmuştur. Sözlük, diğer modüllerin kullandığı yaklaşık 50000 kelimelik bir sözlüktür ve sözcüklerin kullanım sıklıklarına göre türlerinin belirlenmiş olduğu bir veritaban yapısındadır. Bu çalışmanın ikinci adımında, girilen bir metindeki cümleler analiz edilerek, kullanıcıya cümlelerle ilgili sorular sorulmuş ve kullanıcının verdiği cevap incelenerek doğruluğu kontrol edilmiştir. Girilen metin öncelikle eklerine ayrılmıştır. Daha sonra yan cümleler içeren karmaşık cümleler, basit cümleciklere ayrılmış ve aralarındaki bağlantılar tespit edilmiştir. Son olarak basit cümleler öğelerine ayrılarak Prolog önermelerine çevrilmiş ve Prolog veritabanına eklenmiştir. Kullanıcının bu sorulara verdiği yanıtlar benzer şekilde öğelerine ayrılarak, doğruluğu kontrol edilmiştir. Kullanıcının yanlış yanıt vermesi durumunda, doğru yanıt kullanıcıya sunulmuştur. Tez çalışmasının amacı, yeni gelişmekte olan doğal dilde metin işleme ve anlama tabanlı soru soran sistemlere yönelik Türkçe dahilinde bir çalışma yapmaktır. Bu çalışma sırasında, Türkçe'ye yönelik doğal dil işleme çalışmalarının henüz yeterli olmadığı ve eldeki kaynakların çok da tatmin edici olmadığı saptanmıştır. Ayrıca dünyada gelinen noktaya bakıldığında metin işleme çalışmalar her ne kadar yeterli düzeyde olsa da, metinsel anlama henüz tam olarak başarılamamıştır. Ancak bu çalışmaların yıllar gerektiren çalışmalar olduğu düşünülürse, geleceğe yönelik karamsar bir tablo çizmek son derece yanlış olacaktır.
Özet (Çeviri)
TEXT PROCESSING: A QUESTION ASKING SYSTEM DESIGN SUMMARY These days, the applications about text processing and understanding have started attracting attention. The main reason of this is, the increasing need of information and the need of accessing to information more quickly. The being used mostly within text processing and understanding systems are question asking and question answering systems. The main principle of question asking systems is that the computer answers the questions of a user about the text given in natural language form which means building an interactive system that provides a link between the user and computer. Tha aim here is, to provide an environment to user that makes possible the accessing any information much more quickly and accessing in his/her own natural language as if asking a question to a human being facing which also reduces the time wasting during searching of the information. Question asking systems are newly developped systems and they are the main subject of this thesis. These systems can be used most widespreadly in education area. That is possible to develop systems which are for just primary school students if looking at the place we are present at text processing and question asking systems. In these systems, the teacher inputs a text to computer, and then computer asks questions about the input text. In this way, the text understanding level of the student can be compared. This work has been developed in the research area of Artificial Intelligence, Natural Language Processing(NLP). Earlier projects has been used as a source. It is benefited from the earlier projects and aimed to widen the horizons of language processing studies. XIThe fîrst step of the project is creating web-based moduleer NLP tools which can run on the Internet, and NLP documentaries. These NLP tools are“kelimeparser”,“cumleparser”,“ogeparser”and“dictionary”respectively. in the kelimeparser modüle, ali words in the text are parsed according to the format of root-conjugation affix. hı the cumleparser modüle, by separating complex sentences, which includes more than öne verb, into simple sentences, these simple sentences are related to each other in respect of connection between them. hı the ogeparser modüle, ali components of sentences are defined. Dictionary, which has about 50000 words, is used by the other modulees and it has a database structure that keeps also the part-of-speech of the words which means the type of words. in the second step of this work, by analizing sentences in input text, questions are represented to user and answers are examined. Önce input text entered, ali words are parsed into its roots and affixes. Then complex sentences are parsed üıto simple sentences and the relationships between them are defined. Finally, simple sentences are broken into their components and then they are translated to Prolog clauses and added to Prolog database. Similarly, users' answers are translated to Prolog form, and then examined for validity. hı the case of detecting the wrong answers, the right ones are displayed to the user. The majör reason of this work is to make a research about the Turkish text processing and understanding systems which are also newly developping in the world in other languages. During these work it has been realized that the works about the natural language processing üı Turkish is not enough and the resources we have is not satisfied. Although, text processing works can be seen satisfied enough in the world, text understanding systems are really far from the point that it must be in. But if it were thought that these kind of works need so much time to be completed fully, to think pessimistic about the future of this science would be wrong also. xii
Benzer Tezler
- Contribution a la recherche d'un cadre juridique pour un droit international de laconcurrence plus efficace
Daha etkin bir uluslararası rekabet için hukuki çerçeve arayışı
ALİ CENK KESKİN
Doktora
Fransızca
2009
HukukGalatasaray ÜniversitesiKamu Hukuku Ana Bilim Dalı
PROF. DR. JEAN MARC SOREL
PROF. DR. HALİL ERCÜMENT ERDEM
- Türkiye'de ilköğretim sisteminin geliştirilmesi için gelecek senaryoları
Future scenarios for the improvement of Turkish primary education
SERKAN KOŞAR
Doktora
Türkçe
2012
Eğitim ve ÖğretimGazi ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
PROF. DR. NEZAHAT GÜÇLÜ
- Yeni ALC yabancı dil öğretim sisteminin değerlendirilmesi
Başlık çevirisi yok
MUSTAFA ER
Yüksek Lisans
Türkçe
2000
Eğitim ve Öğretimİstanbul Üniversitesiİngiliz Dili ve Edebiyatı Ana Bilim Dalı
YRD. DOÇ. DR. ALEV BULUT
- L'intentionnalité et l'individuation chez Brentano et Husserl
Brentano ve Husserl'de yönelimsellik ve bireyleşme
YUSUF YILDIRIM
Doktora
Fransızca
2024
FelsefeGalatasaray ÜniversitesiFelsefe Ana Bilim Dalı
PROF. DR. ALİYE KOVANLIKAYA
PROF. DR. CHRISITAN BONNET