Publication: การศึกษาคำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์แนวภาษาศาสตร์คอมพิวเตอร์
View online Resources
Submitted Date
Received Date
Accepted Date
Issued Date
2007
Copyright Date
Announcement No.
Application No.
Patent No.
Valid Date
Resource Type
Edition
Resource Version
Language
th
File Type
No. of Pages/File Size
ISBN
ISSN
eISSN
DOI
Scopus ID
WOS ID
Pubmed ID
arXiv ID
item.page.harrt.identifier.callno
Other identifier(s)
Journal Title
Volume
Issue
Edition
Start Page
End Page
Access Rights
Access Status
Rights
Rights Holder(s)
Physical Location
Bibliographic Citation
Research Projects
Organizational Units
Authors
Journal Issue
Title
การศึกษาคำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์แนวภาษาศาสตร์คอมพิวเตอร์
Alternative Title(s)
A computational linguistic study of nouns referring to scientific instruments
Author(s)
Author’s Affiliation
Author's E-mail
Editor(s)
Editor’s Affiliation
Corresponding person(s)
Creator(s)
Compiler
Advisor(s)
Illustrator(s)
Applicant(s)
Inventor(s)
Issuer
Assignee
Other Contributor(s)
Series
Has Part
Abstract
วิทยานิพนธ์เล่มนี้มีวัตถุประสงค์เพื่อศึกษาโครงสร้างระดับตรรกะและความสัมพันธ์ทางความหมายขององค์ประกอบบังคับของคำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์ อันจะนำไปสู่การบอกขอบเขตของคำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์ได้จากจำนวนองค์ประกอบบังคับ โดยการวิเคราะห์โครงสร้างหลายระดับตามแนว G.E.T.A. ผลการศึกษาพบว่า คำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์เกิดจากการประสมคำ โดยมีความสัมพันธ์ไม่ซับซ้อนคิดเป็นร้อยละ 8.98 และความสัมพันธ์ซับซ้อนเป็นลำดับชั้นคิดเป็นร้อยละ91.02 คำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์สามารถแบ่งได้เป็น 2 หน่วยสร้าง คือ หน่วยสร้างไร้ศูนย์ (exocentric construction) และหน่วยสร้างเข้าศูนย์ (endocentric construction) คำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์ที่เป็นหน่วยสร้างไร้ศูนย์มีลักษณะเป็นคำประสม ประกอบด้วยคำแสดง 2 คำที่ร่วมกันเป็นส่วนหลักเพื่อสื่อความหมายของคำทั้งคำ และผ่านกระบวนการเปรียบเทียบ ส่วนคำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์ที่เป็นหน่วยสร้างเข้าศูนย์มีทั้งที่เป็นคำประสมและที่ยังคล้ายคลึงนามวลีมาก กรณีหลังนี้พบมากในคำที่ผ่านการแปลในพจนานุกรมไทย – อังกฤษ ประกอบด้วยคำแสดงและองค์ประกอบบังคับอย่างมากที่สุด 2 ตัว โดยคำแสดงทำหน้าที่เป็นส่วนหลัก ส่วนองค์ประกอบบังคับเป็นส่วนขยายจำเป็นเพื่อบ่งชี้คุณสมบัติพิเศษหรือวัตถุประสงค์ เมื่อนำผลการวิเคราะห์ทางภาษาศาสตร์มาประยุกต์กับเครื่องคอมพิวเตอร์ ด้วยโปรแกรม Unitex พบว่า เครื่องคอมพิวเตอร์สามารถบอกขอบเขตของคำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์ได้ คือ เมื่อทดสอบกับคลังข้อมูลที่เป็นรายการคำศัพท์ ทั้งค่าความครบถ้วน (Recall) และค่าความแม่นยำ (Precision) สูงมาก คือ ประมาณร้อยละ 99 เมื่อทดสอบกับคลังข้อมูลที่เป็นบทความ เครื่องสามารถบอกขอบเขตของคำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์ได้ โดยค่าความครบถ้วนอยู่ที่ร้อยละ 71.41 และค่าความแม่นยำอยู่ที่ร้อยละ 30.62 และยังสามารถบอกขอบเขตของคำนามนอกสาขาที่มีโครงสร้างอย่างเดียวกันได้ด้วยอันเป็นผลที่ได้เกินความคาดหมาย โดยค่าความครบถ้วนอยู่ที่ร้อยละ 81.47 และค่าความแม่นยำอยู่ที่ร้อยละ 51.81
This thesis aims to study the logic structure and semantic relations of the arguments of nouns referring to scientific instruments in order to identify the boundary of those words from numbers of arguments by using the multi – level structure analysis proposed by G.E.T.A. All nouns referring to scientific instruments in our lexicon have been compounded from words. They have the 8.98% complex relationship and the 91.02% non-complex relationship. They can be divided into two constructions: exocentric and endocentric. Exocentric construction is the compound word which has two predicates (heads) to express the whole meanings of words. Endocentric construction can be both compound words and noun phrases, which are mostly found in translated words in Thai – English dictionary. It consists of predicate (head) and at most 2 arguments indicating special attributes or purposes. The linguistic results were obtained by testing with Unitex program. It is found that the program can identify the boundary of nouns referring to scientific instruments. When testing with the word list, both recall and precision rates are as high as 99%. On the other hand, when testing with the corpus, the recall rate is 71.41%, and the precision rate is 30.62%. Moreover, the program can even identify the boundary of the nouns in other different fields with 81.47% recall and 51.81% precision rates.
This thesis aims to study the logic structure and semantic relations of the arguments of nouns referring to scientific instruments in order to identify the boundary of those words from numbers of arguments by using the multi – level structure analysis proposed by G.E.T.A. All nouns referring to scientific instruments in our lexicon have been compounded from words. They have the 8.98% complex relationship and the 91.02% non-complex relationship. They can be divided into two constructions: exocentric and endocentric. Exocentric construction is the compound word which has two predicates (heads) to express the whole meanings of words. Endocentric construction can be both compound words and noun phrases, which are mostly found in translated words in Thai – English dictionary. It consists of predicate (head) and at most 2 arguments indicating special attributes or purposes. The linguistic results were obtained by testing with Unitex program. It is found that the program can identify the boundary of nouns referring to scientific instruments. When testing with the word list, both recall and precision rates are as high as 99%. On the other hand, when testing with the corpus, the recall rate is 71.41%, and the precision rate is 30.62%. Moreover, the program can even identify the boundary of the nouns in other different fields with 81.47% recall and 51.81% precision rates.
Table of contents
Description
Sponsorship
Degree Name
อักษรศาสตรมหาบัณฑิต
Degree Level
ปริญญาโท
Degree Department
คณะอักษรศาสตร์
Degree Discipline
Degree Grantor(s)
จุฬาลงกรณ์มหาวิทยาลัย