Publication: การพัฒนาโปรแกรมการถอดอักษรภาษาอังกฤษเป็นภาษาไทยโดยใช้คลังคำทับศัพท์ของราชบัณฑิตยสถาน
Submitted Date
Received Date
Accepted Date
Issued Date
2004
Copyright Date
Announcement No.
Application No.
Patent No.
Valid Date
Resource Type
Edition
Resource Version
Language
th
File Type
No. of Pages/File Size
ISBN
ISSN
eISSN
DOI
Scopus ID
WOS ID
Pubmed ID
arXiv ID
item.page.harrt.identifier.callno
Other identifier(s)
Journal Title
Volume
Issue
Edition
Start Page
End Page
Access Rights
Access Status
Rights
Rights Holder(s)
Physical Location
Bibliographic Citation
Research Projects
Organizational Units
Authors
Journal Issue
Title
การพัฒนาโปรแกรมการถอดอักษรภาษาอังกฤษเป็นภาษาไทยโดยใช้คลังคำทับศัพท์ของราชบัณฑิตยสถาน
Alternative Title(s)
The development of an English-Thai transliteration program based on transliterated-word corpus of the Royal Institute
Author(s)
Author’s Affiliation
Author's E-mail
Editor(s)
Editor’s Affiliation
Corresponding person(s)
Creator(s)
Compiler
Advisor(s)
Illustrator(s)
Applicant(s)
Inventor(s)
Issuer
Assignee
Other Contributor(s)
Series
Has Part
Abstract
วิทยานิพนธ์ฉบับนี้มีวัตถุประสงค์เพื่อรวบรวมคำทับศัพท์ภาษาอังกฤษของราชบัณฑิตยสถาน และเปรียบเทียบกฎการทับศัพท์ของราชบัณฑิตยสถานกับข้อมูลจริงที่พบ พร้อมทั้งสร้างโปรแกรมการถอดอักษรภาษาอังกฤษเป็นภาษาไทยโดยใช้คลังคำทับศัพท์ดังกล่าวเพื่อสร้างตารางกฎการถอดอักษรภาษาอังกฤษเป็นภาษาไทยให้กับคอมพิวเตอร์ การวิจัยนี้ได้เก็บรวบรวมคำภาษาอังกฤษและคำทับศัพท์ภาษาไทยจำนวน 10,060 คำจากเอกสารที่เผยแพร่โดยราชบัณฑิตยสถานเพื่อนำมาใช้เป็นคลังคำทับศัพท์ ผลการวิจัยพบว่า กฎการถอดอักษรของราชบัณฑิตยสถานสอดคล้องกับข้อมูลในคลังทับศัพท์ดังนี้ กฎสำหรับสระมีความสอดคล้อง 92.68% สำหรับพยัญชนะต้นสอดคล้อง 97.35% สำหรับพยัญชนะท้ายสอดคล้อง 97.34% และเมื่อทดลองโปรแกรมที่พัฒนาขึ้นโดยใช้กฎที่สร้างขึ้นจากข้อมูล 80% ของคลังคำทับศัพท์ ผลการทดลองกับข้อมูลอีก 20% ปรากฏว่าโปรแกรมสามารถถอดอักษรในระดับคำได้ถูกต้อง 39.53% และถูกต้อง 79.8% ในระดับอักษร ซึ่งแสดงว่าประสิทธิภาพการถอดอักษรของโปรแกรมยังไม่ดีเท่าที่ควร เนื่องมาจากสาเหตุหลายประการ เช่น โปรแกรมไม่ได้นำขอบเขตพยางค์มาพิจารณา ไม่ได้พิจารณาเสียงภาษาอังกฤษ รวมถึงความหลากหลายของคำทับศัพท์ของราชบัณฑิตยสถานที่รวบรวมไว้ในคลังข้องมูล และยังพบว่าในการถอดอักษรจริงนั้น มีการถอดอักษรแบบที่นอกเหนือไปจากที่ราชบัณฑิตยสถานให้ไว้ในตารางเทียบอักษรอยู่จำนวนหนึ่
The purpose of this thesis is to collect transliterated words published by the Royal Institute and compare the transliteration regulation of the Royal Institute with the collected data. Furthermore, an English-Thai transliteration program based on transliteratedword corpus of the Royal Institute was developed in order to generate tables of English-Thai transliteration rules for computers. The transliterated-word corpus is composed of 10,060 pairs of English and transliterated Thai words published by the Royal Institute. The result shows that the transliteration regulation of the Royal Institute conforms with the collected data in the corpus as follows: The transliteration rules for vowels have 92.68% accordance, the transliteration rules for initial consonants have 97.35% accordance and the transliteration rules for last consonants have 97.34% accordance. When the developed program was trained by the rules generated from 80% of the corpus, the result of testing on 20% remainder shows 39.53% accuracy in word level and 79.8% accuracy in alphabetical level. This suggests that the transliteration program yields quite a poor result due to considerable reasons, for instance syllable boundaries and phonetic transcriptions were not considered including various versions of transliterated words published by the Royal Institute collected in the corpus. It is also found that a number of transliteration rules are not yet included in the Royal Institute's table of transliteration.
The purpose of this thesis is to collect transliterated words published by the Royal Institute and compare the transliteration regulation of the Royal Institute with the collected data. Furthermore, an English-Thai transliteration program based on transliteratedword corpus of the Royal Institute was developed in order to generate tables of English-Thai transliteration rules for computers. The transliterated-word corpus is composed of 10,060 pairs of English and transliterated Thai words published by the Royal Institute. The result shows that the transliteration regulation of the Royal Institute conforms with the collected data in the corpus as follows: The transliteration rules for vowels have 92.68% accordance, the transliteration rules for initial consonants have 97.35% accordance and the transliteration rules for last consonants have 97.34% accordance. When the developed program was trained by the rules generated from 80% of the corpus, the result of testing on 20% remainder shows 39.53% accuracy in word level and 79.8% accuracy in alphabetical level. This suggests that the transliteration program yields quite a poor result due to considerable reasons, for instance syllable boundaries and phonetic transcriptions were not considered including various versions of transliterated words published by the Royal Institute collected in the corpus. It is also found that a number of transliteration rules are not yet included in the Royal Institute's table of transliteration.
Table of contents
Description
Sponsorship
Degree Name
อักษรศาสตรมหาบัณฑิต
Degree Level
ปริญญาโท
Degree Department
คณะอักษรศาสตร์
Degree Discipline
Degree Grantor(s)
จุฬาลงกรณ์มหาวิทยาลัย