移动终端汉语拼音输入法及本地搜索接口实现技术 第2页
第一章 引言
1.1 输入法开发的背景介绍
1.1.1 课题背景
中国已经成为拥有世界上最大的手机市场。在手机用户数得到快速增长的同时,而手机终端的功能也从最早的单一语音通话,逐步发展到手机短信,订阅资讯,手机上网,玩手机游戏,下载各种软件等各种多样化的服务。与移动业务的飞速发展相比,手机输入法的研究进程则略显缓慢。目前手机上使用数字键盘的传统中文输入法如,及字能输入法等,还都是以单字的方式进行输入,这极大地限制了中文输入的速度。因此,研究针对手机的智能中文输入也显得越来越有实际意义。目前,市场上己经出现了一些针对智能手机开发的第三方汉字输入法。这类输入法在手机中实现了词语输入甚至语句级的中文输入,并提供了简单的自学习功能,大大加快了手机输入速度。但在策略上,这类输入法还是根据候选字词的一元频率来调整字词的出现顺序。而目前在桌面中已经广泛使用的智能中文输入技术,由于其大量的数据需求,还未能在手机中得到有效应用。为了充分挖掘智能手机的强大处理功能,有必要开发基于手机平台的智能中文输入法。
1.2.1 输入法发展历史及现状本文源自优文论文网
计算机中文输入法随着计算机硬件的发展而不断更新换代,曾出现“万码奔腾”的局面。一般把中文输入法的发展分为四代:
第一代:字输入。自从intel286 电脑在我国企业单位普及开始,汉字的输入问题就成了一个难题,当时人们认为计算机的输入是比较高深的一门学问,用最笨拙的电报码,拼音进行逐字的输入,是一件很费时间的事情,输入速度比手写慢的多,除非是严肃的文件才使用计算机的铅字形式。1976 年,台湾人朱邦复创制一种称为 “形意检字法”的中文输入法,用以解决电脑处理汉字的问题,包括输入输出。1978 年,该输入法被蒋纬国重新定名为“仓颉输入法”。仓颉输入法是一种字形输入法,根据“由上而下,由左而右,由外而内”等原则分拆字型结构,再以字码拼出。1978-1983 年,王永民经过五年的研究发明了 “五笔字型”(简称王码),综合多学科研究成果的基础上提出“形码设计三原理”和“汉字字根周期表”,发明了 25 键 4 码高效汉字输入法和字词兼容技术,获美、英、中三国专利。该输入法在当时是一种最好的并且最有效果的输入方式,甚至人们认为是计算机汉语输入的顶峰。但是这个输入法有个缺点,就是要记忆,要培训,不经过长时间的练习是不能高效输入的,一般人很难掌握,这就给很多非专业打字人员带来了很大的不便。为了更多的人能输入汉字,因此拼音输入法被发明了。汉语是一种语言,既然是一种语言就有一定的发音规律。有一定的音素,任何人在讲话的时候总是直接发音的,没有先考虑如何写,这一点任何语言都是一样的,因此,拼音输入法有他先天的优势,简单易学,很快普及开来。但拼音输入法重码率太高,输入速度较慢。因此又产生了一种音形码,该类编码兼顾音码和形码各自的特点,但既需要知道发音,又需要分解形,使用不便捷,没大范围推广。
第二代:词输入。二十世纪九十年代初,人们就开始研究词输入。1997 年,国家语委会主任许嘉璐曾指出:“目前,中文信息处理虽然已实现了‘字处理’,但这只是信息处理的初级阶段。要实现计算机中文信息的高速处理,….就必须超越‘字处理’阶段。汉字输入法正式转入以词为主的时代。1998 年 2 月王永民发明了“98 规范王码”,可以输入词,成语和常见术语,是字形词输入里最好的输入法。拼音的词输入发展也很快,出现了很多词输入的输入法,而且有些输入法还增加联想功能,极大的提高了输入效率。
第三代:句输入。语句级汉字输入技术是以短语或句子为基本输入单位,它具有如下优点:采用自然的拼音输入方式,简单易学;采用拼音流自动切分技术,可以连续输入拼音流,无需用户人工分词;根据上下文信息对候选同音字词自动消歧处理,无需用户频繁干预。从理论上讲,语句级汉字输入法有两点明显优于字词级汉字输入法:从操作心理学上看,用户倾向于按有一定意义的短语或句子为单位进行短时记忆、持续输入;从信息论角度毕业论文
http://www.Lwfree.cn/特征以及重码率的高低,不需用户分词,用户可以把主要精力放在输入内容上,脑力劳动强度远比字词级输入法低。依靠人工智能,语句输入法虽然可以基于上下文进行重码选择,但音字转换的准确率不高,句内修改频繁,导致输入速度不理想。而且短的拼音输入重码率还是比较高,只有过长的拼音输入才能取得好的重码选择效果,但长的拼音输入出错的几率更大,一旦输错就要回退修订,极大的降低了输入效率。它的自学习能力也只能根据输入的一个拼音串检索曾经利用该拼音串输入过句子,而不能从正在输入的语句中学习,使语句的学习受到很大的限制。另外,语句输入法需要较高配置的计算机或比较高端的嵌入式设备,像智能狂拼输入法语料库就达 100 多兆。人工智能的发展现状决定了语句级汉字输入技术近几年不会有大的突破。
第四代:语音输入和手写输入。输入方法向非键盘输入方向发展,将追求汉字输入的最高速度。如 IBM 等硬软件厂商推出的汉语语音识别系统和手写板输入,将人员朗读的语音或书写的文字录入计算机,转换为文本文件,既方便又快捷,是中文输入的发展方向。但目前手写输入只能识别部分草书,不能连续书写,不能写词语,更不能输写句子了。而且手写输入的识别率不是很高,一般都需要从候选字中选字,输入效率不是很高。而语音识别现在正处于初级阶段,即使对标准的普通话的识别也不是很高。而且汉字的同音字很多,这就需要根据语境识别是哪一个汉字。而且很多语音是没有语境的,如人名,地名,非常用词等。这些都决定了语音输入需要较长时间的研究才能达到实用水平。
1.2 手机操作系统的介绍
目前主流的手机操作系统主要有以下四种:Symbian公司的Symbian OS,微软的Windows Mobile,Palm以及Linux等。
图1-1 手机操作系统市场占有率
图1-1显示出目前手机操作系统中Symbian OS占了63.2%,Windows Mobile占了5.4%,Linux占了30.3%,Palm占了0.7%。显然SymbianOS在市场上占有率最高,其次是Linux。本次设计基于Symbian OS操作系统。
1.2.1 Symbian开放式操作系统
Symbian操作系统提供了灵活的应用界面(UI)框架,不但使开发者得以快速掌握必要的技术,同时还使手机制造商能够推出不同界面的产品。Symbian系统手机可以采用多种应用界面形式:一类在设计上很类似当前最常见的手机,即主要通过键盘进行输入的手机;另一类是使用手写笔进行操作;还有一类是既有键盘又有触摸屏的手机,它具有较大的屏幕和较小的键盘。不同的输入方式和外观设计会对各款手机的主要用途产生很大的影响。应用界面在要求上是由手机本文源自优文论文网和市场决定的。有了Symbian操作系统,手机制造商和第三方开发者就可以为上述各类手机开发出独具特色的应用界面,例如:
(1) 采用数字键盘的手机(Symbian s60) 此类手机需要灵活的应用界面,方便用户使用导航键(Joystick)、软按键或转点通键(Jogdial)操作,诺基亚3650和N-Gage也就是代表他们采用了Series 60应用界面。如诺基亚 6600;诺基亚 7610; 诺基亚 6670等;
(2) 采用触摸式屏幕的手机(Symbian UIQ)
这类毕业论文
http://www.Lwfree.cn/体功能的手机。
上一页 [1] [2] [3] [4] [5] [6] [7] 下一页
移动终端汉语拼音输入法及本地搜索接口实现技术 第2页下载如图片无法显示或论文不完整,请联系qq752018766