一种汉字女书字符转换系统
作者:刘赛
来源:《软件导刊》2011年第11
        要:针对目前国内少数民族文字女书信息化处理不便的问题,设计了输入汉字然后将其直接转换为女书的系统。该系统使得用户能够实现女书的快速输入,并提供女书文本导出、Unicode编码查询等功能,经过实验证明该系统有效地提高了女书的输入效率。
        关键词:女书;编码;转换系统 
        中图分类号:TP391.41 文献标识码:A 文章编号:1672-78002011011-0165-02 
       
        引言
        “女书又叫做女字,是世界上唯一的女性文字,它起源和主要流行的地域是中国南部的湖南省永州市江永县上江圩镇,所以又叫做江永女书。现在,女书的使用者已经极为稀少,
女书资料和文献的保护刻不容缓。对于女书文字的输入法,国内已有拼音输入法和部首输入法。这两种方法解决了女书字符的输入问题,但也存在着不足。这两种方法要求使用者熟悉女书文字的发音或者部首结构,对于大多数人而言,这是很困难的。因此,需要一种快捷方便的女书信息化方法。本文从一般人的使用习惯出发,设计一种汉字女书字符转换系统,用户输入汉字词句,系统自动将其转换为相应的女书。这样,方便了女书文字的信息化处理,高效地完成女书的录入、导出、Unicode编码查询、映射维护等相关工作。
        1 汉字女书字符转换系统设计思路
        目前,国内的濒危语言比如纳西文的输入法采取的是通过某种途径获得用户输入的字符编码,不论是拼音输入还是部首输入或者其他的输入方法。这种方法是直接的,通过键盘输入得到的,对使用者的要求很高,要求具有相关语言的背景知识。同样类似的还有西夏文输入法。这就大大制约了这些语言信息化工作的效率。如果采用一种间接的方法,可以有效地避免上述问题。本文所设计的汉字女书字符转换系统的核心是避开输入音码或者形码,用户直接输入中文,依据中文字符的Unicode编码将其映射为对应女书字符的Unicode编码,再显示出女书字符。
        本文首先给出系统设计,接着给出关键模块的设计,最后是系统实验及结论。
        2 系统设计
        考虑到今后将系统移植到手机平台,系统采用java设计。系统的功能主要功能模块有:系统登录;汉字文本文件导入,节省手动输入的时间;女书文本文件导出,方便女书的保存;汉字到女书的转换,核心功能;汉字Unicode编码查询,查询汉字的十进制和十六进制编码;女书Unicode编码查询,查询女书的十进制和十六进制编码;编码映射查询,查询汉字和女书的对应关系;映射维护,添加新的编码映射。
        系统结构图如图1所示。
       
        1 系统结构图
        关键模块的算法流程设计。系统涉及到女书文本导出、字符转换、编码查询、映射维护等关键模块。下面依次给出各个模块的算法流程。
        女书文本导出算法流程:
        1)打开文件对话框;
        2)获取用户选择的路径和输入的文件名,设置相应数据结构;
        3if (文件名不为空)
        {设置缓冲输出对象;
        从女书输出框中获取女书文本;
        设置传输长度;
        写入文件。
       
        接下来给出字符转换算法流程:
        1)从汉字输入框中取得待转换汉字的Unicode编码。
        2)加载数据库驱动,获取数据库连接。
        3)设置SQL查询语句。
        4)查询数据库。
        5if (在数据库中到对应关系)
        {返回结果并显示在女书输出框中;
       
        else 
        {显示未能识别汉字;
        }
        编码查询算法流程:
        1)提取字符源,去除大小写字母和空格。
        2)定义显示用表的模版。
        3while (处理后的字符源的每个字符) do
        {调用子函数计算字符的十进制Unicode编码和十六进制Unicode编码;
        往列表添加一行记录用于显示;
       
        映射维护算法流程:unicode字符转中文
        1)提取汉字字符源。
        2)计算汉字的Unicode编码。
        3)加载数据库驱动,获取数据库连接。
        4)设置SQL插入语句。
        5)执行插入语句,将汉字Unicode编码和对应的女书Unicode编码的映射关系写入数据库。
        3 系统实验
        3.1 实验介绍
        考虑到平台无关性,系统用java设计,并将数据库和女书字库联合打包。
        3.2 运行结果
        下面给出程序的部分运行界面,女书文件导出结果如图2所示。
        汉字到女书转换如图3所示。
       
        汉字Unicode编码查询如图4所示。
       
        女书Unicode编码查询如图5所示。
       
        4 结束语
        本文提供了一种汉字女书字符转换系统,这是在女书信息化过程中的工作。本文针对传统文字信息化软件的问题,特别是女书的拼音输入法和部首输入法的使用非常不便的问题,提出了一种新的方法,该方法输入汉字,转换得到女书,使用更为便捷。同时,该系统还提供了汉字导入、女书导出、编码查询、映射维护等其他功能,具有很强的实用性。
        参考文献:
        1 田微,王江晴,朱宗晓,等.女书计算机键盘布局与输入法的研究[J.中文信息学报,2010(5).
        2 郭海,赵晶莹.纳西图形文图元输入法[J.计算机工程,2010(4).
        3 柳长青,史伟,杜建录.西夏文四角号码输人法研究[J.宁夏大学学报:自然科学
,2010(4).
        (责任编辑:周晓辉)