admin管理员组文章数量:1568433
2024年3月26日发(作者:)
新华字典笔画查字改造部首查字法 实
现直接翻页查字
2011年最给力的时装搭配.
2010年01月14日
改造部首查字法,实现直接翻页查字
刘春华
自《说文解字》以来,部首查字法已成为汉语字典的主要检索方法,即使按
音序编排的汉语字典,也大多要附部首查字法。但是,部首法的低效、繁难又一
直倍受责难。既然还没有找到更好的方法来替代部首法,我们不妨对它进行适当
改造,以实现直接翻页查字。
先来看一下部首法查字的全过程:
①确定汉字部首;
②数部首的笔画数;
③根据部首笔画数,在部首表中查到该部首在检字表中的页码;
④翻到检字表的相应页码;
⑤数目标字的"余部"(汉字除部首外的剩余部分)的笔画数;
⑥在检字表中查到目标字在字典正文的页码;
⑦翻到字典正文的相应页码查到目标字。
查字过程真是"一步三回头",没法不令人气馁!最癌症病例让人望而生畏的
是要数两次笔画,其次是要查两次页码翻两次页。
仔细分析一下,查字过程虽然非常繁琐,但涉及到的汉字特征实际上只有部
首和笔画数(包括部首和"余部"的笔画数)。第一次数笔画和翻页是针对部首,第
二次则是针对"余部"。也就是说,部首查字法的实质是用汉字的部首和"余部"特
征来确定汉字的排序位置。我们不喜欢数笔画,就用部首的首笔代替部首的笔画
数,用"余部"首笔和末笔代替"余部"的笔画数,这样我们就用4个特征来"定位"
一个汉字:部首首笔、部首、"余部"首笔、"余部"末笔;每一个特征,再用一个
字母来代表,就形成了4个字母的编码;将它用于汉语字典的排(序)检(索),就
可实现直接翻页查字。
事情就这么简单。
事情没这么简单。
关键是如何用字母来代表所述的汉字特征。
一个汉字提取4个特征,实际上只涉及汉字的两类特缘来网征:部首和笔画。
对照一下,传统的部首查字法也涉及两类汉字特征:部首和笔画数。
部首和笔画与字母的对应关系是成败的关键。由于基本笔画的种类较少,因
此最关键的是部首与字母的对应关系。
1.笔画
采用横、竖、撇、点(捺)、折五种基本笔画。为了离散重码,根据是否与其
它笔画相交,将横画对应两个字母。为叙述方便,两种横画分别称为相交横和非
交横。
笔画与字母的对应:相交横a,非交横e,竖i,撇o,点(捺)u,折v。我们注
意到,按字母排序,也正好是横、竖、撇、点(捺)、折(横画虽然对应两个字母,
但仍然全部排在其它笔画的前面),这当然不是巧合。
2.部首
采用《汉字统一部首表(草案)》规定的201部部首。
部首包括成字部首和非成字部首,其与字母的对应关系如下:
(1)成字部首一律采用拼音首字母。例如:寸c、长c、刀d、斤j、舌s、
舟z,还有:髟b、缶f、酉y、聿y、豸z、隹z、艮g、鬲g、厶s、殳s、豕s、
臼j、耒l、黾m、疋p、毋w、兀w、龠y、黍s,等等。
(2)非成字部首采用三种方式安排与字母的对应关系。
①大部分非成字部首采用其习惯名称关键字的拼音首字母,例如:宀b、疒
b、刂d、阝e、钅j、犭q、彳r、罒s、饣s、礻s、攵w、衤y,爫z,等等。
②3个非成字部首作形似安排,其中两个与字母相似:匚c、凵u,一个与成
字部首相似:屮j("屮"与"巾"相似)。
③11个常用的非成字部首采用指定字母:忄(
f、灬h、氵i、扌u、o、冫q、辶[辵]v
)n、亻l、艹p、讠a、纟
上述11个指定字母的非成字部首需要重点记忆。下面的顺口溜可能有助于
记忆:
顺口溜解释
竖心女,单人恋忄(竖心)--n(女);亻(单人)--l(恋)
草头偏爱言字边艹(草头)--p(偏);讠(言字边)--a(爱)
竹头o,走之v(竹头)--o;辶(走之)--v
提手u键两点牵扌(提手)--u;冫(两点)--q(牵)
风吹绞丝四点火纟(绞丝)--f(风);灬(四点)--h(火)
三点水落一条线氵(三点水)--i(一条线)
有了上述笔画和部首与字母的对应关系,很容易实施编码。
但,还有改进的余地。
我们注意到,大部分汉字的"余部"末笔部位也属于部首结构,例如"愉"的末
笔部位是"刂","寨"的末笔部位是"木"。如果用部首结构代替末笔,由于部首对
应的字母种类数是笔画的好几倍,可以大幅度减少重码。当然,也有一些字的"余
部"末笔部位不属于部首结构,例如"壤、拖"等,它们就仍然采用末笔。
现在可以总结编码规则了:先依次取部首首笔、部首、"余部"首笔,最后在
"余部"末笔部位取末笔部位码(简称"末位码"),如果末笔部位有部首结构,取部
首,否则取末笔。
编码举例:
输-acod部首首笔相交横a、部首车c、余部(俞)首笔撇o、余部末位码
d(刂)。
施-ufov部首首笔点u、部首方f、余部首笔撇o、末笔折v(余部末笔所在
部位不属于部首结构)。
権-amoe部首首笔相交横a、部首木m、余部首笔撇o、末笔非交横e(余部
末笔部位不属于部首结构)。
如果是部首字,依次取字的前三笔和末笔。举例:
鱼-ovie首笔撇o、次笔折v、三笔竖i、末笔非交横e。
有一点很重要:不需要拆分汉字!
部首查字法本来就没有"汉字拆分"一说。
另外,它还在相当程度上保留了部首法对汉字按部首分类排序的特点:在部
首之前先取部首首笔,使得按码序排列的汉字具有良好的排序效果,所有汉字均
按部首首笔分类、大部分汉字按部首分类排序,其中讠、氵、口、亻、忄、、
艹、扌、辶、攵、禾、女等所含字量大的部首项下的全部汉字按部首"清一色"
排序。
重码情况:gb2312-80字符集6763字范围的静态重码比例为39.23%。一般
辞书(例如《新华字典》和《现代汉语词典》)单字字头一万多个,重码率还会升
高一些,但不会影响字典的直接翻页查字,因为字典并非"一页一字",而且打开字
典,我们一次看到的是两页!对于收字量大的大型辞书,可以在余部首笔和末位
码之间增加一码,取余部次笔,这样可以大幅度降低重码,满足大型辞书直接翻页
查字的要求。重码汉字的精确排序可以沿用笔序法。
既然已经将部首查字法改造成了汉字编码,为什么不同时用于汉字输入呢?
作为一种不拆分汉字的形码,简单易学,又符合文字规范,用于输入汉字非常
方便,但它不能作为"主力"输入法,因为重码偏多。
我们将第一码"部首首笔"换成"汉字首音(拼音首字母)"就构成了音形码。
由于"汉字首音"的种类比"部首首笔"多好几倍,音形码的重码率大幅度降低,在
gb2312-80字符集3755一级字范围的静态重码比例为6.36%。再引入超大词库
的词码和简码,音形码可以担当"主力"输入法,满足专业录入员的输入速度要求。
上述形码和音形码都属于"三合一汉字编码及键盘输入法"(简称"三合一")
的成员,此外,三合一中还包括音码(全拼)和笔画码。三合一集音码、形码、音
形码于一体,不需要切换,可随机使用各种方式输入汉字:常用字、词可用音形
码输入;不认识的字可用形码输入;编码困难的字可用拼音或笔画输入。
形码是理想的字典查字法,但用于汉字输入时只能作为辅助输入方式,主要
用于输入不常用字(可应用于大汉字集直至全汉字集)。三合一作为输入法,已超
出本文范围,宜另文讨论。
最后一个问题:汉字部首的确定。由于汉字部首的确定方法尚未统一,"三
合一"暂且采用李行健先生主编的《学生规范字典》、《中学生规范词典》和
《现代汉语规范词典》三部辞书的部首检字表的方法确定汉字部首。希望尽快
出台国家标准的汉字部首规范
历史上的今天:
爱迪生简介.托马斯·阿尔瓦·爱迪生简介2011-04-06在线新华字典全省
中考确定提前十天2011-04-06
版权声明:本文标题:新华字典笔画查字改造部首查字法实现直接翻页查字 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://www.elefans.com/dianzi/1711386673a307147.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论