五笔字型拆字规则
1、汉字的基本笔划与字型结构
汉字是一种拼形文字,它们是由一些构字的基本单位按照一定的规律组合构成的相对独立的结构。五笔字型将这些构成汉字的基本单位称为字根。
(1)汉字的基本笔划
将汉字的笔划分为五类:横、竖、撇、捺、折。为了便于记忆,依次用1、2、3、4、5作为代号。在汉字的具体形态结构中产生某些变形的笔划,作了如下特别的规定:
① 提笔“ˊ”视为横“一”。如:“扌”、“现”中的提笔为横。
② 点笔“丶”视为捺“乀”。如:“寸”、“雨”中的点为捺。
③ 左竖钩为竖。如:“判”字的末笔划应属于竖。
④ 转折均为折,即带转折、拐弯的笔划,都属于折。
2)汉字的基本字根
① 字根的键盘布局根据基本字根的起笔的笔划,将字根分为五类,同一起笔的一类安排在键盘相连的区域,对应键盘上五个“区”:1区——横区,2区——竖区,3区——撇区,4区——捺区,5区——折区;每类又分五组,对应键盘上五个“位”,共25位,可用其区位号11、12、13、……53、54、55来表示,它们分布在键盘的A~V共25个键位上,每个键位上取一个字根作为其键名字根。
② 五笔字型字根的键位特征
a.字根首笔笔划代号和所在的区号一致。
b.相当一部分字根的第二笔代号与其“位号”保持一致。
c.同一键位上的字根形态相近或有渊源。
d.部分字根的笔划数目与位号一致。如“三” 另外,部分字根的键盘安排不符合上述几条原则,对这类字根的记忆一方面要借字根助记词来加以记忆,另一方面要特别用心去记住它,如:“丁、力、心、车、乃、匕、巴、马”等字。
③ 字根助记词
G:王旁青头兼(戈)五一;F:土士二干十寸雨;D:大犬三羊古石厂;S:木丁西;A:工弋草头右框七。
H:目具上止卜虎皮;J:日早两竖与虫依;K:口与川,字根稀;L:田甲方框四车力;M:山由贝,下框几骨头。
T:禾竹一撇双人立,反文条头在三一;R:白手看头提手斤;E:月彡(衫)乃用家衣低;W:人和八,三四里;Q:金勺缺点无尾鱼,犬旁留叉儿一点夕氏无七(妻)。
Y:言文方广在四一,高头一捺谁人去;U:立辛两点六门疒;I:水旁兴头小倒立;O:火业头,四点米;P:之字宝盖建道低,摘礻(示)衤(衣)。
N:已半巳满不出己,左框折尸心和羽;B:子耳了也框向上;V:女刀九臼山朝西;C:又巴马,丢矢矣;X:慈母无心弓和匕,幼无力。
(3)汉字字根之间的位置关系
汉字是由字根组成的,基本字根在组成汉字时,按照它们之间的位置关系可以分成单、散、连、交四种类型。分析汉字的字型结构是为正确确定汉字的字型。
单:字根本身就单独构成一个汉字。如:由、雨、竹、车、斤等。
散:构成汉字不止一个字根,且字根间保持一定距离,不连也不交。如:“讲、肥、昌、张、吴”等。
连:五笔字型中字根相连不同于常规意义上的相连,特指以下两种情况:
1. 单笔划与某基本字根相连 如:自(丿连目)、且(月连一)、尺(尸连丶)、下(一连卜)等。
2. 带点结构 如:勺、术、太、主、义、头、斗等。
另外:五笔字型中并不认为以下字字根相连。如:足、充、首、左、页等;单笔划与基本字根间有明显距离者不认为相连。如:旦、个、少、么。
交:指两个或多个字根交叉重叠构成汉字。 如:申(日交丨)、里(日交土)、夷(一、弓人相交)等。
(4)汉字的三种字型
五笔字型编码是把汉字拆分为字根,而字根又按一定的规律组成汉字,这种组字规律就称为汉字的字型。汉字的字型分为三种:左右型、上下型、杂合型。这三、种字型的代号分别是1、2、3:
1:左右,如:汉、湘、结、封,字根之间可有间距,总体左右排列;
2:上下,如:字、莫、花、华,字根之间可有间距,总体上下排列;
3:合,如:困、凶、本、天、字根之间不分上下左右浑然一体;
在五笔字型输入法中,对一些特殊汉字的字形作了如下规定:
1. 字根间是内外型的字型视为杂合型。如:团、同、这、边、困、匝等汉字;
2.字根间是包围与半包围的关系的字型为杂合型。如:匡、床、巨、冈、屑 等,但“见”为上下型。
3.字根间位置关系为“连”的字型属于杂合型,如:自、千、尺、勺、斗、头等。
4.字根交叉重叠构成的汉字字型为杂合型。如:申、里、半、东、串、冉等。 下含“辶、廴”的字型为杂合型:如:迕、运、迈、迤、迅、退等。
(5)汉字分解为字根的拆分原则
① 取大优先:保证每次拆出最大的基本字根,即以拆出的字根数量最少的那种拆法优先。 如:“舌”拆分为“丿、古”,而不是拆分为“丿、十、口”。
② 兼顾直观:如果拆得的字根有较好的直观性,就便于联想记忆,给输入带来方便。 如:“自”拆成“丿、目”,“生”拆成“丿、王”
③ 能散不连:在拆出的字根数相同的情况下,按“散”的拆法比按“连”的拆分优先。 如:“午”应按“散”拆成“厂、十”,而不按“连”拆成“丿、干”。
⑤ 能连不交:在拆出的字根数同的情况下,按“连”的拆分比按“交”的拆分优先。 如:“天”应按“连”拆成“一、大”,而不按“交”拆成“二、人”。 “丑”应按“连”拆成“乙、土”,而不按“交”拆成“刀、二”。
在拆分中还应注意,一个笔划不能割断在两个字根里。如:“果”不能拆为“田、木”而应拆为“日、木”。
2、五笔字型的拆字规则
五笔字型单字编码规则,要求单字的五笔字型编码口诀是:五笔字型均直观,依照笔顺把码编;键名汉字打四下,基本字根请照搬;一二三末取四码,顺序拆分大优先;不足四码要注意,交叉识别补后边。
注意:五笔字型的编码最多取四个,且都用小写字母。
(1)键名汉字的五笔输入规则
在五笔字型的键盘图中,各字根键位左上角的第一个字叫键名字,共有25个: 王土大木工,目日口田山,禾白月人金,言立水火之,已子女又纟
键名汉字的输入方法:连击四下键名所在的键,如:大:DDDD 口:KKKK 金:QQQQ 女:VVVV
(2)成字字根汉字的输入规则在130个基本字根中,除键名字根外,本身就是汉字的字根,称为成字字根。成字字根汉字的输入规则为: 键名码(报户口)+首笔划代码+次笔划代码+末笔划代码 当要输入一个成字字根时,首先把它所在的那个键打一下(俗称“报户口”),然后再依次打它的首笔划码、次笔划码、末笔划码。
注意:各个笔划代码一定是指单笔划,而不是字根,只能在“G、(横)H、(竖)T、(撇)Y、(捺)N(折)”范围内取码;如果成字字根只有两个笔划,即只能取出三个编码,则第四码以空格键结束。如: 贝:MHNY 车:LGNH 小:IHTY 戋:GGGT 马:CNNG 十:FGH 在五笔字型汉字编码中,横、竖、撇、捺、折五种单笔作为成字字根的特例,增加了两个“后缀”L码,其编码如下: 一:GGLL 丨:HHLL 丿:TTLL 丶:YYLL 乙:NNLL 键名汉字和成字字根汉字合称键面字。
(3)键外字的输入规则
① 含有四个及四个以上字根的汉字的输入,其编码输入规则为:第一字根码+第二字根码+第三字根码+末字根码 如:缩:纟宀 亻XPWJ 型:一 艹 刂 土 GAJF
②不足四个字根的汉字的输入,当构成汉字的字根中只有二个字根或三个字根时,若按以上规则输入,就会造成许多重码。如:“叭”与“只”对不足四个字根的汉字取码,应再加上一个补充代码,即:末笔字型交叉识别码。
末笔字型交叉识别码由汉字的末笔划代号和汉字的字型代号组成,共有两位数字。可以看成是一个键的区位码:第一位是区号,等于末笔划代号;第二位是位号,等于字型代号。
末笔字型交叉识别码
利用识别码进行汉字的输入
三个字根的汉字编码输入规则为:
第一字根码+第二字根码+第三字根码+末笔字型交叉识别码
两个字根的汉字编码输入规则为: 第一字根码+第二字根码+末笔字型交叉识别码+空格 例如:绣:XTEN 告:TFKF 码:DCG 气:RNB 乡:XT 青:GEF 仅:HHU 卡:WCYE 召: VKF 飞:NUI
关于单字末笔划的规定 在判断汉字的末笔字型时,要注意以下几点:
1.末字根为“力、刀、九、匕、乃”等时,一律认为末笔划为折。
2.包围型汉字中,取被包围部分的末笔作为整个字的末笔。
3.下含“辶、廴”的汉字,以去掉“辶、廴”后的末笔为整个字的末笔。
4.“弋、戈、我、成”等字取撇“丿”为末笔。
(4)Z 键的使用
Z 键称为“万能学习键”。可以通过z键提供帮助,一切未知的编码都可以用 Z 键来表示。它有两个主要的作用:
1.代替未知的识别码。
2.代替模糊不清或分解不准的字根。
(5)重码的处理
五笔字型输入输入法优点之一是重码少,但仍然有部分汉字具有相同的编码,这些字称为重码字。如:衣和。重码字在屏幕上是编号显示的,用户只要用主键盘最上的数码键选择所需的汉字即可。
(6)五笔字型简码输入规则 为了提高录入速度,五笔字型编码方案还将大量常用汉字的编码进行简化。
① 一级简码
根据每一键位上的字根形态特征,在五个区的25个位上,每键安排一个使用频度最高汉字,称为一级简码,即表2.4中的25个高频字。
一级简码的输入规则为:简码键+空格。 如:地:F 要:S 发:V 以:C
② 二级简码
五笔字型将汉字频率表中排在前面的常用字定为二级简码汉字,共589个。
二级简码的输入规则为:汉字前两码+空格 如:牙:AH 克:DQ 用:ET 械SA: 事:GK 曲:MA
③ 三级简码
三级简码由单字的前三个字根码组成,共计4000多个。
三级简码的输入规则为:汉字的前三码+空格 如:贯:XFM 非:DJD 写:PGN 乌:QNG 卵:QYT 在五笔字型输入法中,简明码占常用汉字的绝大多数,若能利用好简码,就能大大提高输入速度。
有时,同一个汉字可能有几种简码。在这种情况下,应尽量选最简捷的方法。 例如:“经”字就有以个四种输入编码: 一级简码:X 二级简码:XC 三级简码:XCA 全码:XCAG
3、五笔字型词组输入规则
为了进一小提高汉字输入速度,五笔字型采用了更加优化的输入方法——词组输入。
(1)二字词输入
输入规则:每字取其全码的前两码。例如:单独:UJQY 键盘:QVTE 速度:GKYA 经常:XCIP 注意:“键名汉字”“成字字根汉字”或“一级简码”参加组词时,应从其全码中取码(以下同)。
(2)三字词的输入
输入规则:前两个字取其第一码,最后一字取其前两码。例如:实际上:PBHH 出版社: BTPY 打印机:RQSM
(3)四字词的输入
输入规则:每个字各取第一码。例如:集成电路:WDJK 想方设法:SYYI 满腔热情:IERN
(4)多字词输入
输入规则:取第一、二、三、末字的第一码。例如:中国人民解放军:KLWP 中华人民共和国:KWWL