实现汉字形体排序唯一性规则

来源 :汉字文化 | 被引量 : 0次 | 上传用户:younger666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  一
  
  字序问题看似简单,可真要做到字有定序,还不那么容易。汉字做到定量、定形、定音之后,还有需要时如何排列顺序的问题。
  字序是指日常社会生活和科学技术应用中,给若干相互之间没有一般意义关系的汉字,按字形特征排列出的自然前后顺序。现实生活中常见依汉字的某种规则排序,却时有错乱的现象。社会需要一种可以实现汉字排序唯一性的规则。
  给汉字排序,有音序和形序两种。平时不大用义序,虽然《说文解字》在每一部内大致以先名词,后形容词,再动词的方式排列,如心部:情性志意(名词类)……慎忠愨愷(形容词)……惟懷惀想(动词)……。不过,这跟现代的“序列”概念没有太多的关系,也从未见用于排序。倒是有以《千字文》“天地玄黄,宇宙洪荒……”用做计数某些事物序列的,因为《千字文》所收1000个字互不重复。至于《康熙字典》,一部之内笔画数相同的若干个字似乎是随意排列的,不讲究顺序。概言之:旧式字典不能为字序研究提供多少可资借鉴之处。
  近代的音序是按注音符号ㄅㄆㄇㄈ……(这是汉语的音序,a,b,c,d……应当说是字母序)如《国语辞典》(1936):巴芭笆疤豝羓八(入声在舒声之后)……拔跋胈茇魃鼥(阳平无舒声字)……把靶……爸霸灞壩欛……玻波菠撥鱍……。体现的规则是,同偏旁的字排在一起。《新华字典》直到1998年修订本,一直保持这一做法。现在则一般采用汉语拼音字母顺序:阿哀安昂熬……八巴扒……。但是有一部分音节(即使加以声调区别)有同音字,有的音节同音字还不少,如读jī音的“击叽饥机矶积基激……”。也就是说,音序只能把同音汉字划分为若干组,做不到唯一性。
  现在通常所说的音序,是指汉语拼音字母顺序,即ɑ,b,c,d……。按音序排列,还有个是字母本位,还是汉字本位的问题。通常用的是汉字本位,因为人们是在排列汉字。比如“拉扯、拉杂、喇叭、蜡版、辣子、来宾、牢狱、老子”等8个词,是按汉字本位排列,声韵相同的字,按声调排列,同声调的字,又按笔画多少排列;如果按字母本位,则要排成“喇叭(lǎbɑ)、蜡版(làbǎn)、拉扯(lāchě)、来宾(láibīn)、牢狱(láoyù)、老子(lǎozi)、拉杂(lāzá)、辣子(làzi)”。按字母本位不能再顾及声调。这对于不用汉字排列汉语词语是比较方便的,如《汉语拼音〈中华人民共和国地图〉地名索引》就是这样,因为其中的非汉语地名是按少数民族语言用汉语拼音字母拼写的,如西藏拉萨拼作Lhasa,林芝拼作Nyingchi,呼和浩特拼作Huhhot,白云鄂博拼作Bayan Obo,方便与拉丁字母世界进行文字交流。
  四角号码取汉字的外表特征,但同一个数字下往往有好几个字,即使加上第五位附号,也还有同码字,如1999年版《辞海》的四角号码索引,0011下共有52个字,附号2下有“症、痄、痱、疮”等18个字,显然不适合用以严格的排序。
  
  二
  
  在汉字定形的情况下,据形排序比按音排序容易做到唯一性。优点是直观,也就是具有客观性,不受方言影响。现在,楷体、宋体、仿宋等等不同字体之间有些细微的差别,如仿宋体“己(jǐ)”就有点像宋体的“已(yǐ)”。可以规定以宋体为准。
  国家语言工作委员会标准化工作委员会编《现代汉语通用字笔顺规范》(语文出版社,1997)为7000个汉字列出的笔顺规范就是形序规范,但是它没有做到唯一性,因为缺少相应的规则。7000个汉字,有210组同码字,涉及461个字,也就是有251个重码字。原因是在横、竖、撇、点、折之下没有进一步区分同笔形的规则。例如“十丁”都是横、竖,体现的是先长后短,或先正体后变体;“儿九匕几”都是撇、折,体现的是相离—相交—相接—相接;“已巳己弓”都是折、横、折,体现的是先单折后复折,全封口的“巳”处于半开口的“已”和全开口的“己”中间;“么久勺丸夕凡及”都是撇、折、点,“么”的第一、二笔的关系是相离,“久勺”的第一、二笔的关系是相接,当中“丸”的第一、二笔的关系是相交,后三字的第一、二笔也是相接;“呙呐呗员”都是竖、折、横、竖、折、撇、点,“呙员”是上下结构,中间的“呐呗”是左右结构;“果味杲”都是竖、折、横、横、横、竖、撇、点,左右结构的“味”插在上下结构的“果杲”中间;等等。同一偏旁在不同的字组中前后位置不固定。如七画的“扯址/圻折/扳坂”,八画“垅拢/抨坪/垃拉”,等等。
  这里提出区分相同笔形的若干规则,以便实现汉字排序的唯一性,为笔顺规范成为国家标准提供条件。
  寻求汉字排列的唯一性,似乎只能依靠字形。汉字笔画规则性很强,却又变化多端。这一特点为寻求字序排列的唯一性提供了可能。
  汉字字形为排序可供利用的手段有笔形、笔画、笔顺。
  汉字字形特征利用方面,以笔画多少作为第一层面。第二层面是笔顺。关于笔顺,早年流行点、横、竖、撇、折顺序,最近三四十年趋于采用横、竖、撇、点、折顺序,现在许多字典、词典的检字表,笔画数相同字都采用这种排列法。但是这样并不能做到唯一性。这里有两类问题可以讨论。
  第一,笔顺是只管第一笔,还是管到每一笔?按理讲,应当管到每一笔。比如“爨”有三十笔,区分笔顺就要管到第三十笔。当然,笔画多的字,到后边区分笔画已经没有多大实际意义。现在少数工具书的检字表,笔画数相同的字的排列不区分笔顺,有的虽然区分笔顺,却只管头一两笔。即使是管到每一笔,也还有一些字的笔画数、笔顺相同,比如“旦且目”都是五画,笔顺都是竖、折、横、横、横,排列成“旦目且”、“且目旦”、“目旦且”、“旦目且”、“目且旦”等等都可以;“工土士”都是三画,笔顺都是横、竖、横,可以排列成“土工士”、“土士工”、“工士土”等等,都不具有唯一性。
  所以第二类问题就是在笔画数、笔顺相同的情况下增加一些规则,以便进一步区分,做到唯一性。
  可供考虑的因素有:正体—变体/合体—独体/大—小/上下—左右/长—短/相离—相接—相交/单笔—复笔以及折笔的横起、竖起等等,其中还有孰先孰后的问题。
  正体—变体的问题比较简单,很明显应当先正体后变体。现在一般把趯(“扌”和“土”旁的第三笔)算做横的变体,竖钩(如“扌”的第二笔)算做竖的变体(新版《辞海》算做折的变体),捺(如“处”的第三笔)算做点的变体。这样,“处外”二字,“外”的第三笔是点,“处”的第三笔是点的变体捺,依据先正体后变体排列为:外处。“汀汁”都是五画,笔顺都是点、点、横、横、竖,“汁”的第五笔是竖,“汀”的第五笔是竖的变体竖勾,依据先正后变,排列为:计汀。“寸下”都是三画,笔顺都是横、竖、点,依据先正后变,排列为:下寸。“于干”排列为:干于。
  至于合体—独体、上—下、长—短等等,经过对《现代汉语通用字笔顺规范》7000字中210组461个同码字的分派安置,调整排列于下。
  (1)合体—独体,先独体后合体。“号电”都是五画,笔顺都是竖、折、横、横、折,“号”是合体字,“电”是独体字,依据先独体后合体,排列为:电号。“占凸”都是五画,笔顺都是竖、横、竖、折、横,“凸”是独体字,“占”合体字,二字排列为:凸占。
  这一层是就一个字的整体说的。
  (2)上下—左右,这是指一个字的结构关系,笔画数和笔顺相同而结构关系不同的字,采取先上下后左右。“旮旭”都是六画,笔顺都是撇、折、竖、折、横、横,“旮”是上下结构,“旭”是左右结构,依据先上下结构后左右结构,排列为:旮旭。“叻另”都是五画,笔顺都是竖、折、横、折、撇,排列为:另叻。“呋吴”排列为:吴呋。如果处理为先左右后上下,排列为“呋吴”,也就是“天夫”排列为“夫天”,与下面(3)先短后长相矛盾。
  这里要特别说明一下,开始曾经处理为先大后小、先长后短等等,结果有一些问题不好处理。先小后大、先短后长等,与先相离后相接再相交是一致的。实践证明,相离—相接—相交这一条相当重要,能够区分不少字。
  以上(2)是就构成一个字的偏旁部件说的。以下关涉的基本上都是笔画。
  (3)长—短,规定先短后长。“夬尺”二字都是四画,笔顺都是折、横、撇、点(捺),“夬”的第二笔横、第三笔撇都长,依据先短后长,排列为:尺夬。“朵杂”都是六画,笔顺都是撇、折、横、竖、撇、点,“杂”的第一笔撇长,依据先短后长,排列为:朵杂。“力刀”都是两画,笔顺都是折、撇,“力”的第二笔撇长排列为:刀力。“仵件”二字,都是六画,笔顺都是撇、竖、撇、横、横、竖,“件”的第六笔竖长,排列为:仵件。
  (4)相离—相接—相交,规定为先相离,后相接,再相交。“毛气”都是四画,笔顺都是撇、横、横、折,“气”相离,“毛”相交,排列为:气毛。“龙戊”都是五画,笔顺都是横、撇、折、撇、点,“戊”第一笔和第二笔相接,“龙”第一笔和第二笔相交,排列为:戊龙。“人入乂八”都是两画,笔顺都是先撇后捺,“八”相离,“人入”都是相接,“入”的第一画短,在前,“人”的第一笔长,在后,“乂”相交,排列为:八入人乂。“父爻从”,前二字是上下结构,“从”是左右结构,“父”的第一、二笔相离,与第三、四笔相接,“爻”第一、二笔相交,三个字的顺序为:父爻从。
  (5)上—下,规定先上后下。“太犬”都是四画,笔顺都是横、撇、点(捺)、点,排列为:犬太。同理,“呔吠”排列为:吠呔。
  (6)折笔有单折(如“马”的第一笔)复折(如“马”的第二笔)。规定先单折后复折。“匕几”都是两画,笔顺都是先撇后折,“匕”单折,“几”复折,依据先单折后复折,排列为:匕几。“夕丸”都是三画,笔顺都是撇、折、点,“夕”第二笔单折,“丸”第二笔复折,排列为:夕丸。
  ①折笔还有横起竖起的分别。规定先横折后竖折。“乐尔”都是五画,笔顺都是撇、折、竖、撇、点。“尔”第二笔横起,“乐”第二笔竖起,排列为:尔乐。“编骗”都是十二画,笔顺逐笔都一样,“骗”第一画横起,在前,“编”第一画斜竖起,在后,排列为:骗编。“山巾”都是三画,“巾”第二画横起,在前,“山”第二画竖起,在后。以“山”和“巾”为偏旁,第四画以后相同的字,如“帷崔”、“幛嶂”,也都得以区分。
  ②同是单折或复折,还有最后向左或向右的分别,规定为先左后右。“勾殳”都是四画,笔顺都是撇、折、折、点,“勾”第二笔最后向左,“殳”第二笔最后向右,排列为:勾殳。
  (7)先正体后变体。同是变体,可据其他规则予以区分。如提土旁的第二画短,在前,提手旁的第二画长,在后。这样可以区分不少字,如:圹扩/场扬/坛抟/址扯/坪抨/垃拉/埃挨/埯掩/塘搪/壤攘。
  原来还有内外关系(先内后外)一条,以处理“贝内水冈”、“网肉”一类字。但这些字可以用独体—合体/长—短/相接—相交等规则予以区分。“贝内水冈”都是独体字,但“贝内冈”三字可以拆分成部件,视做广义的独体字,即准合体字,“水”只能拆分成笔画,视为狭义的独体字,在前;“贝内”第二、三画相接,“贝”的第三画短,在前;“冈”第三、四画相交,在后。“肉”第三四画、第五六画相接,在前,“网”第三四画、第五六画相交,在后。
  以上同时为先后步骤。
  下面综合讨论几组字。
  “儿九匕几”四字都是二画,“儿”两笔相离,排在最前,“九”两笔相交,排在最后,“匕几”二字,“匕”的撇短,在前,“几”的撇长,在后,四个字排列为:儿匕几九。
  “么久勺丸夕凡及”七字都是三画,笔顺都是撇、折、点。“么”第一笔与第二笔相离,排在最前,“及”第二笔是复折,排在这一组的最后;“夕久”都是向左单折,“夕”第三笔是点,在前,“久”第三笔是点的变体捺,在后;“勺丸凡”三字,“勺”第二笔横折最后向左,在前,“丸凡”第二笔折最后向右,在后;“凡”第一、二笔相接,在前,“丸”第一、二笔相交,在后。这七个字应当排列为:么夕久勺凡丸及。
  “井开亓”都是四画,笔顺都是横、横、撇、竖。“亓”第一、二笔相离,“开”第一笔与第三、四笔相交,“井”四笔相交,排列为:亓开井。
  “叮叶甲申”四字都是五画,笔顺都是竖、折、横、横、竖。“甲申”为独体字,在“叮叶”前,“甲”第五笔竖短,在前,“申”第五笔竖长,在后;“叮”第五笔竖(竖勾)短,在前,“申”第五笔竖长,在后。四个字排列为:甲申叮叶。
  最初,曾把正体—变体排在第一位,后来发现,这一规则排得太前,严重影响其他规则的安排,比如“丁十”以及以“丁十”为偏旁的“订计/汀汁/叮叶”等。如果过早地使用这一规则,势必影响长—短规则的确定。后来把它排到了末位。上面只在“夕久”的排列上,运用了正—变规则。
  这些规则体现的是据形定序,只要形体上有不同,就能够加以区分,所以也适用于7000通用字以外的字。比如读dǔn的“”第四画的规范字形为捺,依照先正体后变体,应当排在第四画是点的“不(bù)”字之后。“丏”四画,笔顺是横、竖、折、折,在“不(bù)”和“(dǔn)”之后。“上”字的古字形隶定为两横,上边一横较短,极像“二”字。一般字典“二(èr)”字的上边一画较长,这样可以依据长—短加以区分。如果完全相同,就无法区分。以上规则不能区分同形字,即笔画、笔形完全相同的字。如愚笨的 “笨”和表示竹内衣的“笨”,当粗笨讲的“体(bèn)”和“體”的简化字“体”。
  
  三
  
  以下根据上述规则,逐一排列《现代汉语通用字笔顺规范》中同码字。这里选取二画、三画部分作为示例。上行是原顺序,下行是调整后的顺序。
  二画3组11字:
  八人入乂/儿九匕几/乃刀力
  八入人乂/儿匕几九/刀力乃
  三画8组26字:
   干亍于/士土工/丈大/山巾/
  亍干于/工士土/大丈/巾山/
  么久勺丸夕凡及/已巳弓己/卫孑子/飞刃
  么夕久勺凡丸及/己已巳弓/卫子孑/刃飞
  二画至二十画共210组461字。其中与《现代汉语通用字笔顺规范》相异者共108组253字。
  (通讯地址:100081北京大学出版社)
其他文献
AtthefootoftheChangbaiMountainRangealongthenortheastemborderofChina,theYanbianSongandDanceEnsembleisabloomingflowerofnationaledsrootedinthefertilelandsthatarekn
透视一:招标投标中的暗箱操作《招标投标法》被喻为投资、建设领域的“阳光法案”。然而,记者日前在一些地方的调查表明,由于在公共采购和项目建设中存在着大量的自由裁量权
已故奚派创始人、著名京剧演员奚啸伯(1910—1977,满族)先生在京剧老生行当中是一位卓有成就的艺术家,早在名角如云的上世纪三四十年代就与马连良、谭富英、杨宝森同被誉为“
中长跑的高原训练在我国已经开展好多年了,近些年国家长跑队和各省市的中长跑队伍继续着高原训练的历史。众所周知高原训练有助于提高耐力运动员的奔跑能力,通过高原训练提高
我院自 1 999年 7月至 2 0 0 0年 3月共配OK镜 1 88例 (35 5只眼 )。其中 4例 7眼(2 % )戴镜 3月无效 ,现报告如下 :例 1 男 ,1 8岁 ,双眼近视 6年。查 :右视力0 1 ,左 0 0
我国电影界目前的一些不正之风,再也不能继续下去了!为此建议采取以下措施:一、建全和改善审查制度。这种审查制度不是“过关”,而是对影片从内容到形式的全面审查,而且是从
我常常想,戏剧小品要求在极为简短的篇幅里写出精彩来,写法上非得别开蹊径才能奏效。譬如那些脍炙人口的小品佳作,比起传统写戏手法便多出格之处:往往不写冲突,只写状态;而且
行政监察机关的监督,是行政监察机关依法对国家行政机关、国家公务员和国家行政机关任命的其他人员的行政行为实施监督的行政活动。它是现代社会科学监督体系不可分割的重要组
Introduction The rational design and synthesis of metal-directed supramolecular framework compounds have received much attention in coordination chemistry becau
为了比较几种豆科牧草参加轮作保土增产效益,以及参加轮作后土壤水分消长动态,从实践和科学理论上为本区坡地草田轮作提供科学依据,绥德水土保持科学试验站1981~1986年开始对