既然汉字是由基本笔画按照一定的结构而构成,那么按理说就可以使用“笔画+结构”的方法设计出一种汉字录入法方案。但是事实并不是这么简单,可以想象,汉字中有的只需要一笔就能代表一个字,如“一”、“乙”等,而有的却需要十几笔甚至几十笔才能构成一个字,如“曦”、“爨”等。如果仅仅使用笔画与结构合成构成汉字编码方案,则每个汉字所需要的编码数量就会产生很大的差异,不便于综合控制,这必然使该种录入法变得杂乱无序。
由此就能认识到,一个完整的汉字,既不是一系列不同笔划的线性排列,也不是一组组各种笔划的任意堆积,而是由若干笔划相互复合连接交叉所形成的相对不变的结构。在这种结构中,绝大部分都是部首查字法的字典中部首的图形,也就是通常所说的偏旁部首,在五笔字型汉字录入方案中把这种图形称为“字根”。一般来说,字根是有形有义的,在多数情况下也叫做构字的基本单位,这些基本单位经过拼形组合,就会产生众多的汉字。
考虑到电脑键盘中常用的英文字母按键只有26个,如果要在上面安放字根,就必须将数目控制在一定范围内,既要实用、又不能过于细致以至于繁杂凌乱。通常在形码汉字录入法中,选取字根有以下两个原则:
①特别有用。这类字根在很多汉字中都有出现,因此能用它们来组成很多的汉字,例如“王土大木工,目日口田山”等。
②特别常用。这类字根虽组合不成多少汉字,但却可以组合成特別常用的字,例如“白”(用于组成的“的”字是全部汉字中最常用的一个)、“禾”(组成使用频率极高的“和”字)、“文”(组成常用的“这”字)等。
综观王码五笔汉字录入方案中的各种字根,可以将它们分为基本字根和成字字根两类,两者结合构成了字根总表。