之所以使用不同的汉字输入法能在计算机中找到同一个汉字,是因为汉字的编码方式是固定的。每个汉字都有一个唯一的标准编码,称为国标码。英文中的字母按照统一的美国标准,在计算机中就分别用了26个二进制代码来表示26个大写字母,再用26个代码来表示26个小写的字母。例如,字母“A”所分配的代码是1000001,而字母“a”所分配的代码就是1100001,这种统一的标准代码叫作ASCII码。汉字的数量要比英文字母多得多,常用的汉字有6763个,用7位编码就远远不够了,因此汉字的国标码有14位,例如,汉字“啊”的国标代码就是01100000100001。
然而,没有几个人是能够记住14位汉字国标码的,具体的细节要由计算机来操作。人们输入一个汉字让计算机来保存和处理,并让存储在计算机中的汉字正确显示在屏幕上或者打印在纸张上,这个过程还涉及三种代码,即汉字机内码、汉字输入码和汉字字形码。汉字在存储、加工处理和传输时使用的是汉字机内码,它通常是将14位的国标码分成两组,并在每组7位代码前面添加一位1成为8位,这样就变成一个16位的代码。汉字输入码是汉字输入时按照汉字的发音、字形,在西文键盘上敲入的一组按键编码。通过按键编码,借助汉字输入软件,就可以选择出你想输入的汉字了,软件通过查找汉字机内码库可找出其机内码,并进行存储和处理。
不同输入法选中的同一个字的机内码是相同的,因此在计算机中找到的是同一个汉字,而按照同样的机内码找到的汉字字形码也是相同的,因此可以显示或者打印同样的汉字。