文字的分类

文字的分类是非常重要的问题。对汉字使用者来说,尤其如此。我们应当对世界文字有一个完整的认识,并理解汉字在其中的地位。

单纯从文字角度看,我们可以将文字分为两级:一级和二级。一级单位以最小的视觉单位为基础,二级单位以最小的独立视觉单位为基础。二者有什么区别呢?举个例子:谚文的一个独立使用的方块字,就是二级单位,而组成这个方块字的各个小符号,就是一级单位。

具体来看这张图。按照上面的说法,这张图的谚文,有一个“字组”,两个“字”。每一个“字”由一个“字符组”升级而来,这两个“字符组”都分别由三个“字符”组成。

再举个拉丁字母的例子。比如“Latin”,就是一个“字组”,由五个“字”组成。每个“字”都只能由一个“字符”升级而成。“字符”不能组成“字符组”。

从升级角度来看,上面两个例子的对比很鲜明。我们可以将文字分为两类,一类是可以由字符组成字符组再升级为字的,另一类是字符不能组成字符组,只能直接升级为字的。所以有如下表格。

独立文字,最典型的就是拉丁字母、西里尔字母等(不过严格来说,并非所有语言使用的拉丁字母都是独立文字,有些语言会给字母穿靴戴帽,那就有可能变为组合文字了)。

组合文字就是由字符组合为字符组,再升级为字的文字。不过,组合文字不一定总要有字符组,只是可以有字符组;字符直接升级成字的情况也很常见。

字符组合成字符组的方式有很多,有的是所有字符地位平等地罗列在一起的,有的是以一个字符为中心、其他字符为辅助的。前者可以叫作“等同组合文字”,后者可以叫做“差异组合文字”。

异距文字就是有些字的距离比较小,有些字的距离比较大。一般来说,常见的异距文字都是二级结构,即存在两种大小的间距。不过可能存在或更高的情况,这要看后续的调查。

这一角度主要是区分已经成型的字组成字组时前进的方向。这个方式主要有两种,一种是水平线性的,一种是垂直线性的。因此,有如下表格。

如果细分,还可以分为右行文字和左行文字。右行文字里,最典型的就是拉丁字母;左行文字最典型的是阿拉伯文。

自由文字就是既可以走水平线,也可以走垂直线的文字。事实上,写成斜线或各种奇形怪状的线也是可以的,只是日常不那样写。自由文字通常是形状与圆形重合度较高的文字,所以在各个方向上才能自由排列。

讨论符号,主要应当以“字符”为依据,而不应从更大的文字单位入手。因为语言单位的层级性非常复杂,只有用最小的文字单位才能用统一的标准分类。一旦把文字的单位也复杂化,就会让整个分类系统陷入极其混乱的交错状态。

比如,学界比较流行一种“语素文字”的说法。我们可以分析一下它的分类标准。首先,它看起来以“字”为基础,因为主要的语素文字汉字,基本是一个字代表一个语素的。然而,汉语中的语素也有用多个字表示的,尤其是在音译语素中。这就出现了一个问题:分类基础不统一。

与此相对的,还有一种“表词文字”的说法。它看起来以“字组”为基础,因为主要的表词文字拉丁字母,基本是一个字组代表一个词的。然而,英语中的语素也有用一个字表示的,比如表示“我”的“I”。这也同样出现了分类基础不统一的问题。

这两个例子所代表的分类方法,过于注重语言性质,而忽视了文字性质,从而导致了交错状态。因此这种分类的自洽性并不是很高,本文不予采用。

这三类文字中,只有表音文字和表音表义文字能表示完整的语言,表义文字则很难。因为任何语言都有大量高度抽象的语法单位和语义单位,远古时期的人,很难想出完整的方法。比较古老的“文字画”可以表达部分抽象的语义,但它不能表达语法,也基本不表达语音,所以还不是文字。一般来说,表义文字是一种不成熟的文字,它是文字画和成熟文字的过渡阶段。表义文字如果要广泛使用,大部分情况下都会逐渐演变为表音文字或表音表义文字。因此,表义文字种类极少,大部分文字都是表音文字或表音表义文字,后者我们可以简称为“音义文字”。

音义文字和表音文字都还可以再细分。不过,由于音义文字是两个标准划分出来的,所以它的小类要用组合方式来展示。因此,我们先单独对表音和表义分类,再对音义文字组合分类。

表音文字的小类,主要是从“表什么样的音”这个角度出发的。表音的内容主要有两个,一个是音素,一个是音节[1]。因此,有下面的表格。

音素文字,就是字符只表示音素的文字。传统的音素文字,还要再区分alphabet和abjad。不过我认为,这种分法并不是“文字”的特点,而是“语言”的特点,因此在这里分类其实不是很严格。不过,为了尽可能分得细致,我还是继续分下去。

音素文字可以分为全音素文字和半音素文字。半音素文字实际上主要指辅音音素文字。不过,这个“半”的分法,还可以更多样化。除了元辅分法,也许还可以有别的分法,甚至可以非二分法。当然,这只是理论上的情况,我就不再详细展开了。

音素音节文字里,还可以细分。一种是表示音素的字符和表示音节的字符是平等的、不易辨认的,另一种是表示音素的字符和表示音节的字符是不平等的,容易辨认的。前者我们可以称为“等同音素音节文字”,后者我们可以称为“差异音素音节文字”。

差异音素音节文字,主要以“元音附标文字”为主,当然,理论上也可以有“辅音附标文字”,甚至也可以不按元辅二分,这就又回到上面的辅音音素文字的分类问题上了,我也不多讲了。

表义文字的小类,自然也是从“表什么样的义”这个角度出发的。表义的内容也有两个,一个是“义素”,一个是“义位”。因此,有下面的表格。

这个分类实际上不是单纯的。因为它既是表义文字自己的分类,也是音义文字中表义那部分的分类,所以分出的结果也要分别为两个主体服务。

义素文字,就是字符只表示义素的文字。这种文字在表义文字中几乎是不存在的,因为表义文字是从文字画演变而来的,往往非常具体,不会分析到比较抽象细微的义素。而在音义文字中,是比较常见的,比如汉字形声字里的表义字符,就只表示一个义素,而不表示具体的义位。然而,表义字符纯粹表示义素的文字是否存在,我还不能确定,暂且作为一个理论保留。

义位文字主要出现在表义文字中,而不太可能出现在音义文字中。因为音义文字的那些不得不表音的地方,往往就要把表义字符抽象化为义素。不过,这种可能性也并非完全不存在。如果一种音义文字所有的抽象意义全都用表音字符,所有的具体意义全都用表义字符,那么义位文字也有可能出现在音义文字中。

义素义位文字,最典型的就是汉字和圣书字。汉字和圣书字的独体象形字,大多符合义位文字的特点;汉字的形旁和圣书字的限定符,大多符合义素文字的特点。

其中,汉字属于“音节义素义位文字”,圣书字属于“半音素义素义位文字”,西夏文大概属于“音素音节义素义位文字”。

我采用的是The World’的文字目录,我将会把这个目录的文字名称翻译成汉语,并标注原网站给出的部分附加信息。

这是一份非常庞大的表格,我无法立即完成。我尽量以每天一种文字的速度增加信息,预计要用一年左右的时间。如果顺利,可能会更快,如果不顺利,也许会更慢。

有些缺乏语言信息的文字,或者比较古老的文字,没办法完整分类,我也会尽量在能分类的角度分出类。另外,在整理过程中,如果我发现了超出我的理论的例外,我还会想办法修改理论。

这个网站给出的文字数量和实际的数量也许有出入,我在整理的过程中如果发现了更好的方法,也会对文字数量做调整。

投投文字是2015年由达尼拉姆·投投(Dhaniram Toto)等人创制的文字。投投文字是用来记录投投语的文字。投投语是印度投投帕拉村的投投人使用的语言。

罗文字是肯尼亚的凯法·翁贝瓦(Kefa Ombewa)和博茨瓦纳的保罗·西丹迪(Paul Sidandi)共同创制的文字。从2009年到2012年,凯法设计了字母。2013年,两人在推特上相遇,保罗贡献了数字的设计方案,二人共同创制了罗文字。