后一页
前一页
回目录
回主页
八、秋分   自然语言与中文结构


  综合前述各项说明,我归纳出了中文文字概念之基本因素。根据这些基本因素,才能将每一个中文字汇明确地界定清楚,并贮存在计算机中。当某一文字输入时,经过程序之基本因素分析,计算机之“意识中枢”便得到所代表的概念。意识中枢亦能反向将基本因素组成概念,并将之转化为语言、文字,以与人沟通。
  这些基本因素即为各种主观客观现象之根本,透过计算机中的“意识中枢”之“了解”程序,凡与概念结构有交集的,则分别与所设定之概念连通,意识即产生了对此概念的“认知”。有了了解及认知,再加上计算机做为主观个体之“立场”,以预设的“目标”作为“判断”条件,计算机便有了“智能”。在必要时,尚可以赋与“行动”的能力。
  以下我简单地说明其具体之步骤以及设计之原则。
  在概念资料中,“基本因素”具备三种特征:
  一、代表客观、主观等现象最基本且完整的观念:
  对概念而言,“基本的”并不等于“单纯的”,由于形成概念之联想特性,主观客观交互纠结,没有任何概念能独立存在。因此,我将前表的二百五十六种分类假定为最基本且完整的观念,并视之为分类因素。在实际应用时,尚须利用分类因素作交集定义,才能明确地将每种概念加以界定。
  二、文法或文字应用之原则:
  文法是硬性规定的,没有灵活的变通性,虽历经许多语文学家的努力,始终无法整理出一套具有公信力的中文文法来。也幸亏如此,我们得以摸索出一条中文文字应用的原则。基本上我们承认主词、述语之陈述结构方式,但在文字与文字结合时,则采用弹性的始态、终态、连续态,以“达意”为原则。
  三、有与感应功能机构(即感官)结合之条件:
  要让计算机达到认知的目的,必须了解计算机之特性,利用数据总线以及软件程序多次选择的功能,每当“概念”资料传送到总线上时,可以选定适当之输出入端口,使“感应功能机构”得到正确的电流脉冲。
  前两项在前文已解释过,现略分析分类基因与感应功能结合之方式,即得到下列关系。实际上此类结合常涉及知识,而知识系贮存在“知识库”中,除了预设之知识外,尚可以经由学习过程,填入数据结构中。
  概念是独立的单元,仅能代表静态的事物。而人类处身在四度空时中,面对的事物瞬息万变。因此,人类在认知或表达概念时,必须使之成为动态的形式,这种动态的形式,早在原始时代即被普遍应用为语言。
  如果以电影为例,一格一格的画面可以视作独立的概念,放映即是将静止的画面连续成为动态的画面,人藉此了解电影所表达之原意。因此电影也是一种语言,而且灵活又有趣。想要了解语言真相的人,最好先由电影分析着手。
  语言虽然发展得早,但在发展初期人类的智力尚未成熟,对于规律的掌握还在摸索阶段。故越早期的语言,其规律性越低。学习第二种语言的人,常对该语言“不规则”的文法、字词变化等伤透脑筋,偏偏那些最讨厌的部分往往是最常用的习惯语法!由所有不规则的习惯语法,可以看出来人类最初的习惯性行为是什么。奇怪的是中文中并没有“不规则”的观念。
  中华文化真正的价值,就在中文的概念结构。过去因为对信息认识不足,无法发挥中文的绝对优势。好在真理不辩亦明,中国人亦为人类家属的一员,过去遗留的宝贵资产,尚有待未来人类共同努力,发扬光大。
  我开始考虑概念分类时,就像做中文输入研究一样,完全是在黑暗中摸索。等到理出一些头绪,有了初步的结果后,才发现美国学者早在二十几年前就考虑过这种方法。但是他们只做了些最表面的分析后,发觉此路不通。自后因为计算机技术的进步,学者专家纷纷改由分析文法及字典着手,仍然没有找到可行的方向。
  近年来概念分析似乎又有抬头的趋势,可是据我研究的结果,英语在长期发展过程中,倚重发音以表达概念。在录音机未发明之前,声音无法记录,全赖一代一代之间的口口相传。加以人类能辨识的声音有限,必须采用复音节才能有效运用。这一来,一个英语字汇本身就是一组复杂概念的结合,很难从中理出基本概念来。
  其次,英语有规则严谨的文法结构,虽然有其优点,却因此丧失了语言文字的演进痕迹。我们要想找出人类思维的真相,就必须了解思维所应用的元素,这些元素就是组成原始文字语言的基本概念。既然英语业已经过整理,现代人所用之英语必然与整理前的有所不同,那又如何去找寻那些失去的环节?
  人类最初发展的概念一定是不完整、简陋不堪的,我们想知道人是怎么了解概念,其途径之一是找到概念的发展原因及过程,此必须有保存良好的原始条件。对英语甚至所有的拚音系统来说,这个机会是非常渺茫的。中文基于视觉符号的发展应用,走向图形文字,每个图形在当初只代表一种具体概念。后来虽然扩大了应用的范围,注入了一些新的认知,但原意还在,而且各种文献一直保持至今。
  中文最有利于追溯思维因素的一点,就是其单音概念。单音因为不易辨识,所以中文常将单音字组合成“词”、“成语”来使用。这些单音字正好就是各种概念的矿床,只要能有系统、大规模地整理研究,人类思维的历程必然昭然若揭。
  我在沉红莲的协助下,收集了近二十万个“词组”,花了很久的功夫,把每个词的含义以及组成词的各单字间之关系,一一加以分析,又经过多次的修订,才得到第七章的分类表,以及概念基因和常识结构等。
  我不厌其烦地说明这点,主要的原因是希望国人了解中华文化的博大精深,绝对不是虚语。尤其我很希望当今从事中国文学以及语言文字学的学者们,千万不要妄自菲薄。风水轮流转,智能之钥已在你们的掌握之中,智能科学就靠各位发扬光大。
  我很了解自己,创新突破是我的长处,但却缺乏严密周全的细心。智能科学将是人类文明对宇宙进化的最终贡献,唯有大家捐弃私心、成见,精诚合作,截长补短,才可能有真正的成果。至于上述的分类,只是在启蒙时期,个人一点不成熟的心得而已。
  以下且以使用最频繁、最复杂的“打”字为例,说明我们怎样利用中文的特性,将其前后字义的关键分析出来(其余的文字也是以同样的过程,一一整理归纳出来。)
  我们所收集有关“打”字的复合词,因数量太多,在此仅抄录具代表性者如次:
  “打”字在前,后接动词、名词、状态词等:
  一、动词在后,“打”或指一种行为,或表某种动作或行为之进行。
    打斗,打仗,打劫,打击,打扰,打闹,打猎,打扫,打捞,打造
    打磨,打扮,打赌,打量,打鼾,打盹等。
  二、名词在后,泛指用手进行之活动(可能有引申义):
    打球,打牌,打更,打鼓,打锣,打针,打铁,打靶,打拳,打勾
    打油,打水,打酒,打柴,打鱼,打包,打结,打伞,打字等。
  三、指动作行为,后接终态词、结果词或程度词:
    打定,打成,打下,打住,打完,打好,打坏,打消,打伤,打死
    打破,打穿,打断,打碎,打烂,打倒,打通,打动,打得等。
  四、典故,或因习惯用法而有他义者:
    打发,打尖,打点,打烊,打折,打算,打雷,打诨,打手,打哑谜等。
  由上可知,“打”在前时,多以其后之字定义,本身仅作发生、进行及完成助词。
  “打”字用在后面者较少,除用作单位外,多为“打”之动作。
  一、前为数字者,“打”作为单位用:
    一打,半打,两打,几打等。
  二、前为动词,表示打之方式,前为名词,则指用工具之动作:
    扭打,撕打,拍打,拷打,捶打,摔打,抽打,敲打,殴打等。
    鞭打,棒打,锤打,拳打,手打等。
  三、前为助动词、形容词、副词,则描述“打”的情况:
    能打,肯打,会打,爱打,乱打,狠打,痛打,经打,耐打等。
  四、专用术语:
    单打,双打,代打,全垒打等。
  我们一再分析各种单字之组合,发现了中文词组有一定之组合方式,除了一部分习用已久或出自典故难以合理的归类外,绝大多数都有前后顺序之关系。一般说来,同性质之字,前面的字义多为“始态”,后面的则为“终态”(亦即前者为因,后者为果)。形容词、副词多用在前,一旦用在字后,则一定是一种结果的状态。这种发现奠定了我们对中文具有“映画”功能的信念,因此,我们仅以单独的文字概念作为“动画”的元素,再以前后之关系定义之。
  这种方法不但可以节省文字定义的空间,重要的是应用灵活无比,只要再加上“修辞”模块,中文自然语言就算完成了。
  举例而言,“逃”是人或动物在某种原因下,因本能反应或意识驱使,以行走或任何交通工具,避开某个特定对象的动作行为。逃的结果,使位置或关系产生了变化。
  从上述的定义来看,“逃”本字的概念并不完整,难以理解。充其量我们只能肯定这是一个主体所控制的动作。
  再详细加以定义,以“逃”为述词,如前用一主词或副词,如“他逃”、“快逃”,其意甚明,毌庸细述。其下接名词,或作为“逃”之对象,或以“逃”修饰该名词,是一种最常见的叙述方式:
  “逃家”:主词通常指人,但凡“家中之成员”均适用。
       (猫狗亦可逃家,但可能性不大。)
  “逃学”、“逃课”:根据其后名词之限定,主词必为学生。
  “逃兵”:主词为兵。
  “逃税”:主词为人,且为有收入、有义务纳税之人。
  “逃狱”:主词为囚犯,“逃犯”则为专词。
  “逃难”:主词多半为人,然动物也可能有灾难。
  “逃命”:主词指有生命、能动作者。
  如果后接动词或状态词,则表示逃后之结果,如:
  “逃避”、“逃遁”、“逃匿”:逃后不知所往。
  “逃离”、“逃走”、“逃脱”、“逃开”、“逃掉”:皆表示逃后,不同程度地达到了逃的目的。
  如果把上述之词颠倒过来,有些难以理解,有些则产生不同的概念,如:
  “遁逃”:遁有不使人知之意,表示悄悄地先遁后逃。
  “匿逃”:匿是静态的,放在逃的前面,无从解释。
  “避逃”、“离逃”、“掉逃”:由于“避、离、掉”三字皆有结果之意,其后再接动作之词,很难会意。
  “走逃”、“跑逃”:走及跑皆为全动态,已为逃所涵盖,故不适用。然而走及跑亦具终态之意,故用在逃之后面则可。
  “脱逃”:指先脱离后,再逃者。
  “开逃”:开始逃。开在此不是结果词,而是时间词。
  由上可知,两个单字结合时,其在前在后有一定之语意规则,不然就词不达意。这是中文独具的特色,应用起来异常灵活,奥妙无穷。
  在我粗浅的分析中,动词有状态词及动作词两种,分别说明如下:
  一、状态词:又分为始态、连续态及终态,皆表示一种动作在某一时间内之状态。此类词可以用为动词,但却只表示某种动作之状态,与动作无关。如:
  兼具三种状态者,如“开”、“启”、“发”、“起”等。
  “开门”、“开罐”、“开幕”、“开山”等词中,如何“开”法并不是概念的主旨,只是表明了一种状况的开始。同理,“打开”、“张开”、“铺开”、“走开”等也只表明了一种终止的状态。“开打”、“开演”、“开讲”、“开跑”等则表示动作之连续态,在这种状态下,“开”之后皆接动词。
  终态:“满”、“止”、“停”、“住”、“死”、“谢”等,这类概念不能用进行式,多为已经完成者。
  连续态及终态:“灭”、“消”、“减”等,虽为终态,亦可作连续用。
  二、动作词:即一般所谓之动词,除文法上之特性外,在字义上可分为动作及行为两大类。动作有自然力的运动,主体驱动之运动,动作之结果与其所产生之终态有关。行为则有动机及起因,环境及效应等因素。
  以动作为例:“流”为自然力之运动,主体为液态物,因地心引力,由上往下运动。如果引伸为状态词,则表示一种连续态或终态,指自然而然形成者。中文凡属水字旁的字,多有自然现象的涵意,又凡为动词者,多具状态的特质。这是因为古人造字时,先有了事物之形,再观察事物之性质及所产生之状况,遂以事物为分类标准,当作偏旁,故都具有特别的属性,详见后面前缀之分类说明。
  主体驱动之动作词亦然,凡属自发性动作,皆归类于运动之主体。这种分类法对于字义的了解及运用有极大的优点,譬如说西方的人工智能研究中,由于英文不具这种功能,字义完全依赖字典提供,字与字之间不具依属性。要回答“什么会飞”这类问题时,除了事先建妥庞大的“知识库”外,几乎没有其它简便的解决方案。(要知道类似“什么会飞”这样的问题是无穷无尽的!)
  对中文而言,“飞”的属性是因能飞的主体而产生,前人在创造文字时已经处理妥当,除了一、两个例外,所有“鸟”旁的字(仓颉码之后三码为“斜日火”者)都是会飞的动物,其余“飞机”、“飞船”、“滑翔机”更不用说了。换句话说,在文字的结构中已经蕴含了字义的分类。如果把字义视作人类经验所得的智能,那么,我们可以大胆的宣称,中文是具有智能的文字,根据中文来发展“人工智能”,将远比英文来得容易。这也是何以我个人胆敢大言不惭,自命了解智能,说穿了,不过拾得前贤一点牙惠罢了。
  行为词更有规律,缘因人类对行为的认识,多在文化层次发展到某一阶段以后,造字时已有成规可循。如人与人之间的行为,多以“彳”为偏旁;运动位移的行为,则采“辵”旁;思考的行为,为“心”字旁;言语的行为,则为“言”字旁;用手脚的行为,为“手”及“足”字旁,诸如此类,如女、纟、金、木、火等,不胜枚举。
  所以,我认为中国人未来的前途,完全系于中文专家身上,未来人类的“思维科学”也端视中国语文学家的努力而定。毕竟中国文字不是“快餐”品,历经了几千年,动员了无数不计功利、默默奉献、没有私心的伟大的人类菁英,将人的睿智浓缩在一个小方块中。这种信息是宇宙进化史中最珍贵的宝藏,是至高无上的智能秘籍!
  炎黄子孙们!“思维科学”必是未来世界的主流,身在宝山,还有什么需要外求的?不自行努力,琢磨这块璞玉,反而一味盲目的“西化”、“简化”,妄把他人的残渣剩滓奉为圣品,那不是愚昧又是什么?
  我个人学浅才疏,所知万不及一,言尽于此。世人是否能有造化,也非我能揣测,邵康节梅花诗言:“一院奇花春有主,连宵风雨不须愁”。喻之国人,差堪告慰。不过,今天中国需要的是信心,未来之中国则戒之在狂傲。文化属于全体人类,能相互学习切磋,截长补短将是人类之福。褊狭的地域或人种观,必将自陷于绝境,不见容于千秋万世。
  中文另外一个极有价值的观念,即为“部首”的常识分类。任何一个人绝不可能有足够的能力与时间,认识到所有事物的通则,但是一个绵延不绝的民族则有此可能。尽管可能,也要有必然可行的方式,一代一代沿用这种方式,不断发展下去。
  在设计仓颉输入法的时候,我就发现了大部分的形声字都以字形偏旁作为字义分类。根据这种现象,我正好将文字取码与字义结合为一。因此仓颉字码不仅仅是索引符号,又是该字的字形及字义分类。目前一般人或许还看不出其功效,一旦进入自然语言的领域,字义分类便是人类认知的成败关键。
  下面我以仓颉码为序,大略介绍前缀中字义的定义方式,再与前述各概念配合应用,精简异常,当知我强调中国文字之智能绝非虚语了。(部首在上、下、左、右,都有特殊的分类意义,请自行参详。)
  日:与光有关之各种现象。
  门:与门有关之词,代表组合之机体。
  月:即为“肉”字,生理组织类。或为“月”,与光有关之各种现象。
  骨:生理组织。
  贝:财物及与财物有关之行为。
  豸:野兽类。
  目:眼部之动作及视觉感受。
  金:金属及其属性等。
  木:树木类,木制物以及与木有关之特性等。
  韦:皮革类之器物及其所表示之性质。
  水:与水有关之自然景物、现象、状态、动作与人造物等。
  火:与火有关之现象、事物,状态以及炊事行为等。
  米:与粮食有关之事物。
  土:地形、地物,与土及地有关之词。
  走:与行走有关之词。
  竹:各种竹类,竹之部位及制物。
  白:光亮洁白之形容词。
  禾:农事、农作物等。
  身:身躯及身体之动作等。
  鬼:鬼怪等名词及形容词。
  彳:人与人之间之各种行为及事件。
  辵:与人类动作行为有关之词。
  牛:与畜牧及生活有关之词。
  舌:舌部之动作。
  鼻:与鼻有关者。
  风:与风有关者。
  舟:与航行有关之行为、用具等。
  广:房舍及室内之用具等,或表空间之形容词。
  示:礼仪及祭祀之行为及用具等。
  宀:居家生活有关之词。
  穴:具有穴状特性之词。
  车:与车辆、运输有关之词。
  麦:粮食,作物等。
  疒:生理及疾病等有关之词。
  犬:与犬类野兽有关之词。
  衣:与衣着有关之词。
  巾:衣物,巾状之用物及饰物等。
  虫:虫类、爬虫类等。
  片:片状之物。
  雨:与水气有关之自然景象、现象等。
  王:玉类物质物品等。
  歹:与死亡、毁坏有关之现象及行为。
  豕:家畜有关者。
  石:矿物、石制物及其性质等。
  酉:经酦酵之食物及有关之现象等。
  弓:武器及有关之性质等。
  角:角之部位、角制品及其功能等。
  子:人际称谓及关系等。
  鱼:鱼类与相关之词。
  矛:武器工具等。
  阜:与空间、环境有关之词及人类行为等。
  邑:空间,地域及环境之词。
  人:人之角色、关系、行为、现象等。
  食:与食事、食物有关者。
  气:各种气体。
  心:心理感受、现象、状况等。左侧的心指状况,下部的心指感受。
  手:手之动作、人体之动作及行为。
  耒:农具、农作等。
  口:口之部位,口部动作,发声等。
  足:脚部名称、动作、行为、现象等。
  马:与马有关之词类。
  髟:体毛类及其性质。
  耳:与耳以及听觉有关者。
  廾:草类,菜蔬等植物。
  革:皮革制品等。
  羊:与羊有关之词。
  山:与山有关之形容词、名词等。
  女:与女性有关之名词,形容词等。
  纟:与纺织有关之词或具有纠结性之状态词。
  田:与土地有关之词。
  黑:与黑暗及黑色有关之词。
  囗:与空间范围有关之词。
  言:与语言有关之词。
  以上仅略述概要,根据字码只需要一个位(开或关),就可以达到分类的目的,全世界大概也只有中文及仓颉码可以做到。如果我们不加以利用,将之发扬光大,岂不是愧对祖先?
  西方是分裂性的文化,是以假设、分析、求证为思维的指导方针。世事越分越细,细不见得能明,但是细分的结果,派别观念越来越多,彼此之间的相同性反而越来越少。这点可以由知识分类、政治制度、人种区分得到明证。
  中华文化是综合性的文化,是以假设、归纳、应用为思维的圭臬。中国人只求外表的统一,含糊的认知,不确定的象征。千古以降,读书人但求“读书不求甚解”、“得意而忘言”,以同统异。是以知识上崇儒,政治上忠君,人种上同化。
  这种分别正是概念的认知问题!今人学了西方的观念,半通不通,便将自己全盘否而定之。谈意识太麻烦,不如举个例,看看西方的菁英是怎么分析语文?又得到什么结果?如果这样还不能拾起文化的自尊心,不妨等西方开始汉化时,再回头也不迟。
  西方学者经过二十余年的摸索过程和错误经验,自然语言的研究者,由最初利用关键词或纯文法的比对方式,如今已改用概念分析法,其中耶鲁学派的 Roger Schank 所提出的理论,是当前的主流之一。
  他的目标是设计出一个“会听故事”的程序,也就是说,它所需要知道的常识和字汇,都局限在一个范围内(西方尚无人敢尝试做一个有“一般用途”的自然语言系统)。
  他的构想是把所有的行为动作词,分析归纳成若干个基本概念。其它则类分为动作者,目标物等。输入的语句经过程序的剖析后,即转化为基本概念。
  基本概念共有11类(现已扩充,但我在中文结构中归纳出的,已有一千个,包括前章所列举的概念分类),如ATrans 指所有权的转移(给、拿、买等),PTrans 指物体的位移,(走、骑、放等), MTrans 指信息的传递(说、写、听等),MBuild指信息处理(如想、思考等),INgest 指进食行为(吃、喝、饮等)……, 以下且举一实例说明:
  输入:他卖给我一本书。
  内部结构:
     动作: ATrans
     动作者:他
     物:  书      动作: ATrans
     到:  我 ------   动作者:我
     从:  他      物:  钱
                到:  他
                从:  我
  输出:
   1.分析:我给了他钱,他给我一本书,我买了他的一本书,我付了他书钱。
   2.推理:我有了一本书,他有了钱,我想要他那本书,他不再需要那本书,
     我会看那本书,他需要钱。
  假设常用的英文字汇有一万一千个,只有十一个类别,这表示每一类中有一千个字汇概念相同,无法区分。就算目前已扩充到一百个类别,只要不是每个字的定义,都有别于其它的字,计算机就无法真正了解和使用自然语言。
  再看输出有分析,有推理,好象说得很清楚,可是因为字义界定不明,达不到真正的理解。事实上西方学者自己也承认,对“人工智能”还在“学习了解”阶段,尚无可行的理论。(Schank的理论,此处限于篇幅和主题,只做简单说明。坊间有关人工智能书籍中“语意理解”部分,必会介绍他的方法,读者若有兴趣,请自行阅读。)
  如果以中文概念来分析,“他”是“人”,(人字旁+定义),“卖”则是一种“商业行为”,(贝字旁+定义,商业行为之一,即为金钱与物的交易),“给我”是指“受者”,“一”是数量,“本”是形容有信息内容的“量词”,对象物为“书”。
  输出:“他”收了钱,“我”收了“书”,完成了一桩买卖。(全部资料七个字,共二十八个字符,过程不过用了几百个字符的程序而已)。
  由此可证,他们的分析虽然不再完全根据文法,却也与概念无直接关系。这种做法,受限于设计者的能力,每一个字都必须辛辛苦苦地重建其结构。中文概念则早已建立在文字的形声结构中,充其量下点功夫整理即可。

  在这个时代中,不论在经济、军事、文化上,也不管对象是国家、社会或个人,知识的运用都具有决定性的力量。然而,运用知识的仍然是人,人又受限于时、空,所以人类社会尚能保持某种程度的平衡。
  然而,人类追求“自动化”的努力与梦想,古今中外,未曾一刻停止过。一旦在信息的处理上能成功地使知识运用自动化,则人类的社会结构势将引起空前的变化。
  这种知识自动化,就是“人工智能”的目的之一。
  因为人有智能,所以能运用知识,并借着知识的力量,达到人的目的。如果机器也能自动地运用知识,我们必须承认这种机器也同样具有“智能”。只是这种智能的初始是“人工设计”的,所以一般称之为“人工智能”。
  有了人工智能的机器以后,基于机器记忆能力之强大,永远工作不休,处理事务准确迅速,成本低,效率高,很少发生“错误”。最可怕的,是“它”没有人性,只是忠实不渝地执行交付的任务。万一它在一个或一群人的支使控制下,很可能国际均势消失,对人类社会造成永难弥补的伤害。
  职是之故,所有的工业先进国家,无不将人工智能当作最重要的攻关项目,全力以赴,唯恐落在他人之后。
  所幸欧美工业国家之先进基础,建立在物质科技上,而“智能”却与物质无关,是一种“唯心”的、“经验”的领域。尽管多年来他们已经投入了大量的资金、人力,迄今并没有任何实质上的突破。
  这是一个民族、文化生存或淘汰的竞争时代,今天在物质条件上,我们是弱者,处处落人之后。但是,中国也曾经壮大过、强盛过,这样的说法并不是自我陶醉,而是基于中国文化的特征以及数千年累积的经验。这些正是“人工智能”所缺乏、而西方科学界无从由实验室或工厂中生产出来的。
  所以,在工业时代,我们的确是瞠乎人后,信息时代却给我们带来了一线曙光。如果我们善于利用,群策群力,将先圣先贤的经验及智能设计成为“人工智能”的产品。则在即将到来的新时代,谁敢轻侮炎黄子孙?
  我已经决定不再涉足“人工智能”,但是,知识不是任何人的专利,我能看到,别人也有可能做出来。时机一成熟,“人工智能”就难免泛滥成灾。既然已经谈了不少,何妨再稍作解释,让读者多一分了解。
  人工智能不能离开信息,那是因为人的智能来自于信息。“资”指静态的资料,“讯”指动态的讯息。信息是人将感官所能认知的刺激,以资料及讯息的形式,加以贮存及应用,以代表人所能了解及应用之概念。
  在第六章我曾谈到感觉讯号与概念的关系,这里我更进一步,略述其在人工智能上的应用。人类的感觉有五种,分别是视、听、味、嗅、触觉。佛家则认为应将“意”加入,成为“六识”,意为人对刺激的六种认识。
  意识我们称为内在刺激,由人的经验交集所形成,且为个人行为及判断的中枢。外在刺激则有五种,其中视觉感知光影,人可以藉图像及符号等来认知及表达;听觉则接收声波,人并用声带仿真该音调;味、嗅、触三者人仅能接收,除了经验认知外,无法与他人直接沟通,故纯属主观。
  味、嗅、触觉与反射神经有直接的联系,偏向于“本能”,当此类刺激产生时,反射中枢立即根据利害程度,作出最有利于该个体的反应。听、视觉则接收距离较远之物体、事件所传来的声、光等刺激,最初这些刺激亦是本能的,以判断其对本体之利害,但此判断可以累积成为经验。当某些经验在客观印证下,被同一社会的人公认,遂称之为常识。在智能的理论上,常识是人据以判断选择的标准。
  图形及符号可以设计成为静态的资料,音调则是动态的讯息,这两者皆具有接收及表达的功能。人的主观经验透过信息的交联,得以互相转换,并以之传达给他人。对于原本没有此类经验的人,信息遂成为最有效的工具,藉之可迅速建立起其常识库及专业知识库,这就是学习。
  当然,在学习过程中,由于主观及客观的条件,认知效果也有差异,如味嗅触及意识等纯属主观经验,除了在一定的范围及程度外,并无实质的意义。唯有双方具有等效的经验,而且能明确地掌握信息的要素时,才有沟通的可能。至于专业知识则较接近客观,同行者都必须经历相似的体验,学习效率最高。
  即使是文字语言也面临相同的问题,在学习语言文字的过程中,需要将之与已形成常识的主观经验联结起来。(人在两三岁以前,学习是一种本能,靠记忆将声音与事物相连,渐渐形成常识。)这种过程必须利用感官的效应,一再与客观事件印证,此即为思考、判断。而语言文字所联结的认知即为概念,所以每个人对概念的认知,与其经验的广狭、感官的灵敏度、思考判断的方式及语言文字的接受能力等,都有不可分割的关系。
  西方对人工智能尚没有统一的定义,在此我仅以设计者的立场,先定义智能,再逐步说明人工智能的可行性。
  所谓的“智能”,系指一种自发性的机构体所具有的达到其预设目标之能力。
  根据此定义,智能有四个要素:
  一、其载体是一种机构体,具有整体性质及功能。
  二、此机构体是自动的,非外力所操纵。
  三、有预设的目标。
  四、能够在变化的时空中适当的因应调整,以迄目标的达成。
  应该注意所谓“预设的目标”应该只有一个,如果有多重目标,则必有优先级之分,或按照时间订定远程、近程目标,逐步实施,而且不能自相矛盾。因此,在某一时间内,在某一个优先级下,仍然是只有一个预设的目标。
  一部汽车是一种机构体,其预设目标是代人之步,但汽车不具自发性,故没有智能。人类所设计的各种工具、用具,到目前为止都必须在人的操作、控制下,并需运用人类的智能,以达到预期的目标,所以都不具有智能。
  如果我们设计一种车辆,以“驾驶服务”为唯一的“预设之目标”。它能自动驾驶,并接受人的命令。在接受人的命令时,即相当于设定短程目标。这时它应该能够判断此一短程目标是否与预设的目标相矛盾?如果是,它将拒绝执行。否则不论在什么情况下,它都能把人送达目的地,具有这种功效的汽车,就可以称为是一智能机构体。
  同理,我们如能设计一具计算机,自动地为人类收集、处理资料;能与人交谈,了解人的观念、帮助人解决问题,这就是智能计算机。再若将具有感觉器、行动能力的机械人,与智能计算机结合起来,则此机械人即达成“人工智能”的要求。
  为了要保证安全有用,机器与人之间的沟通,必须藉助概念,人得以对此“智能体”加以控制。故人类所设计的智能机器,必须能“听”及“说”人类惯用的语言,才能达到上述目的。在这种特定的条件下,计算机对语言、概念的理解、运用,才是设计人工智能的成败关键。
  所谓“设计”是先有了一种观念,利用已知的技术和器材,组成符合构想之事物。计算机专家如果没有智能的观念,不知道所面对的是什么,则无从动手。
  当今的语言学只研究到语言的演进、结构及应用,至于人体机能与语言之间的接口关系,则尚未能了解。人会模仿学习,也会教导别人,却不知道为什么会有这种能力,当然更不知道如何教导机器去学习及应用语言了。
  至于观念,更是思考的基础,从古至今,哲学家们争论不休,也未曾有过具体的定论。那么,人如何设计一种连自己都不了解的事物呢?
  很明显地,我们必须了解语言与思考之间的体用因果,使计算机也和人一般,能够思考,能够运用语言。这样它就可以与人沟通,了解人的观念,进而为人类服务。再换个角度来看,语言(符号)相当于对外在刺激的一种感应,而观念则是经验的积和,一旦这种计算机设计成功,计算机就可以应用其感应资料,增进其观念。更进一步,全世界的计算机可以藉网络的连系,互通讯息,而且以高速处理,永不中止。
  今天,正当有先见的环境保护人士,正努力挽救濒临绝种的其它生物时,我们可以想见,未来的人类亦将面临需要被保护的一天。进化淘汰绝对是反人道的,今天的人类还不憬悟身处的环境,到了大错铸成时,后悔已是无及了。
  假如我们能把人性设计到计算机中,让计算机继承人类的感知,无止无尽地薪火相传。当然,这已不仅是技术上可不可能的问题,其中还牵涉到法律、道德以及个人的良知、责任等种种超出我们所能解答的问题。
  知识早已不是人类掌握在手中的工具了,它的生命力遍布于每一个人的思想中。一道好奇的目光,一个偶发的疑问,在在都是它的影子。不论重不重要,也不论成功失败,只要有人的心中怦然一动,知识就增加了一分力量。
  当人类走出丛林,远离了那些还在披毛茹血的族亲时,人就与知识歃血为盟,携手创造了一个崭新的时代。不幸人无法将其生命无限延伸,知识却得以借着人类,一代一代的传衍、更新。现在,知识壮大了,壮大到任何个人都无法窥识其全貌,更遑论控制应用。这时,人与知识之间的相互利用价值,端视彼此的需求程度而定。
  我们能够忽视这个事实吗?拋开了知识,有谁还能声称人为万物之灵?在今天,国家会衰亡,人种会灭绝,可是知识却永远存在。世界上的每一个角落,社会上的每一桩事件,无不深深地受着知识的支配。人类孜孜不倦所追求的,朝朝暮暮所憧憬的,又有哪一件能脱离知识的影响?
  我认为该是人类自我检讨的时候了,趁着“知识机器”即将问世、我们的盟友快要振翅起飞,而我们这些“知识动物”还在盲目的推波助澜之际。如果能够把握契机,将人类特具的感受以及长年累月体验到的价值观,都一股脑儿交付给它。至少,让它也有“感同身受”的人性和“推己及人”的认知,或许人类还能安享余年。
  有这种可能吗?没有人怀疑“知识机器”的能耐,但谁都不相信那种无血无肉的机器,会有像人类一样的情感。
  这是因为科学太重视实验所得的客观知识,忽略了人的主观感受,所以科学家们一直不了解“人性”到底是什么。在他们望洋兴叹之时,是不是应该调整一下实验的手段,利用理性的思维,来剖析一下人性呢?
  据我的了解,人性在理性的剖析下,并没有什么神秘难测的现象。我们只要掌握住一些基本观念,逐步地探讨,就可以透视全貌。一旦能够理解,自然能按图索骥,用已知的各种观念和技术,将之设计成为附加在知识机器上的感性功能。
  人类应用语言的原因,是由于人自我的“主观”感受,和外在的“客观”真实之间有所异同。为了要与其它个体沟通,高等动物发展出了以声音表达情绪的机能。人类更进一步,利用声音的各种变化发展出语言,以代表其主观的感受。
  如果把主观的感受分析成为单纯的因素,而且这些单纯因素的组合,能代表人类所有的观念,我们就能分析语言,了解人类思考的过程。在这种情况下,这些单纯的因素也就是人类思考的基因,甚至可以视为知识的基本元素。
  原则上说来,人类的感觉器官接受到外界的各种“刺激”,在本能上基于“利害关系”而有了“感受”、产生“反应”。若是仅表达感受的反应,谓之“情绪”,再因为反应的后果,由“观察”刺激得到“认知”。因认知而有了“判断”,这个过程谓之“经验”,经验的贮存,则为“记忆”。由于人类的记忆系统建筑在神经的生化结构上,其效能不高,故对记忆的存贮、取用,很难加以控制,有时对一事件的原委记忆并不明确,我们称之为“印象”。
  大脑中的内存以神经原连接成网络,神经原会产生生化电流脉冲,在网络中流动。相同的感受因素占有共同的记忆区域,但却与不同的事件相通连。当某一事件所产生的电流脉冲,因共同的感受因素而引发其它事件的记忆,我们称此现象为“联想”。对于某一因素或事件产生的联想,因为电路的导通,遂有全盘的认知,即为人对该一因素或事件的“观念”。
  当人对事物有了观念以后,基于其本身的利害关系,电流流经记忆区时,在极为明显的利害感受下,身体机构会产生各种内分泌腺素,使神经原处于兴奋状态,而使电流加强。更由于强烈电流的不断导通,神经末梢的离子量增加,电阻系数降低。而任何刺激所产生的电流脉冲,就像水往下流的情况一样,必然有通过电阻系数较低之路线的趋势。久而久之,经常导通之路线便能四通八达,成为全部经验记忆的枢钮。在此枢钮形成后,每当刺激产生时,此区便立刻与意识中枢导通,形成“意识”。
  抽象的意识以及具象的身体,总称之为“我”,也就是当一个个体感觉到神经传送的刺激,且与过去的经验认知相结合时,所得到的整体意识的“知觉”。换句话说,一个人如果丧失了过去的经验认知,则“我”将毫无意义,只是一尊躯体。再若在某一段时间内,没有任何内在、外界的刺激感受,也相当于“我”不存在。
  “我”对客观认知的观念,是基于过去的经验,而经验不是独立的单一事件,有时间的过程,有各种感觉器官综合的感受,有利、害以及需求的交集。因此每一个自我对客观认知后所产生的主观观念,或多或少都有差别。但人又不能脱离群体,必须与在同一环境下的人,具备相同或类似的认知,由此而有了学习及观察的动机。
  学习观察是将个人的观念与客观环境相印证,并据以修正、充实个人观念。在这个印证过程中,必须将自己的主观观念,以感官所能接受的刺激形式,表达给另一个主观体认知。由于观念笼统地涵盖了所有相关的经验,而刺激受到时空的限制,不可能明确地表达清楚。因此必须将观念的若干基本因素,分解成为具有独特性、组合性、表达性的单元,才能较完整有效的传达给另一个主观体,这种单元就是概念。
  在人脑中,这种概念是以一组联通电路的形式存在,联通于所认知的各种观念之间。每当人因为某种因素,产生了一种复杂的观念时,这些观念之间,通过有关的交集,就有电位电势的产生。这时大脑中枢依循电势,将电路联通,此一联通之电路必有一代表的概念相连。以此概念驱动控制中枢,就可以得到意识的效应。
  人类发展出概念之初,只是基于实用,并没有一定的法则。随着认知范围逐渐的扩大,概念所涵盖的内容越来越广、界定的因子越来越精细。到现在人所应用的概念一再因应调整,变成了错综复杂的集合。这个结果又导致了我们对概念本身定义的困难,甚至连概念所代表的是什么,都无从了解。
  如果我们能做到利用现有的知识,反推出概念的基本因子,便能够用符号代表这些基因,并设计成为代码,贮存在计算机中。如此,计算机便可以像人一般地运用概念。
  人运用概念联接导通大脑中各种观念网络的过程为“思考”,经过思考以后,认知的利害因果刺激了内分泌腺素,流入血液,经过心脏,是为“感受”。有感受便会产生反应,是谓“情绪”,情绪直接影响到“我”的意识,是自我经验的一部分。这部分再与抽象的我混合在一起,经常产生影响情绪的感应,是为“感情”。
  人因为生命本能的驱使,借助感觉器官对各种变化的认知,而达到趋利避害的目标,此有其行为的必然性。可是又因对主观及客观观念的观察及认知,了解到自我的利害常与环境息息相关,必须对自我的利害作若干妥协,以谋求更大的利益。前者以自我直接的感受为前提,人的行为端视个人当时的利害判断而定,此即“感性”。后者系经过对客观环境的认知,需克制自我,是一种有秩序的反省,故称为“理性”。
  上述的全部观念就是“人性”,因此,只要仿真人类所具有的感觉器官以及人类已经认知的概念基因,将之设计在一个机器上,使之与人类同样或近似地运作。此机器即可具有“人性”以及人的感觉、知觉,而能感人之感、与人类沟通,达到我们预期的目标。
  根据上面的分析,我们可以总结出三个步骤,将一种兼具感性及理性的“拟人计算机”描绘出来。第一步是刺激的认知,第二步是概念思考,最后是知识应用。兹以现有的器材及技术,分成下列五项说明:
  一、硬件结构:控制中枢,分别作反射、判断、运动、记忆及感应中枢等。其中反射中枢独立,余者以判断中枢为主宰。
    内存:可供暂时储存的浅层记忆及永久记忆的装置等。
    感应器:接收视、听、触、味及嗅觉之刺激,供感应中枢分辨。
    外围设备:供动作、行为、发声、显示、电力供应及其它接口。
  二、输入讯号:各种感应的讯号即相当于人所感受的各种刺激,需先加以分析整理,使与所设计的认知资料相符合。
  三、内贮资料:将输入的感应讯号,利用二进制的特征,使每一位直接连通到相关的接口上,即可具有神经信道的效能。同时此类相当于刺激的讯号,可以组成各种认知的资料形式,亦即概念,以便加以应用。
  四、系统程序:由刺激的产生到行为的完成,以及回馈的观察等,可当做系统程序。此外,判断、学习、数据管理、知识库等亦皆需以程序处理。
  五、接口处理:在人的认知中,各种刺激经常同时存在且互为因果,所以各中枢之间的接口,必须配合人体之结构,做联线处理。
后一页
前一页
回目录
回主页