设为首页 | 收藏本站
185 1521 8668

AI的7个级别

发表时间:2025-04-14 09:16作者:Together规则引擎
文章附图

现在有无数文章令人喘不过气来谈论“AI”,其中绝大多数都在谈论一种AI,即使用神经网络执行的某种形式的机器学习。这几乎不是人工智能的唯一形式,甚至远非最先进的形式。此外,还有一些令人窒息的高级情报文章,我只能说它们是纯粹的科幻小说。

当我们观察到基于计算机的工具日益复杂时,我觉得是时候区分不同级别的人工智能了。首先,我认为AI可以大致分为两类:

1.让计算机的行为像人类一样。

2.让计算机比人类更智能。

让计算机“表现得像人类”通常等同于高水平的智能,因为人类代表了最智能的生命形式。对于主要类别的非结构化问题,我认为这是正确的。然而,在一些结构良好的问题中,计算机可以胜过人类——找到通过交通网络的最短路径就是一个简单的例子。

下面我定义了七个层次的智能。级别1包括基于规则的基本逻辑。2、3和4级都是监督式机器学习的一种形式,这就是(今天)媒体提到“人工智能”时的典型含义。1-3级被广泛使用,而4级(如ChatGPT)似乎正在迅速采用。监督式机器学习需要训练数据集,因此需要尝试模仿观察到的行为的技术。

级别5和6都是优化问题的形式,这意味着它们专注于做出决策,而不仅仅是预测或匹配模式。这些也被广泛使用,尽管它们并不总是与“人工智能”相关联。然而,这些是机器在结构良好的问题上可以胜过人类的唯一级别。

第7级是我们达到人类推理、创造力和判断力的最高级形式的地方。现有的“AI”技术都无法达到这个级别,这是有具体技术原因的。ChatGPT等大型语言模型被描述为在这个级别上执行,但这只是因为它模仿了人们产生的单词模式。5级和6级只能处理结构良好的问题,这些问题可以将问题的所有物理特性编码到计算机中。

AI1.png

1级基于规则的逻辑

基于规则的逻辑(或者,“基于规则的符号推理”)是1960年代和1970年代出现的“AI”的第一种形式,并引起了人们对计算机可以做什么的最初兴趣激增。随着计算机在1980年代变得更加强大,这种逻辑被“专家系统”捕获。

基于规则的逻辑涉及由人类指定的规则,并编码到逻辑中。简单的例子包括“如果你吃红肉,那就喝红酒”,但病例数量很快就激增,就像健康方面发生的那样:“一个60岁以上的男性患者,血糖高,不吸烟,父母没有糖尿病,......,应该遵循这种[多维]饮食。

基于规则的逻辑并没有接近满足AI的早期期望,但基于规则的逻辑远非完全失败(正如曾经认为的那样),基于规则的逻辑在整个现代机器智能中得到应用。目前有许多商业“规则引擎”被广泛使用。

2级基础机器学习

这包括使用查找表、参数模型(包括线性或非线性模型和神经网络)或非参数模型的已知统计模型。这些方法最早出现在1900年代初期,在统计学的保护伞下,但随着计算机变得更加强大(计算机科学家使用“机器学习”的名称进入该领域)急剧增长。最常用的模型是线性模型(在参数中),捕获输入变量(也称为解释变量或自变量,或“协变量”)与响应之间的基本关系。例如,我们可以使用带有价格平方和价格对数等变体的价格作为输入,来预测需求的响应。随着非线性模型(例如逻辑回归和早期神经网络)和非参数模型(使用局部近似)的引入,这些模型逐渐成熟。神经网络自1970年代以来一直很流行,并广泛用于许多非线性(确定性)估计问题。

Ai2.png

3级使用深度神经网络进行模式识别

研究界自1960年代以来一直在研究神经网络,但从2010年左右开始,深度神经网络的使用以及大型数据集的可用性,才在模式识别方面产生了第一个真正的突破。当“AI”在2010年代出现用于语音识别、面部识别和图像识别时,这就是“AI”现代使用的基础。

AI3.png

使用深度神经网络的模式识别只是非线性建模的另一种形式,但它将机器学习带入了一类全新的应用,为机器学习领域带来了远超第2级所述工作所达到的可见性水平。

级别4大型语言模型

2023年,随着ChatGPT的推出,使用超深度神经网络学习语音模式突然进入公众视野,该研究建立在自2000年代(尤其是2010年后)以来不断发展的研究之上。

AI4.png

尽管大型语言模型可以被视为仅用于模式识别的深度神经网络的扩展,但考虑到语言问题复杂性的急剧增加(LLM需要更多的数据准备),以及用于支持此问题设置的神经网络(以及用于训练它们的训练数据集)的规模急剧增长,我为此应用程序保留了整个级别。与模式识别不同,模式识别中“这个模式是什么”的“答案”是确定性的,LLM处理更丰富的输入,并且可以为单个查询生成一系列输出(这意味着它具有随机响应)。有些人将其创建自己的单词和短语序列的能力等同起来,但它只不过是在训练数据集中发现的模式之间的随机化。

AI5.png

LLM(例如ChatGPT)通常与一个更广泛的类别相关联,称为“通用人工智能”,其中包括针对非结构化问题的更通用的学习形式。我将这些功能放在Level7中。我将4级限制在必须训练的技术上,这意味着它仍然是一种监督学习形式。这意味着LLM将始终生成训练数据集中使用的单词和短语。正是出于这个原因,支持这项技术的公司不仅在使用海量数据集进行训练方面投入了大量资金,而且还积极使用人员来指导神经网络的行为。

关于LLM的潜在危险已经有很多炒作。LLM的唯一危险是错误信息,这意味着任何损害仍然来自人们。当然,今天的互联网上不乏错误信息,因此我们可以希望现代社会已经发展出对错误信息的防御措施,但这是我们必须意识到的。

级别5确定性优化

与机器学习模型不同,确定性优化依赖于问题的显式模型,该模型包括问题的物理特性和性能指标。模型的输入包括可控参数,也称为行动或决策。使用复杂的算法搜索可行区域以优化性能指标。

AI6.png

与必须使用训练数据集进行训练的基于机器学习的技术(2-4级)不同,确定性优化不涉及任何训练。相反,它使用一个问题模型来捕获底层应用程序的物理特性,以及一个允许我们评估决策的性能指标。然后,使用算法搜索可实施的最佳决策,并优化指定的性能指标。例如,在1990年代,出现了用于安排航空公司的工具,这些工具能够制定更高效的时间表。运筹学界有无数这样的成就例子。

机器学习中出现一类确定性优化问题。问题在于找到最佳参数集,以最小化参数化函数(通常称为模型)和一组观测值(训练数据集)之间的差异。使用神经网络解决问题(需要解决将神经网络拟合到训练数据集的优化问题)与使用优化模型优化某些问题(基于模型的优化)经常会让人感到困惑,但它们在本质上是不同的。

与基于训练的机器学习不同,基于模型的优化能够产生比任何人都能实现的更好的解决方案。这种性能的代价是我们必须投入时间来创建计算机内部物理问题的模型。请注意,神经网络并不直接捕获问题的物理特性;相反,它尝试通过训练数据集学习适当的行为。

统计模型(如神经网络)和优化模型之间的主要区别在于目标函数。将统计模型拟合到训练数据集时,目标始终是最小化某些距离度量(例如模型和训练数据集之间之差的平方和)。相比之下,优化模型要求分析人员指定目标函数,以及捕获问题属性的约束。

6级顺序决策问题

在这里,我们解决的问题由序列

决策,信息,决策,信息,...

鉴于尚未到达的信息的不确定性,必须做出决策。优化问题是找到做出决策的最佳方法(称为策略)。顺序决策问题的特殊情况包括:

决策,信息(这描述了经典的随机搜索问题)

决策,信息,决策(这描述了两阶段随机规划问题)。

更一般的问题具有延伸到有限或无限视野的“决策、信息”序列。

而确定性优化问题则寻找最佳决策x(通常是一个向量),顺序决策问题需要搜索一个函数 称为策略(指定为“π”),这是一个将state变量中的信息映射St到一个决策。对于顺序决策问题,决策可以是二进制、离散、标量连续或任何类型的向量。挑战在于,根据某些指标(通常是预期,这意味着我们正在优化平均性能),策略必须随着时间的推移运行良好。

AI社区(计算机科学)在“强化学习”的旗帜下研究这个问题,但大约有15个不同的领域,每个领域都有一本书或多本书,使用8种不同的符号系统。这种多样性反映了顺序决策问题的巨大丰富性。

顺序决策问题代表了确定性优化模型的重要扩展。与确定性优化一样,顺序决策问题需要对问题的物理和动力学进行建模,并包括一个性能指标,使我们能够确定最佳决策。解决SDP问题通常使用机器学习,但与确定性优化一样,搜索策略不需要训练数据集。因此,顺序决策问题可以产生优于人们的行为。这就是计算机科学如何能够创建优于训练有素的专家的国际象棋和电脑围棋程序的原因。其他应用可以在最佳控制(例如着陆SpaceX)和优化卡车车队中找到。

5级和6级都是一种优化形式,可以生产出优于人类的工具。这些问题可能相当复杂,要么是由于规模(例如规划航空公司时刻表),要么是由于顺序决策问题固有的复杂性。但是,这些适用于结构良好的问题,其属性可以由数学模型完全指定。

我们将顺序决策问题放在单独的级别中,因为它们需要一种完全不同的优化问题思考方式。而不是确定单个向量x,我们现在必须搜索函数(称为“策略”),就像我们在机器学习中所做的那样。但是,顺序决策问题的策略分为四个基本类别:

l 策略函数近似值(PFA)–这些是将状态变量中的信息映射到决策的函数。

l 成本函数近似(CFA)–这些是(通常是确定性的)优化模型的参数化版本。

l 值函数近似值(VFA)–这些是基于贝尔曼方程近似值的策略。这就是大多数人与强化学习(也称为近似动态规划)联系在一起的内容。

l 直接前瞻近似(DLA)–这些策略基于求解近似前瞻模型。

第一类PFA包括可能用于机器学习的所有函数,包括查找表、线性或非线性模型(包括神经网络)和非参数模型。混合策略可以从上述两个、三个甚至所有四个策略的组合中创建。

下面的图片将机器学习(左侧)与顺序决策问题(右侧)进行了比较。机器学习会搜索最佳函数(统计模型)来匹配训练数据集。顺序决策问题还会搜索函数(策略)以优化某些性能指标,给定一个描述状态变量如何随时间演变的转换函数。机器学习搜索三种类型的函数(查找表、参数模型和非参数模型),而顺序决策问题搜索四类策略,其中第一类包括可能用于机器学习的任何函数。

AI7.png

7级科幻小说

我们将7级保留给需要最高智能水平的非结构化问题。我认为这是纯粹的科幻小说——很容易推测,但我就是看不出开发如此先进技术的经济合理性(想想培训不具备任何这些能力的LLM的成本)。这并不意味着计算机科学家不会尝试声明这些行为(因为有些人试图将这些功能归因于LLM),但我不认为它会发生。除非对人们有显着的经济利益,否则技术(尤其是昂贵的技术)不会发生。

AI8.png

这些最高智能水平的一些示例包括:

l 知识表示反映了描述定义不明确的问题的能力。例如,我们可能有一个机器人需要在城市地区、沙漠或满是家具的房间里找到自己的路。机器人需要描述它所在的区域,并确定需要回答的适合上下文的问题。然后,需要以机器人可以完成某些目标的方式组织这些信息。

l 创造力–优化涉及从一组定义明确的决策中找到最佳,其中一组决策被清楚地阐明,并带有可用于评估不同决策的绩效指标。当我们有绩效指标但可能没有指定可用的决策时,需要创造力。例如,我们可能希望减少COVID死亡人数,但没有一套明确定义的行动(或决定)。在英语中,一种新型的决策被称为“idea”。

l 判断–针对更简单、结构良好的问题的决策具有明确的指标(赢得比赛、最大化利润、治疗医疗状况),但有些问题涉及复杂的判断,例如选择是否转向以避免撞到骑自行车的人,但将汽车送入另一辆车的路径,或者是否轰炸也会杀死平民的军事目标。

l 推理–这需要能够思考实现目标的不同步骤。虽然这是在结构良好的问题的背景下在5级和6级完成的,但推理需要能够思考结构较少或完全非结构化的步骤。这不能使用大型语言模型来完成,因为这些模型的唯一目标是最小化“预测词”和“实际词”之间的差异,而推理需要结合其他目标的能力。

认识到LLM可以产生人类可能会解释为表现出7级行为的单词序列,这一点非常重要,而LLM所做的只是在训练数据集中复制单词模式。当LLM被判断为表现出更高的智力时,只有人类得出结论,这些词表示创造力和推理等能力。我的观点是,这只是一厢情愿。

笔记:

我选择了人工智能的三个级别,2、3和4,它们都涉及监督式机器学习,并且这三个级别都可能包括神经网络的使用。这就提出了一个问题,为什么这些处于不同的级别。原因是机器学习技术,尤其是神经网络的使用,处于完全不同的层面,从基本神经网络到用于模式识别的深度神经网络,再到用于大型语言模型的超深度网络。

更重要的是,正在考虑的问题之间存在巨大差异。2级是自1900年代初以来一直研究的一组熟悉的估计问题。相比之下,第3级解决了各种模式识别问题,这些问题表现出与第2级中解决的问题完全不同的结构。此外,正是由于这些模式识别问题,深度神经网络在2000年代初期变得突出,从而创造了现在人们所说的“AI”的含义。

我为最近才出现在公共舞台上的大型语言模型创建了一个全新的级别,即级别4。我将其放在一个新的水平上,原因有两个:a)神经网络比模式识别问题大得多,需要更多的训练,以及b)大型语言模型作为一种应用程序与第3级中的模式识别问题有着根本的不同。单词模式要复杂得多,由一组单词组成的响应(在机器学习文献中通常称为“标签”)也要多样化得多(我们会说响应是“随机的”)。

优化以5级和6级表示,它与机器学习有着根本的不同,因为它不使用训练数据集。相反,优化需要要优化的问题的模型,以及定义明确的决策。

今天媒体中几乎所有对“人工智能”的使用都是指监督机器学习的使用,其中训练数据集用于估计函数,使其模仿数据。这可能涉及将需求估计为价格的函数(第2级),将图片识别为花朵(第3级),或根据一组输入“预测”某人可能会说什么(第4级)。这就提出了一个有效的问题:模仿可以是真正的智能吗?

我们经常将真正的人类智能与爱因斯坦发明广义相对论或推导出E=mc^2等例子联系起来。或者,也许是硅基晶体管的发明取代了真空管。新闻界的文章不断强调人工智能做出战略军事决策的潜力,这需要7级的技能。显然,这些都是非常高的智力水平的例子。

可以说,大多数人类的日常行为,当然需要智力,代表了一种模仿形式。虽然大学渴望教授更高层次的思维,但我们的教育系统建立在教学生如何写得好、如何解决结构良好的问题以及在某些情况下该怎么做的基础上。医学院和医学文献以教授“医疗协议”(即在特定情况下做什么)为主。所有这些都是模仿。在这种背景下,涌现出一些表现出真正独立思考的学生。

关于更高级的智能形式,如“通用人工智能”,有相当多的讨论。新闻界有数不胜数的书籍和文章讨论“人工智能”,就好像机器已经实现了我们所说的7级智能。据我们所知,没有计算机显示出真正的7级智能。我在实践中看到的所有工具都属于前六个级别。

精选文章
公众号
关于我们
联系方式
让您的业务更自动化、智能化!
联系邮箱:   zhangy@jee-soft.cn       wangyl@jee-soft.cn
185 1521 8668
183 3562 2627
联系电话: