机器学习揭秘:从汤姆·米切尔定义到现代AI浪潮中的角色与挑战
机器学习是一种学习算法,它能够让机器依据历史经验自动进行自身的改进。——汤姆·米切尔(Tom ), 《机器学习》,1998年
什么是机器学习
现在,在大家的眼中,有了“人工智能”,那些掌握了“机器学习”或者“神经网络”的电子系统,仿佛有了能够自己学习进化的可能性,仿佛有了能够独立思考解决问题的可能性,甚至仿佛有了超越人类的无限智慧与魔力。
大家提起拥有智能的机器时,常常怀有科幻小说般的神秘与敬畏之感。一方面,会忍不住对未知充满憧憬,渴望从钥匙孔去窥探那潘多拉盒子里藏着何种秘密;另一方面,又会担心打开这个盒子后,会放出人类无法掌控的可怕力量。
在第三波人工智能浪潮中起到重要作用的“机器学习”,究竟是什么呢?又该怎样对其进行准确的定义呢?
图灵在《计算机器和智能》里首次提出了“学习机器”的概念。他以极具预见性的眼光洞察到,能否实现人工智能,关键很可能就取决于能否或者说何时能够解决“如何让机器拥有学习能力”这个问题。
人们曾经试图避开“机器学习”这一障碍,尝试充分发挥机器自身的特长,比如高速的计算能力和海量的存储能力。他们通过用逻辑符号进行推理来模拟替代人脑的思考,以及用人工总结并在外部给机器灌输知识等方式,去探寻获得智能的可能性。然而,所有的尝试都遭遇了极大的困难,并且都没有取得明显的突破。
自然界有无穷无尽的自然规律,人类历史发展达数千年积累了庞大知识。相比之下,机器引以为傲的运算速度和人类总结灌输知识的效率都很微不足道。
经过多种方向的探索尝试,如今的人工智能主流研究方向,又重新回到了专注于“如何让机器学会‘学习’”这一课题上。人工智能的学者们普遍已经认可,必须让机器具备通过历史数据来修正和改进自身的能力,以及具备接受外界输入的刺激并实现自我进步的能力,这才是迄今为止最有希望能够通向人工智能的路径。
正确认识机器学习
机器学习并非魔法。它也不是科幻想象里那种能将机器从一张白纸逐步教育成智慧机械生命的神奇方式。它其实与人类从懵懂到睿智的教育过程几乎毫无相同之处。这里的“学习”是取其“从经验中自我改进”的意思。
机器学习问题通常需要处理者依据实际问题的特点以及自身的经验来进行解决。所以,常常会因为模型决策函数、参数以及结构的选择不合适,优化策略或者算法存在问题,训练数据不够充足等原因,使得机器学习程序往往不能交付让人满意的结果。
1959 年司马贺提出了第一个在学术上符合今天机器学习思想定义的观点:如果某个系统能够从经验中提升自身能力,那这就是学习的过程。
这句话简洁且有力,直接点明了机器学习最本质的特征,即从经验中改进自身。
1998 年,卡内基梅隆大学的汤姆·米切尔教授在他所撰写的《机器学习》一书中,对司马贺的定义作出了一系列的补充,并且额外增添了几个具有可操作性的辅助描述符号,其英文原文部分如下:
按照中文语言习惯来解读的话,这个定义的意思是:如果有某项评价指标能够作为系统性能的度量,简称为 P;并且这个指标在某类任务 Task 的执行过程中,随着经验 E 的增加能够不断自我改进;那么我们就把这个过程“<P, T, E>”称作一种学习行为。这个定义明确列出了“任务 T”“度量 P”“经验 E”以及“学习过程<P, T, E>”这些符号,读起来有些拗口。然而,这些符号是必要的,它们构成了机器学习一种最基础的形式体系。只要再结合几个具体例子,就能让这个定义变得形象。
人工智能备受关注的“汽车自动驾驶”应用方向中,机器学习通过衡量各种路况下正确驾驶操作的概率(度量 P)来评估系统性能。在不同路况的行驶任务 T 里,无人车是基于机器学习训练出的模型来实现自动驾驶的,而非依靠程序员的代码编程去判断各种路况。因为程序编码几乎难以穷举所有可能的路况,所以必须依据长期行驶的路况和操作记录的分析结果,按照人类对各种路况应对的操作经验(经验 E)来修正驾驶模型,之后由这个模型来决定在图像、速度等传感器提供的信息下,机器应采取何种正确的驾驶操作。
这个机器学习的定义和例子是从其本质出发的,是从它“是什么”以及要“做什么”的角度来对机器学习这个概念进行解释的。
有一种在教科书中常见的表达形式,它从机器学习的过程元素开始,把机器学习分解为学习其执行过程中的三个部分,从机器学习是“怎么做”的角度来对它的概念进行定义。
李航老师的《统计学习方法》一书提出,机器学习由三个要素构成,分别是“模型”“策略”和“算法”。
机器学习=模型+策略+算法
机器学习所要产出的内容被称为模型,它通常以可被计算的决策函数或者条件概率分布函数的形式呈现。将未知的新数据代入这个模型进行计算,便能得到与真实情况相符的输出结果。
策略是指学习所应遵循的准则,具体而言是选择出最优模型所依据的准则。从宏观角度来看,通常我们会把“减少模型的输出结果与真实情况的差距”当作学习的准则,这里的“差距”是以可被计算函数的形式来呈现的,此函数被称作“损失函数”。
算法指的是凭借历史数据,将正确模型中所包含的未知参数全部找出。确定寻找最优模型的策略之后,机器学习的问题就转化为寻找模型最优参数的优化问题。
用“怎么做”的方式去解释和理解机器学习,能让其具有更丰富的可操作性。在本章稍后讲解机器学习如何训练模型的实战部分,会延续这个思路,深入探究机器学习的工作过程,进而继续讨论机器学习模型、策略和算法的相关内容。
接下来,我们将系统性地去探讨一系列与机器学习相关的话题。我们希望在讨论过程中能够获得该领域里某些关键问题的答案。如果你对以下这 4 个问题很感兴趣,那么欢迎你在《智慧的疆界:从图灵机到人工智能》这本书中继续去了解。
1)机器学习是什么?有什么价值?
2)它能解决哪些问题?
3)它会经过哪些步骤来解决这些问题?
4)如何验证评估它的解决的效果?
这本书豆瓣评分是 9.1。它针对人工智能的奠基人物进行了详细介绍。它针对人工智能的历史事件进行了详细介绍。它针对人工智能的运行原理进行了详细介绍。它针对人工智能的未来发展进行了详细介绍。全面解答了我们关于人工智能所需了解的各方面问题。全文通俗易懂。全文逻辑清晰。全文语言诙谐。全文可读性强。
一本书,带你揭开人工智能的神秘面纱。
即使是小白,也能从一无所知到全面理解人工智能!
看完之后,你会发觉人工智能不再显得神秘。并且,你也无需再为被人工智能所替代而感到焦虑。
周志明老师是一位超级神秘的畅销书作者。他的书重印了 40 多次。他的书累计卖出了价值几千万的量。
他既是机器学习技术专家,又是企业级开发技术专家。他有一本畅销书,这本书被号称“Java 程序员人手一本”,可以称得上是“书红人不红”的典型。
本文使用内容已获得机械工业出版社授权。
页:
[1]