- 金融大模型开发基础与实践
- 陈强
- 2304字
- 2025-03-28 10:32:18
1.2 机器学习和深度学习
机器学习和深度学习是人工智能领域的两个关键分支,它们在许多应用中都表现出了显著的性能。下面将详细解释这两个概念以及它们之间的区别。
1.2.1 机器学习
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断完善自身的性能。
机器学习是一类算法的总称,这些算法试图从大量历史数据中挖掘出其中隐含的规律,并用于预测或者分类。更具体地说,机器学习可以看作是寻找一个函数,输入是样本数据,输出是期望的结果,只是这个函数过于复杂,以至于不太方便形式化表达。需要注意的是,机器学习的核心目标是确保学习到的函数式模型不仅能够在已知的训练样本上表现出色,而且更重要的是能够很好地适用于“新样本”或未见过的数据。这种将所学知识或规律应用到新情境下的能力,我们称之为模型的“泛化”能力。
机器学习需要海量的数据来进行训练,并从这些数据中得到有用的信息,然后反馈给真实世界的用户。
举一个简单的例子,当我们在天猫或京东购物的时候,天猫和京东会向我们推送商品信息,这些推荐的商品往往是我们自己很感兴趣的东西,这个过程正是通过机器学习完成的。其实这些推送商品是天猫和京东根据我们以前的购物订单和经常浏览的商品记录而得出的结论。
1.2.2 深度学习
前面介绍的机器学习是一种实现人工智能的方法,而深度学习是一种实现机器学习的技术。深度学习本来并不是一种独立的学习方法,其本身也会用到有监督和无监督的学习方法来训练深度神经网络。但由于近几年该领域发展迅猛,一些特有的学习手段相继被提出(如残差网络),因此越来越多的人将其单独看作一种学习方法。
假设我们需要识别某个照片是狗还是猫,如果是传统的机器学习方法,首先会定义一些特征,如有没有胡须、耳朵、鼻子、嘴巴等。总之,我们首先要确定相应的“面部特征”作为机器学习的特征,以此来对我们的对象进行分类识别。而深度学习的方法则更进一步,它自动地找出这个分类问题所需要的重要特征。那么,深度学习是如何做到这一点的呢?继续以猫狗识别的例子进行说明,步骤如下。
(1)首先通过卷积层检测图像中的边缘和角点等基本特征。这是因为边缘和角点通常包含了关于物体外形和结构的重要信息。在这一阶段,模型试图从原始图像中提取最基本的视觉特征,以便在后续层次中构建更复杂的模式,最终使得猫狗关系的识别更为准确。
(2)然后根据上一步找出的很多小元素(边、角等)构建层级网络,找出它们之间的各种组合。
(3)在构建层级网络之后,就可以确定哪些组合可以识别出猫和狗。
注意:其实深度学习并不是一个独立的算法,在训练神经网络的时候也通常会用到监督学习和无监督学习。但是由于一些独特的学习方法被提出,我觉得把它看成单独的一种学习的算法应该也没什么问题。深度学习可以大致理解成包含多个隐含层的神经网络结构,深度学习的深这个字指的就是隐藏层的深度。
1.2.3 机器学习和深度学习的区别
机器学习和深度学习相互关联,两者之间存在一些区别,主要区别如下。
(1)应用范畴方面的区别
机器学习是一个更广泛的概念,涵盖了多种算法和技术,用于让计算机系统通过数据和经验改善性能。机器学习不仅包括传统的统计方法,还包括基于模型的方法、基于实例的方法等。
深度学习是机器学习的一个特定分支,它基于多层次的神经网络结构,通过学习多层次的抽象表示来提取数据的复杂特征。深度学习关注利用神经网络进行数据表示学习和模式识别。
(2)网络结构方面的区别
机器学习方法包括各种算法,如决策树、支持向量机、线性回归等,它们可以应用于各种任务,不一定需要多层神经网络结构。
深度学习方法主要是基于多层神经网络的结构,涉及多个层次的抽象表示。深度学习的关键是使用多层次的非线性变换来捕捉数据的复杂特征。
(3)特征学习方面的区别
传统的机器学习方法通常需要手工设计和选择特征,然后使用这些特征来进行训练和预测。
深度学习的一个重要优势是它可以自动学习数据的特征表示,减少了对特征工程的依赖,从而能够处理更复杂的数据和任务。
(4)适用场景方面的区别
机器学习广泛应用于各个领域,包括图像处理、自然语言处理、推荐系统等,可以使用不同的算法来解决不同的问题。
深度学习主要在大规模数据和高度复杂的问题上表现出色,特别适用于图像识别、语音识别、自然语言处理等领域。
(5)计算资源需求方面的区别
传统的机器学习方法通常能够在较小的数据集上进行训练和预测,计算资源需求相对较低。
深度学习方法通常需要大量的数据和更多的计算资源。例如,训练一个大型深度神经网络可能需要使用多个GPU。
(6)解决问题方面的区别
在解决问题时,传统的机器学习方法通常先把问题分成几块,一个个地解决好之后,再重新组合起来。但是深度学习则是一次性地、端到端地解决。假如存在一个任务:识别出在某图片中有哪些物体,并找出它们的位置。传统的机器学习的做法是把问题分为两步:发现物体和识别物体。首先,我们有几个物体边缘的盒型检测算法,把所有可能的物体都框出来。然后,再使用物体识别算法,识别出这些物体分别是什么。
但是深度学习不同,它会直接在图片中把对应的物体识别出来,同时还能标明对应物体的名字。这样就可以做到实时的物体识别。
总之,机器学习是一个广泛的领域,涵盖多种算法和技术,而深度学习是机器学习的一个分支,侧重于基于多层神经网络的数据表示学习。深度学习在处理复杂数据和任务时表现出色,但也需要更多的计算资源和数据来训练和部署。
机器学习是实现人工智能的方法;深度学习是机器学习算法中的一种算法,一种实现机器学习的技术和学习方法。