前言:机器学习作为人工智能(AI)的核心分支,是连接数据与智能决策的关键技术,已广泛应用于图像识别、自然语言处理、推荐系统等多个领域。但对于初学者而言,机器学习的概念体系庞杂、术语抽象,极易陷入“只知其然,不知其所以然”的误区。

想要了解机械学习名称来源的读者可以看这篇文章,其内容在本文不再做赘述:人工智能先驱阿瑟·萨缪尔:机器学习与跳棋程序的开创者-CSDN博客

一、机械学习的定义

机械学习是一门多领域的交叉学科,同时也有相当多的定义,以下定义可供理解参考:

1.1百度(由中国科学院大学人工智能学院 参与编辑并审核,经科普中国·科学百科认证)

机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

它是人工智能核心,是使计算机具有智能的根本途径。

机器学习是一种通过算法和模型使计算机从数据中自动学习并进行预测或决策的技术,属于人工智能的一个分支。其核心目标是让计算机在没有明确编程指令的情况下,通过对大量数据的分析,识别模式和规律,从而构建适应新数据的模型。机器学习包括监督学习、无监督学习和强化学习等不同类型,广泛应用于图像识别、自然语言处理、推荐系统和自动驾驶等领域,具备自适应、自动化和泛化能力,是数据驱动的技术创新。

2.2Tom Mitchell(卡内基梅隆大学的计算机科学教授)

如果计算机程序在完成某类任务T时,通过经验E在某一表现度量P下的表现有所提高,则称该程序从经验E中学习。

2.3Arthur Samuel(机械学习之父,人工智能的先驱)

机械学习赋予计算机在无需在显性编程环境下就可以具备学习能力即在没有明确编程指令下学习能力的研究领域。

二、机械学习概念

2.1数据、模型、训练、算法四者的关系和概念

本段引用我老师课件里的话,鄙人不才想不出比我老师课件更生动的文字来描述。

“数据”:对应于人类的经验;是机器学习的基础,所有学习行为都依赖于数据的输入,没有数据,算法和模型就无法发挥作用。

“模型”:对应于人类总结出的规律(即习得的结果);是数据规律的载体,通过训练过程从数据中学习得到,可用于对未知数据进行预测或决策。

“训练”:对应于人类通过经验归纳出规律的过程;是利用已有数据,通过算法调整模型参数,使模型能够准确捕捉数据中隐藏规律的过程。

“算法”:对应于人类归纳规律时所用的方法。是指导模型从数据中学习的一套规则和步骤,决定了模型如何利用数据进行训练、如何调整参数,不同算法适用于不同类型的任务和数据。

2.2人工智能、机械学习、机械学习之间的关系

三者的包含关系很简单,

用数学符号表示就是:人工智能⊃机器学习⊃深度学习

用中文文本表示就是:深度学习是机器学习的一部分,而机器学习是人工智能的一部分。

补充:人工智能是一个宽泛的领域,核心是让计算机具备类人智能;机器学习是实现人工智能的核心技术路径之一(并非唯一路径);深度学习是机器学习的一个细分分支,以神经网络为核心,通过深层网络结构处理复杂数据,是当前机器学习领域最热门、应用最广泛的方向。

三、机械学习应用领域

机器学习的应用场景已渗透到各行各业,核心应用领域主要包括以下三类,后续可根据需求补充具体场景案例:

  1. 计算机视觉:核心是让计算机“看懂”图像和视频,典型应用包括图像识别(如人脸解锁、物体检测)、图像分割、人脸识别、自动驾驶视觉感知等。

  2. 语音识别:实现计算机对人类语音的识别和理解,典型应用包括语音输入、语音助手(如 Siri、小爱同学)、语音转文字、实时语音翻译等。

  3. 自然语言处理(NLP):让计算机理解和处理人类语言,典型应用包括文本分类、情感分析、机器翻译、聊天机器人、文本生成(如文案创作、摘要生成)等。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐