AI学习笔记整理（四）—— AI入门准备Ⅰ

丝斯2011 · 2025-11-16 18:14:03 发布

人工智能

人工智能（Artificial Intelligence，AI）是研究开发用于模拟、延伸人类智能的理论方法与技术体系，涵盖机器学习、自然语言处理、计算机视觉等核心领域，涉及数学、计算机科学、神经科学等多学科交叉融合。

‌了解人工智能的定义和范畴‌：
- 人工智能（Artificial Intelligence, AI）是指由计算机系统所表现出的智能行为，它涉及机器学习、深度学习、自然语言处理、计算机视觉等多个领域。
‌掌握基础数学知识‌：
- 线性代数：矩阵、向量空间、特征值与特征向量等。
- 概率论与统计学：概率分布、随机变量、贝叶斯定理、假设检验等。
- 微积分：导数、偏导数、梯度、链式法则等，在优化算法中尤为重要。
‌学习编程语言‌：
- Python：因其简洁的语法和丰富的库支持，成为人工智能领域的首选编程语言。
- R：主要用于数据分析和统计建模，在机器学习领域也有广泛应用。

‌机器学习‌：
- 监督学习：如线性回归、逻辑回归、支持向量机、决策树等。
- 无监督学习：如聚类算法（K-means）、降维算法（PCA）等。
- 强化学习：通过奖励或惩罚来学习最优策略，如Q-learning、Deep Q-Network（DQN）等。
‌深度学习‌：
- 神经网络基础：感知机、多层感知机、反向传播算法等。
- 卷积神经网络（CNN）：用于图像识别、目标检测等任务。
- 循环神经网络（RNN）及变体：如LSTM、GRU，用于处理序列数据。
- 生成对抗网络（GAN）：用于图像生成、风格迁移等任务。
‌自然语言处理（NLP）‌：
- 词嵌入：如Word2Vec、GloVe等，用于将单词表示为向量。
- 序列标注：如HMM、CRF，用于词性标注、命名实体识别等任务。
- 机器翻译：基于Seq2Seq模型、Transformer等。

人工智能，机器学习和深度学习之间的关系：

机器学习是实现人工智能的⼀种途径，深度学习是机器学习的⼀个⼦集，也就是说深度学习是实现机器学习的⼀种⽅法。

机器学习和深度学习是人工智能领域的两个核心概念，‌深度学习是机器学习的一个子集‌，两者在技术原理、数据需求、应用场景等方面存在显著差异。‌‌

定义与关系

机器学习是一种通过算法使计算机从数据中自动学习规律并做出决策的广义技术，涵盖决策树、支持向量机等多种方法。深度学习则特指基于深层神经网络（通常包含5层以上隐层）的机器学习方法，其核心优势在于能够自动从原始数据中提取多层次特征，无需人工设计特征工程。‌‌

数据需求与计算资源

‌数据依赖性‌：机器学习算法在小规模数据集上表现良好，例如支持向量机（SVM）通过手工特征选择即可有效避免过拟合。深度学习则需要海量标注数据（如百万级图像）才能充分学习复杂模式，数据量不足时性能可能不如传统机器学习。‌‌
‌计算资源‌：机器学习模型训练可在普通CPU上完成，耗时较短（如XGBoost模型训练仅需数分钟）。深度学习依赖高性能GPU/TPU集群，训练大型模型（如GPT-3）可能需数千块GPU运行数周，计算成本极高。‌‌

模型特性与适用场景

‌特征处理‌：机器学习依赖人工特征工程（如提取房价的面积、位置等特征），而深度学习通过端到端学习自动提取特征，例如卷积神经网络（CNN）从图像中直接学习边缘、纹理等层次化特征。‌‌
‌可解释性‌：机器学习模型（如决策树、逻辑回归）的决策过程透明，易于调试和解释；深度学习模型因结构复杂、参数众多，通常被视为“黑箱”，可解释性较差。‌‌
‌应用场景‌：
- 机器学习更适用于结构化数据（如金融风控、用户画像）和实时性要求高的任务（如工业设备故障预测）。‌‌
- 深度学习在非结构化数据处理中优势明显，如图像识别、自然语言处理、自动驾驶等复杂模式识别任务。‌‌

计算机视觉是一种通过计算机来模拟和理解人类视觉系统的科学和技术。机器学习则是一种通过数据驱动的方法来使计算机能够自主地学习和改进的技术。在过去的几年中，计算机视觉和机器学习的结合成为了一个热门的研究领域，这种结合为许多实际应用提供了有力支持，如自动驾驶汽车、人脸识别、图像识别等。

计算机视觉和机器学习之间的联系在于，计算机视觉需要处理和理解图像和视频数据，而机器学习则可以帮助计算机自主地学习和识别这些数据中的模式和特征。在计算机视觉中，机器学习被广泛应用于图像分类、目标检测、对象识别等任务。

计算机视觉与机器学习相互依存，前者依赖后者提供的算法实现图像理解，后者通过前者的应用场景不断优化模型。

核心关系：相互依赖与促进
计算机视觉（CV）旨在赋予机器视觉感知能力，而机器学习（ML）提供从数据中自动学习规律的方法。两者形成双向驱动关系：

‌ML赋能CV‌：传统CV依赖手工特征提取（如边缘检测），效率有限；ML通过自动学习数据特征，显著提升图像识别、目标检测等任务的精度。例如，卷积神经网络（CNN）直接从像素中提取抽象特征，简化了处理流程。‌‌
‌CV推动ML进步‌：CV产生海量图像/视频数据，为ML模型训练提供丰富资源；同时，CV的复杂需求（如实时物体追踪）促使ML算法优化，如发展更高效的深度学习架构。‌‌

技术融合：深度学习的关键桥梁
深度学习（DL）作为ML的子领域，已成为CV的核心技术，实现端到端学习：

‌模型架构革新‌：CNN通过卷积层、池化层等结构，自动捕捉图像局部特征，取代传统手工特征工程。例如，ImageNet竞赛中CNN模型将图像分类错误率从26%降至3.5%，凸显其优势。‌‌
‌处理流程简化‌：端到端学习统一从输入图像到输出决策的全流程，减少中间步骤（如特征筛选），提升系统效率。例如，自动驾驶中，单一DL模型可同时完成道路检测和障碍物识别。‌‌