人工智能、机器学习与深度学习

Notes for AI/ML/DL

Posted by Jin Xu on November 25, 2024

很多时候分不清人工智能、机器学习、深度学习这几概念的关系,这里描述一下。 人工智能(Artificial Intelligence,AI):指通过模拟、延伸或复制人类智能的能力,使计算机系统具备类似人类思维、学习、推理和问题解决等能力的一门学科。

机器学习(Machine Learning,ML):是人工智能的一个分支,它关注如何通过从数据中学习模式和规律,使计算机系统能够在不进行明确编程的情况下改善性能。

深度学习(Deep Learning):是机器学习的一种特殊形式,它基于人工神经网络(Artificial Neural Networks,ANN)的概念,通过多层次的神经网络结构(深层网络)来学习数据的表示和特征。

AI示意图

人工智能(Artificial Intelligence, AI)

人工智能是一个广义概念,目的是赋予计算机系统以模仿、模拟或延伸人类智能的能力。AI 可以分为以下几类:

  1. 弱人工智能(Narrow AI): 解决特定任务的人工智能,无法超出特定领域。
    • 示例:语音助手(Siri、Alexa)、推荐系统(Netflix、Amazon)。
  2. 强人工智能(General AI): 能在多个领域表现出类人水平的智能,目前仍是理论研究方向。
    • 示例:通用机器人(尚未实现)。
  3. 超人工智能(Super AI): 超越人类智能的AI,是未来假设,涉及伦理和安全问题。

机器学习(Machine Learning, ML)

机器学习是人工智能的重要分支,通过从数据中学习规律来改进性能,而无需明确的规则编程。其核心是建立模型,并根据数据优化模型。

机器学习的核心流程

  1. 数据收集: 获取相关数据集(如文本、图像、传感器数据)。
  2. 数据预处理: 清洗数据、处理缺失值、标准化数据。
  3. 特征工程: 提取有意义的特征,提升模型性能。
  4. 选择算法: 根据任务选择适合的学习算法。
  5. 模型训练: 利用数据调整模型参数。
  6. 模型评估: 使用测试数据衡量模型性能。
  7. 模型部署: 将模型应用于实际问题。

机器学习的分类及示例

1. 监督学习(Supervised Learning)

特点: 数据集中包含输入(特征)和输出(标签)。模型通过学习输入和输出的映射关系来进行预测。

  • 分类任务(Classification):
    • 示例:
      • 垃圾邮件检测: 根据邮件内容分类为“垃圾邮件”或“非垃圾邮件”。
      • 图像识别: 根据图像内容识别为“猫”“狗”或“鸟”。
    • 常用算法:
      • 决策树、支持向量机(SVM)、逻辑回归、随机森林、神经网络。
  • 回归任务(Regression):
    • 示例:
      • 房价预测: 根据面积、位置等特征预测房价。
      • 股票价格预测: 根据历史数据预测未来走势。
    • 常用算法:
      • 线性回归、岭回归、Lasso回归、梯度提升回归(GBR)。

2. 无监督学习(Unsupervised Learning)

特点: 数据集中没有标签,模型试图发现隐藏模式或数据结构。

  • 聚类任务(Clustering):
    • 示例:
      • 客户分群: 将顾客分成不同的群体,以制定精准营销策略。
      • 图像分割: 将图像像素分成不同区域(如天空、建筑物)。
    • 常用算法:
      • K-means、层次聚类、DBSCAN。
  • 降维任务(Dimensionality Reduction):
    • 示例:
      • 主成分分析(PCA): 从高维数据中提取主要特征。
      • t-SNE: 可视化高维数据。
    • 应用:
      • 压缩数据规模,加快计算速度。
      • 数据可视化。

3. 半监督学习(Semi-Supervised Learning)

特点: 结合少量标记数据和大量未标记数据进行训练,适用于标记数据昂贵或稀缺的场景。

  • 示例:
    • 图像分类: 在少量标记图片的指导下分类大量未标记图片。
    • 文本分类: 在已标注情感的少量文本基础上分类未标注数据。
  • 算法:
    • 自训练(Self-training)、一致性正则化(Consistency Regularization)。

4. 强化学习(Reinforcement Learning, RL)

特点: 模型通过与环境交互,根据反馈(奖励或惩罚)学习最优策略。

  • 示例:
    • AlphaGo: 学习围棋策略,击败人类顶尖棋手。
    • 自动驾驶: 根据道路环境调整驾驶决策。
    • 游戏AI: 在《Dota 2》《星际争霸》等游戏中表现出超人水准。
  • 关键概念:
    • 状态(State): 系统当前的状态信息。
    • 动作(Action): 可采取的行动。
    • 奖励(Reward): 动作的即时反馈。
    • 策略(Policy): 决定下一步行动的规则。

深度学习(Deep Learning, DL)

深度学习是机器学习的一个子领域,通过多层神经网络(人工神经网络,ANN)学习复杂数据的特征表示

深度学习的优势

  • 处理非结构化数据(如图像、语音、文本)。
  • 能自动提取复杂的特征,不需要手动设计。

深度学习的主要模型

  1. 卷积神经网络(CNN):
    • 用于处理图像数据。
    • 示例:
      • 图像分类: ResNet、VGG。
      • 目标检测: YOLO、Faster R-CNN。
  2. 循环神经网络(RNN):
    • 处理序列数据(如时间序列、文本)。
    • 示例:
      • 语音识别: Siri、Google Assistant。
      • 文本生成: GPT 系列。
  3. 生成对抗网络(GAN):
    • 用于生成数据。
    • 示例:
      • 图像生成: 生成虚拟人脸(如DeepFake)。
      • 艺术风格转换: 将照片转换为画作风格。
  4. 变换器(Transformer):
    • 处理自然语言和图像任务。
    • 示例:
      • 机器翻译: Google Translate。
      • 聊天机器人: ChatGPT。

实际应用场景总结

领域 应用案例
医疗健康 疾病预测(糖尿病风险)、医学影像分析(肿瘤检测)、药物研发(蛋白质折叠预测)。
金融服务 反欺诈检测、信用评分、股票市场预测、量化交易。
交通运输 自动驾驶(Tesla)、路径优化(物流配送)、车流量预测。
制造业 预测性维护(设备故障预测)、质量检测(产品缺陷识别)。
娱乐 推荐系统(Netflix、Spotify)、游戏AI(游戏角色设计、策略优化)。
教育 智能辅导系统(个性化学习建议)、试卷自动评分。
零售与电商 个性化推荐(产品推荐)、库存管理(需求预测)、顾客情绪分析(客服聊天记录分析)。

总结

人工智能通过机器学习技术推动了各领域的自动化和智能化,尤其是深度学习的崛起,使得AI在复杂任务中取得了突破性进展。监督学习适合有明确目标和标签的任务,无监督学习则用于探索隐藏模式,强化学习则在策略优化中展现强大能力。结合应用场景,机器学习和深度学习已成为现代技术发展的重要驱动力。