admin管理员组

文章数量:1593932

【NLP】新闻主题分类任务

  • 前言
  • 1. 构建带有Embedding层的文本分类模型
  • 2. 对数据进行batch处理
  • 3. 构建训练与验证函数
  • 4. 进行模型训练和验证
  • 5. 查看embedding层嵌入的词向量
  • 总结

前言

学习目标

  • 了解有关新闻主题分类和有关数据.

  • 掌握使用浅层网络构建新闻主题分类器的实现过程.

  • 关于新闻主题分类任务:

    • 以一段新闻报道中的文本描述内容为输入, 使用模型帮助我们判断它最有可能属于哪一种类型的新闻, 这是典型的文本分类问题, 我们这里假定每种类型是互斥的, 即文本描述有且只有一种类型.

新闻主题分类数据:

  • 通过torchtext获取数据:
# 导入相关的torch工具包
import torch
import torchtext
# 导入torchtext.datasets中的文本分类任务
from torchtext.datasets import text_classification

本文标签: 主题新闻NLP