admin管理员组

文章数量:1622541

作者:禅与计算机程序设计艺术

1.简介

什么是机器学习?为什么需要用到机器学习?机器学习是指计算机通过数据编程的方法自动分析、学习并优化一个系统或模型,从而提高其性能、准确性、效率、理解力等方面。由于统计学、数学、工程、计算机科学等多领域知识的综合运用,机器学习技术正在成为当今热门的应用领域之一。近年来,随着大数据的出现,人们对利用机器学习技术进行数据驱动的分析产生了更大的需求。随着人工智能领域蓬勃发展,机器学习将迎来一个全新的时代。

2.基本概念术语

数据集(Dataset): 数据集是指用于训练或者测试机器学习模型的数据集合。每一个数据项都是一个向量(Vector),表示了一个对象的特征。例如,在二维空间中,可以把一个点代表成一个2D向量,每一维分别代表该点的横坐标和纵坐标;在文本分类任务中,每个样本代表一篇文章,向量的每一维对应于文章的一个词或短语。

标签(Label): 每个数据项都有一个对应的标签,也就是预测目标。例如,在图像识别中,标签可以是图片中的物体名称,也可以是图片的内容描述;在文本分类任务中,标签是文章所属的类别。

<

本文标签: 机器入门基础数据技术