主要的无监督学习方法
聚类(Clustering)如何将教室里的学生按爱好、身高划分为5类?
降维( Dimensionality Reduction )如何将将原高维空间中的数据点映射到低维度的空间中?
关联规则( Association Rules)很多买尿布的男顾客,同时买了啤酒,可以从中找出什么规律来提高超市销售额?
推荐系统( Recommender systems)很多客户经常上网购物,根据他们的浏览商品的习惯,给他们推荐什么商品呢?
机器学习的大多数应用都是基于有监督学习的,但是绝大多数可用数据都没有标签:具有输入特征X,但是没有标签y。
聚类:识别相似实例并将其分配给相似实例的集群或组。就像在分类中一样,每个实例都分配给一个组。但是与分类不同,聚类是一项无监督任务。聚类是很好的工具,用于数据分析、客户细分、推荐系统、搜索引擎、图像分割、半监督学习、降维等。
聚类的应用
客户细分:
你可以根据客户的购买记录和他们在网站上的活动对客户进行聚类。这对于了解你的客户是谁以及他们的需求很有用,因此你可以针对每个细分客户调整产品和营销活动。例如,客户细分在推荐系统中可以很有用,可以推荐同一集群中其他用户喜欢的内容。
数据分析:
在分析新数据集时,运行聚类算法然后分别分析每个集群。
异常检测(也称离群值检测):
对所有集群具有低相似度的任何实例都可能是异常。例如,如果你已根据用户行为对网站用户进行了聚类,则可以检测到具有异常行为的用户,例如每秒的请求数量异常。异常检测在检测制造生产线中的缺陷或欺诈检测中特别有用。国家反诈APP、金融欺诈。
搜索引擎:
一些搜索引擎可让你搜索与参考图像相似的图像或者相似问题。社交网络比如在社交网络的分析上。已知你朋友的信息,比如经常发email的联系人,或是你的微博好友、微信的朋友圈,我们可运用聚类方法自动地给朋友进行分组,做到让每组里的人们彼此都熟识
更多推荐
day15--机器学习--聚类(1)
发布评论