admin管理员组文章数量:1623789
作者|ANALYTICS VIDHYA 编译|Flin 来源|analyticsvidhya
介绍
数据科学(机器学习)项目为你提供了一种有前途的方式来启动你在该领域的职业。你不仅可以通过应用它来学习数据科学,还可以在自己的简历上展示一些项目!
如今,招聘人员通过他/她的工作来评估应聘者的潜力,而不是将重点放在认证上。如果你没有什么东西可以告诉他们,那也没关系!这是大多数人挣扎和错过的地方。
你以前可能曾处理过几个问题,但是如果你无法使其表现得那么好且易于解释,那么究竟有什么人会知道你的能力呢?这些项目将为你提供帮助。想想你将花费在这些项目上的时间,例如培训课程。练习花费的时间越多,你就会变得更好!
我们确保为你提供不同领域的各种问题。我们认为,每个人都必须学习如何巧妙地处理大量数据,因此其中包括大型数据集。另外,我们确保所有数据集都是开放的并且可以自由访问。
有用的信息
为了帮助你确定从何处开始,我们将该列表分为3个级别,即:
初级: 此级别包含相当容易使用的数据集,并且不需要复杂的数据科学技术。你可以使用基本回归或分类算法来解决它们。而且,这些数据集有足够的开放教程来帮助你入门。在此列表中,我们还提供了可帮助你入门的教程。你还可以同时查看AV的“数据科学入门 ”课程!
- http://courses.analyticsvidhya/courses/introduction-to-data-science-2
中级:此级别包含本质上更具挑战性的数据集。它由中型和大型数据集组成,需要一些认真的模式识别技能。此外,功能工程将在这里有所作为。机器学习技术的使用没有限制;阳光下的一切都可以使用。
高级:此级别最适合理解高级主题(如神经网络,深度学习,推荐系统等)的人员。此处还提供了高维数据集。另外,这是时候发挥创造力了。查看最佳数据科学家将其带入他们的工作和代码的创造力。
目录
初级
- 虹膜数据
- 贷款预测数据
- Bigmart销售数据
- 波士顿住房数据
- 时间序列分析数据
- 葡萄酒质量数据
- Turkiye学生评估数据
- 身高体重数据
中级
- 黑色星期五数据
- 人类活动识别数据
- 暹罗比赛数据
- 行程记录数据
- 百万首歌曲数据
- 人口普查收入数据
- 电影镜头数据
- Twitter分类数据
高级
- 识别你的数字
- 城市声音分类
- Vox名人资料
- ImageNet数据
- 芝加哥犯罪数据
- 印度演员数据的年龄检测
- 推荐引擎数据
- VisualQA数据
- 识别你的数字
初级
1.虹膜数据集
这可能是模式识别文献中最通用、最简单、资源最丰富的数据集。没有什么比虹膜数据集学习分类技术更简单的了。如果你是全新的数据科学学习生,这将成为你的起点。数据只有150行4列。
问题:根据可用属性预测花朵的类别。
开始:获取数据:https://archive.ics.uci.edu/ml/datasets/Iris
教程:http://www.slideshare/thoi_gian/iris-data-analysis-with-r
让我们看一下Iris数据,并在下面的“实时编码”窗口中构建一个Logistic回归模型。
https://id.analyticsvidhya/auth/login/?next=https://www.analyticsvidhya/blog/2018/05/24-ultimate-data-science-projects-to-boost-your-knowledge-and-skills
2.贷款预测数据集
在所有行业中,保险领域是分析和数据科学方法最大的用途之一。该数据集使你可以从保险公司的数据集中进行操作,那里面临着哪些挑战,使用了什么策略,哪些变量影响了结果等等。这是一个分类问题。数据有615行和13列。
问题:预测贷款是否会获得批准。
开始:获取数据:https://datahack.analyticsvidhya/contest/practice-problem-loan-prediction-iii/
教程:https://www.analyticsvidhya/blog/2016/01/complete-tutorial-learn-data-science-python-scratch-2/
让我们看一下“贷款”数据并在下面的“实时编码”窗口中构建一个Logistic回归模型。
https://id.analyticsvidhya/auth/login/?next=https://www.analyticsvidhya/blog/2018/05/24-ultimate-data-science-projects-to-boost-your-knowledge-and-skills
3. Bigmart销售数据集
零售是另一个广泛使用分析来优化业务流程的行业。使用数据科学技术可以巧妙地处理诸如产品放置,库存管理,自
版权声明:本文标题:24个提高你的知识和技能极限的数据科学(机器学习)项目(免费) 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://www.elefans.com/dianzi/1728889734a1177946.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论