提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
转帖|使用教程|编辑:龚雪|2017-04-14 10:29:53.000|阅读 458 次
概述:如果你是一个机器学习的初学者,本系列文章将教你用R语言开启机器学习之旅
# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>
文|陆勤
你是否想要用R做机器学习,但又苦恼于怎么开始做?
在这篇文章里你将会用R完成你的第一个机器学习项目。
在这个逐步教程里,你需要做:
1 下载和安装R并且获取用做机器学习非常有用的R包。
2 导入一个数据集并且用统计分析和数据可视化来理解它的结构。
3 创建5个机器学习模型,选择最好和建立精度是可靠的置信。
如果你是一个机器学习新手,而且还在找一个你最终会选择的方案来学习机器学习的话,这个教程就是针对你设计的。
让我们现在开始吧。
怎样用R开始你的机器学习?
学习机器学习最好的方法就是设计并实现一系列小项目。
初学R的时候你可能回觉得这有点可怕
R在编写脚本时所提供的语法结构是比较奇怪的。这里有几百个R包和几千个函数让你选择,给每个任务提供了多种解决方法,所以这会让你感到有点吃不消。
所以说,在R上开始机器学习最好的方法就是要完成一个项目。
1 这需要你安装并开始学习使用R(至少会一点点)。
2 它能给你更开阔的视角来理解如何一步步进行机器学习。
3 它会给你自信,来源于你完成一个小项目的成就感。
入门的人需要完成一个端对端的项目
光看书或课程会让你觉得很吃不消,它们给你提供的是一系列的解决方法和代码段,但是,你永远都不知道怎样把他们综合起来使用。
当你要把机器学习运用到你的数据集的时候,其实你就是在做一个项目。
一个机器学习项目可能不是线性的,但是,有些有用的方法你可以按顺序的遵循:
1 定义问题
2 准备好数据
3 评估算法
4 改良结果
5 展示最终结果
如果你想要了解更多关于机器学习的步骤,你可以查阅,这一清单对这个过程讲的更详细。
与一个新的平台或工具达成协议的最好方法就是完成端对端的机器学习项目,并按照之前给的步骤执行。也就是说,从载入数据开始,然后汇总你的数据,接下来评估你的算法,同时改良你的结果,并在最后作适当的展示。
如果你是这么做的话,你就会在你处理完数据以后,有了一个模板来对新的数据集进行研究。你甚至还可以通过数据展示和改良相关的结果来填补你先前做任务的时候留下来的空缺。一旦你这么做了,你就会有信心了。
利用新的工具进行小项目的最好方法就是首先从iris的分类数据集开始。
这是一个好的项目,因为它简单明了。
1 里面的属性是数字,所以,你会觉得导入和处理数据会非常上手。
2 这是一个分类问题,或许能允许你使用简单的监督学习算法进行练习。
3 这是一个多级分类问题(多含义),而它需要一些特别的方法来处理。
4 它只有4个属性和150行数据,说明这对于内存来说很小,而且处理起来很快(一张A4纸大小那样)。 5 所有的数字属性都在同一个单元,它们的规模也相同,它不需要转化成特别的形式或者使用特殊的定位。
在R中让我们开始您的Helloworld机器学习项目。
在这一部分的内容中,我们要完成一个小的端到端机器学习项目。 这里,我们浏览一下我们接下来要干什么:
1 安装R平台
2 载入数据
3 汇总数据集
4 对数据集进行可视化操作
5 评估一些算法
6 做一些相关预测
慢慢来,认真的落实好每一步。
你可以尝试自己写代码,或者从别的地方复制相关的代码来提高工作效率。
如果你的系统还没有R平台,那就现在安装一个吧。
更新:这个教程是根据R 3.2.3版写的,所以,如果你的版本比较旧,那么,你就需要更新一下了。
我不想在这里讲太多的细节,其他文章已经讲的很清楚了。这已经讲的直接明了,尤其你是一名开发人员的时候。
这里,你要遵循几个步骤:
1 下载R
2 安装R
3 开始使用R
4 下载相关R包
你可以从下载R。
当你点击这个下载链接时,你需要选择镜像。你可以根据你的操作系统选择R,如Windows、OSX或者Linux。
安装R很容易的,而且我也相信你可以解决。这里没有其它特别的要求。如果你在安装R的时候遇到什么问题需要求助的话,你可以看一下
你可以在操作系统上看到的选择任意菜单系统使用R。
对于我而已,我更喜欢命令行。
打开你的命令行,改变(或者创建)你的项目目录,并且在命令行输入以下代码: R
您应该在一个新的窗口或者您的终端上看到一个像如下的屏幕截图:
安装我们今天要使用的R包。这些包是第三方附加组件或者可以在R使用的库。
install.packages(“caret”)
更新:我们也许需要其它包,但是caret会问到我们是否要安装它。如果你对于这些包有什么疑问的话,你可以先安装caret包,然后你可以输入下面的代码来看一下你需要什么包:
install.packages(“caret”,dependencies=c(“Depends”, “Suggests”)) 现在,我们加载一下caret包,然后开始在我们的教程里使用这个包。
library(caret)
caret包给上百个机器学习算法提供了相应接口,并给数据可视化、数据采样、模型调整以模型比较这些功能提供了便利的方法。我们必须要在R里有进行机器学习的工具。
如果你想要了解更多关于caret这个R包的内容,查阅一下这篇文章。
英文链接:
更多行业资讯,更新鲜的技术动态,尽在。
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@capbkgr.cn
本文探讨 SQL Server 中 NULL 和空值之间的区别,并讨论如何有效地处理它们。
Unity 是一款功能极其丰富的游戏引擎,允许开发人员将各种媒体集成到他们的项目中。但是,它缺少最令人兴奋的功能之一 - 将 Web 内容(例如 HTML、CSS 和 JavaScript)直接渲染到 3D 场景中的纹理上的能力。在本文中,我们将介绍如何使用 DotNetBrowser 在 Unity3D 中将 Web 内容渲染为纹理。
DevExpress v24.2帮助文档正式发布上线了,请按版本按需下载~
本教程将向您展示如何用MyEclipse构建一个Web项目,欢迎下载最新版IDE体验!
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@capbkgr.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢