爆款云主机2核4G限时秒杀,88元/年起!
查看详情

活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 618智算钜惠季 爆款云主机2核4G限时秒杀,88元/年起!
  • 免费体验DeepSeek,上天翼云息壤 NEW 新老用户均可免费体验2500万Tokens,限时两周
  • 云上钜惠 HOT 爆款云主机全场特惠,更有万元锦鲤券等你来领!
  • 算力套餐 HOT 让算力触手可及
  • 天翼云脑AOne NEW 连接、保护、办公,All-in-One!
  • 中小企业应用上云专场 产品组合下单即享折上9折起,助力企业快速上云
  • 息壤高校钜惠活动 NEW 天翼云息壤杯高校AI大赛,数款产品享受线上订购超值特惠
  • 天翼云电脑专场 HOT 移动办公新选择,爆款4核8G畅享1年3.5折起,快来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

智算服务

打造统一的产品能力,实现算网调度、训练推理、技术架构、资源管理一体化智算服务
智算云(DeepSeek专区)
科研助手
  • 算力商城
  • 应用商城
  • 开发机
  • 并行计算
算力互联调度平台
  • 应用市场
  • 算力市场
  • 算力调度推荐
一站式智算服务平台
  • 模型广场
  • 体验中心
  • 服务接入
智算一体机
  • 智算一体机
大模型
  • DeepSeek-R1-昇腾版(671B)
  • DeepSeek-R1-英伟达版(671B)
  • DeepSeek-V3-昇腾版(671B)
  • DeepSeek-R1-Distill-Llama-70B
  • DeepSeek-R1-Distill-Qwen-32B
  • Qwen2-72B-Instruct
  • StableDiffusion-V2.1
  • TeleChat-12B

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场创新解决方案
办公协同
  • WPS云文档
  • 安全邮箱
  • EMM手机管家
  • 智能商业平台
财务管理
  • 工资条
  • 税务风控云
企业应用
  • 翼信息化运维服务
  • 翼视频云归档解决方案
工业能源
  • 智慧工厂_生产流程管理解决方案
  • 智慧工地
建站工具
  • SSL证书
  • 新域名服务
网络工具
  • 翼云加速
灾备迁移
  • 云管家2.0
  • 翼备份
资源管理
  • 全栈混合云敏捷版(软件)
  • 全栈混合云敏捷版(一体机)
行业应用
  • 翼电子教室
  • 翼智慧显示一体化解决方案

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
  • 天翼云EasyCoding平台
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼云东升计划
  • 适配中心
  • 东升计划
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
开放能力
  • EasyCoding敏捷开发平台
培训与认证
  • 天翼云学堂
  • 天翼云认证
魔乐社区
  • 魔乐社区

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 建议与反馈
  • 用户体验官
  • 服务保障
  • 客户公告
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 智算服务
  • 产品
  • 解决方案
  • 应用商城
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心

      SAS使用鸢尾花(iris)数据集训练人工神经网络(ANN)模型

      首页 知识中心 大数据 文章详情页

      SAS使用鸢尾花(iris)数据集训练人工神经网络(ANN)模型

      2023-07-07 07:48:26 阅读次数:81

      什么是神经网络?

      人工神经网络最初是由研究人员开发的,他们试图模仿人脑的神经生理学。通过将许多简单的计算元素(神经元或单元)组合成高度互连的系统,这些研究人员希望产生诸如智能之类的复杂现象。神经网络是一类灵活的非线性回归,判别模型。通过检测数据中复杂的非线性关系,神经网络可以帮助做出有关实际问题的预测。

      神经网络对于存在以下条件的预测问题特别有用:

      • 尚无将输入与输出相关的数学公式。

      • 预测模型比解释模型更重要。

      • 有很多训练数据。

      神经网络的常见应用包括信用风险评估,营销和销售预测。

      neuralNet 基于多层感知器(MLP),具有以下特征:

      • 有任意数量的输入

      • 在隐藏层和输出层中使用线性组合函数

      • 在隐藏层中使用S型激活函数

      • 具有一个或多个包含任意数量单位的隐藏层

       

      使用神经网络函数

      该  neuralNet 通过最小化的目标函数训练网络。

      开发神经网络时,需要做出许多参数选择:要使用的输入数量,要使用的基本网络体系结构,要使用的隐藏层数量,每个隐藏层的单位数量,要使用的激活函数使用等等。

      您可能根本不需要任何隐藏层。线性模型和广义线性模型可用于多种应用。而且,即使要学习的函数是轻微的非线性,如果数据太少或噪声太大而无法准确估计非线性,使用简单的线性模型也可能会比使用复杂的非线性模型获得更好的效果。最简单的方法是从没有隐藏单元的网络开始,然后一次添加一个隐藏单元。然后估计每个网络的误差。当误差增加时,停止添加隐藏的单位。

      如果有足够的数据,足够多的隐藏单元和足够的训练时间,则只有一个隐藏层的MLP可以学习到几乎任何函数的准确性。

       

      生成神经网络模型的独立SAS评分代码

       

      训练和验证神经网络模型后,可以使用该模型对新数据进行评分。可以通过多种方式对新数据进行评分。一种方法是提交新数据,然后运行模型,通过SAS Enterprise Miner或SAS Visual Data Mining and Machine Learning使用数据挖掘来对数据进行评分,以生成评分输出。

      本示例说明如何使用  neuralNet操作为ANN模型生成独立的SAS评分代码。SAS评分代码可以在没有SAS Enterprise Miner许可证的SAS环境中运行。

       

      创建和训练神经网络

      annTrain 将创建并训练一个人工神经网络(ANN),用于分类,回归的函数。

      本示例使用Iris 数据集创建多层感知器(MLP)神经网络。Fisher(1936)发表的Iris数据包含150个观测值。萼片长度,萼片宽度,花瓣长度和花瓣宽度以毫米为单位测量从各三个物种50个标本。四种测量类型成为输入变量。种类名称成为名义目标变量。目的是通过测量其花瓣和萼片尺寸来预测鸢尾花的种类。

      您可以通过以下DATA步骤来将数据集加载到会话中。

       data mycas.iris;
          set sashelp.iris;
       run;

      Iris数据中没有缺失值。这是很重要的,因为annTrain 操作将从模型训练中剔除包含缺失数据的观察值。如果要用于神经网络分析的输入数据包含大量缺失值的观测值,则应在执行模型训练之前替换或估算缺失值。因为Iris数据不包含任何缺失值,所以该示例不执行变量替换。

      该示例使用  annTrain 来创建和训练神经网络。神经网络根据其萼片和花瓣的长度和宽度(以毫米为单位)的输入来预测预测鸢尾花种类的函数。

      
          target="species"                                               
          inputs={"sepallength","sepalwidth","petallength","petalwidth"}  
          nominals={"species"}                                            
          hiddens={2}                                                     
          maxiter=1000                                                   
          seed=12345                                                 
          randDist="UNIFORM"                                            
          scaleInit=1                                                 
          combs={"LINEAR"}                                           
          targetAct="SOFTMAX"                                        
          errorFunc="ENTROPY"                                      
          std="MIDRANGE"                                             
          validTable=vldTable
      1. 使用sampling.Stratified 操作Iris 按目标变量对输入数据进行分区 Species。

      2. 将分区指示列添加  _Partind_ 到输出表。该_Partind_ 列包含映射到数据分区的整数值。

      3. 创建一个由30%的表观察值组成的采样分区  Species。剩余的70%的表观测值构成第二个分区。

      4. 指定12345 要用于采样函数的随机种子值  。

      5. 命名sampling_stratified 操作创建的输出表  (带有新的分区信息列)  iris_partitioned。如果内存中存在具有该名称的表,则现有表将被新iris_partitioned 表内容覆盖  。

      6. 在源表中指定所有变量,将其传输到采样的表中。

      7. 使用新添加的分区列中的数据创建单独的表,以进行神经网络训练和验证。令训练表trnTable 为表  中所有观察iris_partitioned 值的子集,  其中列的整数值  _Partind_ 等于1。

      8. 使用新添加的分区列中的数据创建单独的表,进行神经网络训练和验证。假设验证表vldTable 是表  中所有观察iris_partitioned 值的子集,  其中列的整数值  _Partind_ 等于0。

      9. annTrain 通过使用trnTable 带有目标变量的表,来创建和训练MLP神经网络  Species。

      10. 指定四个输入变量用作ANN分析的分析变量。

      11. 要求将目标变量  Species 视为分析的名义变量。

      12. 为神经网络前馈模型中的每个隐藏层指定隐藏神经元的数量。例如,  hiddens={2} 用两个隐藏的神经元指定一个隐藏层。

      13. 指定在寻求目标函数收敛时要执行的最大迭代次数。

      14. 指定用于执行采样和分区任务的随机种子。

      15. 要求将UNIFORM分布用于随机生成初始神经网络连接权重。

      16. 指定连接权重的比例因子,该比例是相对于上一层中的单位数的。scaleInit 参数的默认值为  1。将参数的值设置  scaleInit 为2会增加连接权重的比例。

      17. 为每个隐藏层中的神经元指定LINEAR组合函数。

      18. 在输出层中为神经元指定激活函数。默认情况下,SOFTMAX函数用于名义变量。

      19. 指定误差函数来训练网络。ENTROPY是名义目标的默认设置。

      20. 指定要在区间变量上使用的标准化。当  std 参数的值为MIDRANGE时,变量将标准化到0和1。

      21. 指定要用于验证表的输入表名称。这样可以通过使用optmlOpt 参数来尽早停止迭代过程  。

      22. 指定  Nnet_train_model 作为输出表。

      23. 启用神经算法求解器优化工具。

      24. 指定250次最大迭代以进行优化,并指定1E–10作为目标函数的阈值停止值。

      25. 启用LBFGS算法。LBFGS是准牛顿方法族中的一种优化算法,它通过使用有限的计算机内存来近似Broyden-Fletcher-Goldfarb-Shanno(BFGS)算法。

      26. 使用频率参数来设置验证选项。当  frequency 参数的值为1时,将在每个时期进行验证。当  frequency 为0时,将不进行任何验证。

      输出显示数据的概述。

      输出:列信息

      来自table.columnInfo的结果

       

      SAS使用鸢尾花(iris)数据集训练人工神经网络(ANN)模型

       

      如果在输入表上使用table.fetch 命令,则可以查看输出2中显示的示例数据行  。

      输出2:已提取的行

      来自table.fetch的结果

      SAS使用鸢尾花(iris)数据集训练人工神经网络(ANN)模型

       

      如果simple.freq 在输入表上使用命令,则可以验证三种种类中每种都有50个观测值,输入数据表中总共有150个观测值,如输出3所示。

       

      输出 3:物种频率

       

      来自simple.freq的结果

      SAS使用鸢尾花(iris)数据集训练人工神经网络(ANN)模型

       

      Iris 通过成功完成输入表的neuralNet.annTrain训练过程后  ,结果将显示训练数据迭代历史记录,其中包含目标函数,损失和验证误差列,如  输出4中所示。

       

      输出 4:优化迭代历史记录

       

      来自NeuroNet.annTrain的结果

      SAS使用鸢尾花(iris)数据集训练人工神经网络(ANN)模型

       

      在“迭代历史记录”表下方,您应该看到“收敛状态”表。对于成功的神经网络模型,“收敛状态”应报告“优化已收敛”,如  输出 5中所示。

       

      输出 5:收敛状态

       

      SAS使用鸢尾花(iris)数据集训练人工神经网络(ANN)模型

       

      成功的模型训练包括输出模型的摘要结果,如输出 6所示  。

       

      输出 6:模型信息

      SAS使用鸢尾花(iris)数据集训练人工神经网络(ANN)模型

      这些结果重申了关键的模型构建因素,例如模型类型;目标变量 神经网络模型输入,隐藏和输出节点的摘要;权重和偏差参数;最终目标值;以及评分验证数据集的误分类误差。

      在表格底部,您将看到由验证数据确定的最终误分类错误百分比。如果将这个神经网络模型用作预测函数,并且您的数据来自与Iris 验证表具有相同数据分布,则  可以预期93%–94%的物种预测是正确的。

       

      使用神经网络模型对输入数据进行评分

      训练和验证神经网络模型后,可以使用该模型对新数据进行评分。最常见的技术是通过SAS Enterprise Miner或SAS Visual Data Mining and Machine Learning使用数据挖掘环境来生成评分输出,从而提交新数据并运行模型以对新数据评分。

      拥有训练的神经网络后,可以使用该神经网络模型和  annScore 操作对新的输入数据进行评分,如下所示:

          table=vldTable
          modelTable="train_model";
      1. 识别训练数据表。训练数据是iris_partitioned 表中的观测值,在分区指示符列(_partind_)中的值为0 。

      2. 确认验证数据表。验证数据是iris_partitioned 表中的观察值,在分区指示符列(_partind_)中的值为1 。

      3. 对训练数据进行评分。提交输入数据,该  数据将由经过训练的神经网络模型评分。因为在此代码块中要评分的数据是模型训练数据,所以您应该期望评分代码读取所有105个观察值,并以0%错误分类错误预测目标变量值。模型训练数据包含已知的目标值,因此,在对模型训练数据进行评分时,应期望其分类错误为0%。

      4. 对验证数据评分。该操作将提交输入数据,在SAS数据挖掘环境中,由经过训练的神经网络模型对输入数据进行评分。验证数据包含已知目标值,但训练算法不会读取验证数据。算法预测验证数据中每个观察值的目标值,然后将预测值与已知值进行比较。分类误差百分比是通过从1中减去正确预测的分类百分比来计算的。较低的分类误差百分比通常表示模型性能更好。

      验证数据包含30%的原始输入数据观察值,并按目标变量Species分层  。原始数据包含每个种类的50个观察值;验证数据(30%)包含三种物种中每一种的比例15个观测值,总共45个观测值。如果验证数据中的45个观察值中有42个被正确分类,则该模型的错误分类误差为6.67%。

       


      SAS使用鸢尾花(iris)数据集训练人工神经网络(ANN)模型

      版权声明:本文内容来自第三方投稿或授权转载,原文地址:https://blog.51cto.com/u_14293657/2965784,作者:拓端tecdat,版权归原作者所有。本网站转在其作品的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如因作品内容、版权等问题需要同本网站联系,请发邮件至ctyunbbs@chinatelecom.cn沟通。

      上一篇:Stata 中Mata的st_view函数 - 小心使用!

      下一篇:excel数据分析——贝叶斯分析预测

      相关文章

      2024-12-06 06:41:47

      zabbix实现 SAS 6/iR 型号 Raid信息监控

      zabbix实现 SAS 6/iR 型号 Raid信息监控

      2024-12-06 06:41:47
      2023-02-08 10:33:55

      通过SAS网络分析对人口迁移进行可视化分析

      世界上超过3.5%的人口正在移动,被视为国际移民。这是一个超过2.5亿人生活在一个不同于他们的出生国或国籍的国家。以另外一种方式,如果所有的移民生活在一个国家,其人口将是5 个最大的国家在世界上! 移民的流动,我们创建了一个可视化,让用户亲

      2023-02-08 10:33:55
      可视化 , 数据分析 , 编程开发
      查看更多
      推荐标签

      作者介绍

      天翼云小翼
      天翼云用户

      文章

      33561

      阅读量

      5267224

      查看更多

      热门标签

      算法 leetcode python 数据 java 数组 节点 大数据 i++ 链表 golang c++ 排序 django 数据类型
      查看更多

      相关产品

      弹性云主机

      随时自助获取、弹性伸缩的云服务器资源

      天翼云电脑(公众版)

      便捷、安全、高效的云电脑服务

      对象存储

      高品质、低成本的云上存储服务

      云硬盘

      为云上计算资源提供持久性块存储

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 服务器安全卫士
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2025 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号