华园论坛

 找回密码
 注册会员

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 799|回复: 0

大数据讲座

[复制链接]
高级 发表于 2022-2-22 17:45:40 | 显示全部楼层 |阅读模式
大数据建模、分析、挖掘技术应用研修班的通知

随着2015年9月国务院发布了《关于印发促进大数据发展行动纲要的通知》,各类型数据呈现出了指数级增长,数据成了每个组织的命脉。今天所产生的数据比过去几年所产生的数据大好几个数量级,企业有了能够轻松访问和分析数据以提高性能的新机会,如何从数据中获取价值显得尤为重要,也是大数据相关技术急需要解决的问题。大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。数据建模不仅仅是任意组织数据结构和关系,还必须与最终用户的需求和问题联系起来,并提供指导,帮助确保正确的数据正确使用正确的方法获得正确的结果。
为响应科研及工作人员需求,根据《国务院关于推行终身职业技能培训制度的意见》提出的“紧跟新技术、新职业发展变化,建立职业分类动态调整机制,加快职业标准开发工作”要求,特举办“大数据建模、分析、挖掘技术应用研修班”。本次培训采用实战培训模式。

2022年3月10日 — 2022年3月14日   北京(同时转线上直播)
联系人:任老师  13331040142

一、大数据概述
1.大数据及特点分析
2.大数据关健技术
3.大数据计算模式
4.大数据应用实例


二、大数据处理架构Hadoop
1.Hadoop项目结构
2.Hadoop安装与使用
3.Hadoop集群的部署与使用
4.Hadoop 代表性组件


三、分布式文件系统HDFS
1.HDFS体系结构
2.HDFS存储
3.HDFS数据读写过程


四、分布式数据库HBase
1.HBase访问接口
2.HBase数据类型
3.HBase实现原理
4.HBase运行机制
5.HBase应用


五、MapReduce
1.MapReduce体系结构
2.MapReduce工作流程
3.资源管理调度框架YARN
4.MapReduce应用



六、Spark
1.Spark生态与运行架构
2.Spark SQL
3.Spark部署与应用方式
案例:
1.Python Spark 安装
2.本地运行pyspark程序
3.在Hadoop YARN 运行pyspark
4.Spark Web UI


七、IPython Notebook运行Python Spark程序
1.Anaconda
2.IPython Notebook使用Spark
3.使用IPython Notebook在Hadoop YARN模式运行
案例:
1.在不同模式运行IPython Notebook运行Python Spark命令
2.Python 程序开发



八、Python Spark集成开发环境
1.Python Spark集成开发环境部署配置
2.Spark数据分析库MLlib的开发部署



九、Python Spark决策树二分类与多分类
1.决策树原理
2.大数据问题
3.决策树二分类
4.决策树多分类
案例:
1.搜集数据
2.数据准备:导入并转换数据、提取特征字段、提取标签
3. Python Spark建模,训练模型
4.预测数据
5.评估数据,给出评价指标并得到评估结果


十、Python Spark支持向量机
1.支持向量机SVM 原理与算法
2.Python Spark SVM程序设计
案例:
1.数据准备
2.建立SVM模型,训练模型
3.评估参数并找出最优参数
4.根据模型进行预测


十一、Python Spark 贝叶斯模型
1.朴素贝叶斯模型原理
2.Python Spark贝叶斯模型程序设计
案例:
1.建模贝叶斯模型,并进行对参数估计
2.训练模型,得到最优参数
3.根据模型进行预测


十二、Python Spark逻辑回归
1.逻辑回归原理
2.Python Spark逻辑回归程序设计
案例:
1.Python Spark逻辑回归建模
2.根据模型进行分类


十三、Python Spark回归分析
1.大数据分析
2.数据集介绍
3.Python Spark回归程序设计
案例:
1.数据准备
2.训练回归模型
3.建立评估指标
4.训练回归模型,并找到最优参数
5.根据模型进行预测


十四、Spark ML Pipeline 机器学习流程分类
1.机器学习流程组件:StringIndexer、OneHotEncoder、VectorAssembler等
2.使用Spark ML Pipeline 机器学习流程分类程序设计
案例:
1.数据准备
2.建立机器学习Pipeline流程
3.使用Pipeline流程训练
4.使用PipelineModel预测
5.评估模型准备率
大数据建模、分析、挖掘技术应用研修班的通知

随着2015年9月国务院发布了《关于印发促进大数据发展行动纲要的通知》,各类型数据呈现出了指数级增长,数据成了每个组织的命脉。今天所产生的数据比过去几年所产生的数据大好几个数量级,企业有了能够轻松访问和分析数据以提高性能的新机会,如何从数据中获取价值显得尤为重要,也是大数据相关技术急需要解决的问题。大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。数据建模不仅仅是任意组织数据结构和关系,还必须与最终用户的需求和问题联系起来,并提供指导,帮助确保正确的数据正确使用正确的方法获得正确的结果。
为响应科研及工作人员需求,根据《国务院关于推行终身职业技能培训制度的意见》提出的“紧跟新技术、新职业发展变化,建立职业分类动态调整机制,加快职业标准开发工作”要求,特举办“大数据建模、分析、挖掘技术应用研修班”。本次培训采用实战培训模式。

2022年3月10日 — 2022年3月14日   北京(同时转线上直播)
联系人:任老师  13331040142

一、大数据概述
1.大数据及特点分析
2.大数据关健技术
3.大数据计算模式
4.大数据应用实例


二、大数据处理架构Hadoop
1.Hadoop项目结构
2.Hadoop安装与使用
3.Hadoop集群的部署与使用
4.Hadoop 代表性组件


三、分布式文件系统HDFS
1.HDFS体系结构
2.HDFS存储
3.HDFS数据读写过程


四、分布式数据库HBase
1.HBase访问接口
2.HBase数据类型
3.HBase实现原理
4.HBase运行机制
5.HBase应用


五、MapReduce
1.MapReduce体系结构
2.MapReduce工作流程
3.资源管理调度框架YARN
4.MapReduce应用



六、Spark
1.Spark生态与运行架构
2.Spark SQL
3.Spark部署与应用方式
案例:
1.Python Spark 安装
2.本地运行pyspark程序
3.在Hadoop YARN 运行pyspark
4.Spark Web UI


七、IPython Notebook运行Python Spark程序
1.Anaconda
2.IPython Notebook使用Spark
3.使用IPython Notebook在Hadoop YARN模式运行
案例:
1.在不同模式运行IPython Notebook运行Python Spark命令
2.Python 程序开发



八、Python Spark集成开发环境
1.Python Spark集成开发环境部署配置
2.Spark数据分析库MLlib的开发部署



九、Python Spark决策树二分类与多分类
1.决策树原理
2.大数据问题
3.决策树二分类
4.决策树多分类
案例:
1.搜集数据
2.数据准备:导入并转换数据、提取特征字段、提取标签
3. Python Spark建模,训练模型
4.预测数据
5.评估数据,给出评价指标并得到评估结果


十、Python Spark支持向量机
1.支持向量机SVM 原理与算法
2.Python Spark SVM程序设计
案例:
1.数据准备
2.建立SVM模型,训练模型
3.评估参数并找出最优参数
4.根据模型进行预测


十一、Python Spark 贝叶斯模型
1.朴素贝叶斯模型原理
2.Python Spark贝叶斯模型程序设计
案例:
1.建模贝叶斯模型,并进行对参数估计
2.训练模型,得到最优参数
3.根据模型进行预测


十二、Python Spark逻辑回归
1.逻辑回归原理
2.Python Spark逻辑回归程序设计
案例:
1.Python Spark逻辑回归建模
2.根据模型进行分类


十三、Python Spark回归分析
1.大数据分析
2.数据集介绍
3.Python Spark回归程序设计
案例:
1.数据准备
2.训练回归模型
3.建立评估指标
4.训练回归模型,并找到最优参数
5.根据模型进行预测


十四、Spark ML Pipeline 机器学习流程分类
1.机器学习流程组件:StringIndexer、OneHotEncoder、VectorAssembler等
2.使用Spark ML Pipeline 机器学习流程分类程序设计
案例:
1.数据准备
2.建立机器学习Pipeline流程
3.使用Pipeline流程训练
4.使用PipelineModel预测
5.评估模型准备率

关注微信公众号:人工智能技术与咨询。了解更多咨询!


您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

关于华大|华园照片|工作机会|物品交换|华大贴吧|我要表白|禁言帐号|手机论坛|HK ICP备09009564号|广告联系

Copyright 1960-2018 华园论坛-华大论坛 桑梓年华泉州厦门华侨大学论坛-最受华大学生欢迎的校园BBS站!

GMT+8, 2024-5-5 12:33 , Processed in 0.036308 second(s), 6 queries , Gzip On, MemCached On.

快速回复 返回顶部 返回列表