Python进阶智能数据分析前沿技术与应用案例

2022年3月12日-18日

数据科学

第1期 python进阶智能数据分析

课程意义 :

Python智能数据分析指采用机器学习深度学习等人工智能技术开展领域数据分析,是大数据人工智能时代的核心技术,也是目前学术界和工业界的热点研究方向。

Python是目前最流行的数据分析和机器学习编程语言,其在科学计算、机器学习及深度学习领域的得到了广泛应用,并应用到各专业领域,因为其开源特性,互联网存在大量Python实现的各领域最新算法方便我们查找和使用。

掌握Python智能数据分析编程技术的人才在市场上炙手可热,Python语言编程教育将很快成为各高校的必修课。

Python是教师和科研工作者开展科学研究的高效工具,将智能数据分析计算与科研工作结合可以产出创新成果。

为加强数据分析的创新发展和技术应用,打造Python智能数据分析专业技术人才队伍,雷课将特别邀请在Python数据分析学术和研发领域一线专家,举办《Python进阶智能数据分析前沿技术与应用案例》高级培训班。

课程目标:

本课程是《Python智能数据分析前沿技术与应用案例》的高级进阶课程。基础课让学员零基础入门掌握Python智能数据分析的基本概念和常用工具,可以完成简单应用案例

高级进阶课的设计目标是让学员学习高级智能分析技术,深入理解数据分析理论知识,掌握更丰富的python软件包工具,开展更加贴合实际的高级综合应用案例。

学习掌握Python语言开展智能数据分析全流程的理论、方法及工具,包含网络数据爬虫、数据探索、数据清洗转换、数据统计建模分析、机器学习与深度学习数据分析、数据可视化等步骤。

通过“新理论、新工具、新案例”三位一体的强化学习,进一步精通Python智能数据分析的核心技术,助力科技创新与教学工作。

通过大量应用案例与实战项目的代码实践,掌握利用Python来解决日常科研工作和项目实施中智能数据分析类问题的基本方法。

学习掌握数据分析相关前沿技术,包括大数据、机器学习、深度学习、图像识别、自然语言处理等。

适合人群:

1  各高等院校人工智能、数据科学、经济管理、信息管理、财务管理、统计分析相关学科;计算机、网络通信、自动化、电子工程、数理统计、电子商务、物联网工程、物流管理、信息与计算科学专等科研、教学带头人,骨干教师、博士生、硕士生;

2  从事人工智能,计算机、数据科学、互联网等相关领域的科研院所的项目负责人、科研人员、工程技术人员;

3  各地方政府信息中心负责人、技术骨干;

4  人工智能,数据科学,互联网产业投资团队,应用开发商,服务提供商等;

5  有志于数据分析,机器学习研究和应用的从业者。

时间 主题 大纲
3月12日 Numpy/Pandas数据分析处理进阶 1.Python智能数据分析进阶课知识体系解析(PPT介绍)
2.Numpy高级功能(Python代码示例)
1)广播broadcast
2)数组连接、拆分
3)排序、搜索、计数
4)金融函数
3.Pandas高级功能(Python代码示例)
1)自定义处理函数map\apply\applymap
2)高级查询统计crosstab\pivot_table\groupby
3)时序数据处理
4)分类数据处理
案例:
Case 1:基于Numpy的医疗影像处理
Case 2:基于Pandas的报警电话时间序列分析
3月13日 Python网络爬虫及信息抽取进阶 1.网络爬虫高级技术(PPT介绍)
1)网页数据解析,图片、视频、文本、表格、列表
2)动态网页爬取,如何解析AJAX请求API
3)高效率爬虫,多线程与多进程
2.文本模式匹配Re(Python代码示例)
1)常用匹配规则
2)提取特定内容
3)统一数据格式
3.爬虫框架Scrapy(Python代码示例)
1)Scrapy架构流程
2)Scrapy项目使用
3)Scrapy框架封装
案例:
Case3:动态网页请求分析与腾讯天气数据抓取
Case4:爬虫框架封装与国家统计局行政区划数据采集
Case5:政府公文爬取与结构化经济指标数据提取
3月14日 Python数据可视化分析进阶 1.matplotlib高级绘图方法(Python代码示例)
1)3D图
2)K线图
3)多子图
2.seaborn统计绘图方法(Python代码示例)
1)变量分布图
2)回归分析图
3)关系分类图
3.pyechart交互绘图方法(Python代码示例)
1)动态图表
2)组合图表
3)地理图表
案例:
Case6:疫情数据的可视化探索分析
Case7:金融数据的可视化探索分析
Case8:NBA比赛数据的可视化探索分析
3月15日 Python数据统计建模分析进阶 1.统计分析概述(PPT)
2.Statsmodels工具(Python代码示例)
a)回归与线性模型
b)离散选择模型Discrete Choice Model, DCM
c)时间序列分析Time Series Analysis
d)状态空间模型State space models
案例:
Case9:计量经济学案例:人均现金消费与收入建模分析
Case10:离散选择模型案例:研究生录取因素分析
3月16日 Python机器学习数据分析进阶 1.Scikit-learn进阶(Python代码示例)
a)数据预处理、评价指标
b)无监督学习
c)半监督学习
2.概率模型 PyMC3(Python代码示例)
a)贝叶斯、高斯过程等
3.高效的集成学习库XGBoost\LightGBM(Python代码示例)
4.自动化机器学习AutoML(Python代码示例)
案例:
Case11:基于XGBoost的大数据比赛案例
3月17日 Python深度学习数据分析进阶 1.深度学习前沿技术(PPT介绍)
1)从AlphaGo到AlphaFold
2)Capsule新计算框架
3)Attention机制与Transformer模型
4)Bert时代的创新应用
2.PyTorch深度学习实践(Python代码示例)
1)PyTorch与科学计算
2)简单神经网络构建
3)复杂网络模型构建
4)预训练模型的使用
5)图像生成与对抗学习
案例:
Case12:时尚物品识别分类与迁移学习
Case13:少样本精准分类与孪生网络
3月18日 Python智能数据分析高级项目实战 1.综合案例:Case 14上市公司综合评价与收益分析
1)上市公司综合评价模型及方法基本介绍;
2)基于投资规模与效率指标的综合评价方法;
3)基于成长与价值指标的综合评价方法;
4)指标数据选取及数据预处理;
5)量化投资策略设计实现及结果分析。
2.综合案例:Case 15基于视频图像的车牌检测与识别
1) 车辆图像获取
2) 车辆牌照检测
3) 牌照字符分割
4) 牌照字符识别
3.综合案例:Case 16中国移动用户人群画像与信用分值评估
1)多维度数据探索分析
2)用户关键特征提取
3)消费者人群画像
4)信用体系模型构建
5)用户消费信用评估

刘老师

中国科学院软件研究所副研究员、硕士生导师,中国科学院青年创新促进会会员

作为负责人承担国家自然科学基金项目和国家重点研发计划课题,并作为骨干参与多个国家和部委科研项目。
在大数据挖掘分析平台及优化关键技术方向,研究大数据分析开发环境、大数据分布式系统优化、自动化机器学习等,研制可视化大数据分析平台,在医疗、科学大数据领域应用。在知识图谱与语义计算方向,研究知识图谱构建管理、问答系统等,在民航领域和法律领域开展应用。
在国内外著名学术期刊和会议(如CIKM、ICSME、DASSFA)发表论文30 余篇,获得发明专利4 项。

马老师

中国科学院软件研究所高级工程师

主要研究方向为文本语义分析、数据挖掘。
在大数据智能分析和数据集成中间件领域进行长期的技术攻关、系统研发、系统应用等工作,参与多项国家科研项目和企业合作项目,取得较好的科研成果,积累丰富的经验。
产品已经在政务、军工、教育、医疗、法律等多个行业和领域进行了成功应用。
合作企业:京东、中航信、华为等。在国内外期刊会议发表论文10余篇,获得国家发明专利1项。