Python智能数据分析指采用机器学习、深度学习等人工智能技术开展领域数据分析,是大数据人工智能时代的核心技术,也是目前学术界和工业界的热点研究方向。
Python是目前最流行的数据分析和机器学习编程语言,其在科学计算、机器学习及深度学习领域的得到了广泛应用,并应用到各专业领域,因为其开源特性,互联网存在大量Python实现的各领域最新算法方便我们查找和使用。
掌握Python智能数据分析编程技术的人才在市场上炙手可热,Python语言编程教育将很快成为各高校的必修课。
Python是教师和科研工作者开展科学研究的高效工具,将智能数据分析计算与科研工作结合可以产出创新成果。
为加强数据分析的创新发展和技术应用,打造Python智能数据分析专业技术人才队伍,雷课将特别邀请在Python数据分析学术和研发领域一线专家,举办《Python进阶智能数据分析前沿技术与应用案例》高级培训班。
课程目标:
本课程是《Python智能数据分析前沿技术与应用案例》的高级进阶课程。基础课让学员零基础入门掌握Python智能数据分析的基本概念和常用工具,可以完成简单应用案例
高级进阶课的设计目标是让学员学习高级智能分析技术,深入理解数据分析理论知识,掌握更丰富的python软件包工具,开展更加贴合实际的高级综合应用案例。
学习掌握Python语言开展智能数据分析全流程的理论、方法及工具,包含网络数据爬虫、数据探索、数据清洗转换、数据统计建模分析、机器学习与深度学习数据分析、数据可视化等步骤。
通过“新理论、新工具、新案例”三位一体的强化学习,进一步精通Python智能数据分析的核心技术,助力科技创新与教学工作。
通过大量应用案例与实战项目的代码实践,掌握利用Python来解决日常科研工作和项目实施中智能数据分析类问题的基本方法。
学习掌握数据分析相关前沿技术,包括大数据、机器学习、深度学习、图像识别、自然语言处理等。
适合人群:
1 各高等院校人工智能、数据科学、经济管理、信息管理、财务管理、统计分析相关学科;计算机、网络通信、自动化、电子工程、数理统计、电子商务、物联网工程、物流管理、信息与计算科学专等科研、教学带头人,骨干教师、博士生、硕士生;
2 从事人工智能,计算机、数据科学、互联网等相关领域的科研院所的项目负责人、科研人员、工程技术人员;
3 各地方政府信息中心负责人、技术骨干;
4 人工智能,数据科学,互联网产业投资团队,应用开发商,服务提供商等;
5 有志于数据分析,机器学习研究和应用的从业者。
时间 | 主题 | 大纲 |
---|---|---|
3月12日 | Numpy/Pandas数据分析处理进阶 | 1.Python智能数据分析进阶课知识体系解析(PPT介绍) 2.Numpy高级功能(Python代码示例) 1)广播broadcast 2)数组连接、拆分 3)排序、搜索、计数 4)金融函数 3.Pandas高级功能(Python代码示例) 1)自定义处理函数map\apply\applymap 2)高级查询统计crosstab\pivot_table\groupby 3)时序数据处理 4)分类数据处理 案例: Case 1:基于Numpy的医疗影像处理 Case 2:基于Pandas的报警电话时间序列分析 |
3月13日 | Python网络爬虫及信息抽取进阶 | 1.网络爬虫高级技术(PPT介绍) 1)网页数据解析,图片、视频、文本、表格、列表 2)动态网页爬取,如何解析AJAX请求API 3)高效率爬虫,多线程与多进程 2.文本模式匹配Re(Python代码示例) 1)常用匹配规则 2)提取特定内容 3)统一数据格式 3.爬虫框架Scrapy(Python代码示例) 1)Scrapy架构流程 2)Scrapy项目使用 3)Scrapy框架封装 案例: Case3:动态网页请求分析与腾讯天气数据抓取 Case4:爬虫框架封装与国家统计局行政区划数据采集 Case5:政府公文爬取与结构化经济指标数据提取 |
3月14日 | Python数据可视化分析进阶 | 1.matplotlib高级绘图方法(Python代码示例) 1)3D图 2)K线图 3)多子图 2.seaborn统计绘图方法(Python代码示例) 1)变量分布图 2)回归分析图 3)关系分类图 3.pyechart交互绘图方法(Python代码示例) 1)动态图表 2)组合图表 3)地理图表 案例: Case6:疫情数据的可视化探索分析 Case7:金融数据的可视化探索分析 Case8:NBA比赛数据的可视化探索分析 |
3月15日 | Python数据统计建模分析进阶 | 1.统计分析概述(PPT) 2.Statsmodels工具(Python代码示例) a)回归与线性模型 b)离散选择模型Discrete Choice Model, DCM c)时间序列分析Time Series Analysis d)状态空间模型State space models 案例: Case9:计量经济学案例:人均现金消费与收入建模分析 Case10:离散选择模型案例:研究生录取因素分析 |
3月16日 | Python机器学习数据分析进阶 | 1.Scikit-learn进阶(Python代码示例) a)数据预处理、评价指标 b)无监督学习 c)半监督学习 2.概率模型 PyMC3(Python代码示例) a)贝叶斯、高斯过程等 3.高效的集成学习库XGBoost\LightGBM(Python代码示例) 4.自动化机器学习AutoML(Python代码示例) 案例: Case11:基于XGBoost的大数据比赛案例 |
3月17日 | Python深度学习数据分析进阶 | 1.深度学习前沿技术(PPT介绍) 1)从AlphaGo到AlphaFold 2)Capsule新计算框架 3)Attention机制与Transformer模型 4)Bert时代的创新应用 2.PyTorch深度学习实践(Python代码示例) 1)PyTorch与科学计算 2)简单神经网络构建 3)复杂网络模型构建 4)预训练模型的使用 5)图像生成与对抗学习 案例: Case12:时尚物品识别分类与迁移学习 Case13:少样本精准分类与孪生网络 |
3月18日 | Python智能数据分析高级项目实战 | 1.综合案例:Case 14上市公司综合评价与收益分析 1)上市公司综合评价模型及方法基本介绍; 2)基于投资规模与效率指标的综合评价方法; 3)基于成长与价值指标的综合评价方法; 4)指标数据选取及数据预处理; 5)量化投资策略设计实现及结果分析。 2.综合案例:Case 15基于视频图像的车牌检测与识别 1) 车辆图像获取 2) 车辆牌照检测 3) 牌照字符分割 4) 牌照字符识别 3.综合案例:Case 16中国移动用户人群画像与信用分值评估 1)多维度数据探索分析 2)用户关键特征提取 3)消费者人群画像 4)信用体系模型构建 5)用户消费信用评估 |
刘老师中国科学院软件研究所副研究员、硕士生导师,中国科学院青年创新促进会会员 |
|
---|---|
作为负责人承担国家自然科学基金项目和国家重点研发计划课题,并作为骨干参与多个国家和部委科研项目。
在大数据挖掘分析平台及优化关键技术方向,研究大数据分析开发环境、大数据分布式系统优化、自动化机器学习等,研制可视化大数据分析平台,在医疗、科学大数据领域应用。在知识图谱与语义计算方向,研究知识图谱构建管理、问答系统等,在民航领域和法律领域开展应用。
在国内外著名学术期刊和会议(如CIKM、ICSME、DASSFA)发表论文30 余篇,获得发明专利4 项。
马老师中国科学院软件研究所高级工程师 |
|
---|---|
主要研究方向为文本语义分析、数据挖掘。
在大数据智能分析和数据集成中间件领域进行长期的技术攻关、系统研发、系统应用等工作,参与多项国家科研项目和企业合作项目,取得较好的科研成果,积累丰富的经验。
产品已经在政务、军工、教育、医疗、法律等多个行业和领域进行了成功应用。
合作企业:京东、中航信、华为等。在国内外期刊会议发表论文10余篇,获得国家发明专利1项。