Python经济金融数据智能分析技术

2023年2月25日-3月3日

数据科学

第2期 Python经济金融数据智能分析技术

课程意义 :

Python是目前最流行的数据分析和机器学习编程语言,其在科学计算、机器学习及深度学习领域的得到了广泛应用,并应用到各专业领域,因为其开源特性,互联网存在大量Python实现的各领域最新算法方便我们查找和使用。

Python作为一种语言,但更多的是作为生态系统,是经济金融业理想的技术框架。利用Python大量的可用库和工具,能够应付当今金融业中分析数据量和频率、依从性及监管所引发的大部分问题。即使在较大型的金融机构中,它也具备提供单一、强大、一致性的框架,简化端到端开发和生产工作的潜力

此外,Python已经成为人工智能、特别是机器与深度学习工作者选择的编程语言。因此,Python对于数据驱动金融学人工智能驱动的金融学来说也是合适的语言,这两种当今的趋势将从根本上重塑金融学和金融行业。

金融科技时代已经到来,善于将金融理论与IT技术进行深度融合的人,将成为新时代独具竞争力的金融科技类人才,Python语言编程教育将很快成为各高校的必修课。

Python是教师和科研工作者开展科学研究和行业研究的高效工具,将智能数据分析计算与科研工作结合可以产出创新成果。

课程目标:

学习Python语言开展经济金融数据分析全流程,包含数据获取数据清洗转换数据统计分析机器学习数据挖掘分析数据可视化等步骤。

通过大量应用案例实践,掌握利用Python来解决日常工作和项目实施中经济金融数据分析类问题的基本方法。

学习了解金融数据分析相关前沿技术,包括大数据、深度学习、统计分析、自然语言处理等。

通过课题梳理的知识点体系,结合经济金融专业特点,辅助形成适合自己本学科的Python金融数据分析教学大纲。

适合人群:

1  各高等院校人工智能、数据科学、经济管理、信息管理、财务管理、统计分析相关学科;计算机、网络通信、自动化、电子工程、数理统计、电子商务、物联网工程、物流管理、信息与计算科学专等科研、教学带头人,骨干教师、博士生、硕士生;

2  从事人工智能,计算机、数据科学、互联网等相关领域的科研院所的项目负责人、科研人员、工程技术人员;

3  各地方政府信息中心负责人、技术骨干;

4  人工智能,数据科学,互联网产业投资团队,应用开发商,服务提供商等;

5  有志于数据分析,机器学习研究和应用的从业者。

时间 主题 大纲
第一天 经济金融数据分析基础 1.经济金融数据分析课程简介(PPT介绍)
2.科学计算基础库 Numpy(Jupyter Notebook编写python程序)
3.Numpy应用案例:个人理财规划(Jupyter Notebook编写python程序)
4数据分析与操作库Pandas(Jupyter Notebook编写python程序)
5. Pandas应用案例: 上市公司财务报表分析(Jupyter Notebook编写python程序)
6.科学计算基础算法库 SciPy介绍(Jupyter Notebook编写python程序)
第二天 经济金融数据可视化探索 1.数据可视化基本概念(PPT介绍)
2.基本绘图方法matplotlib(Python代码示例)
1)可视化图表的基本元素及图形属性设置
2)常见类型绘图:点线图、直方图、散点图、热力图、箱型图
2.统计绘图方法seaborn(Python代码示例)
1)变量分布图
2)回归分析图
3)关系分类图
3.交互绘图方法pyechart(Python代码示例)
1)K线图绘制
2)地理图表绘制
3)动态图表绘制
4.应用案例(Jupyter Notebook编写python程序)
1)股票交易数据分析
2)京东消费行为分析
第三天 经济金融数据爬虫与获取 1.网络数据爬虫基本原理(PPT介绍,网页示例)
1)网络传输协议HTTP与URL
2)网页组成HTML+CSS+JavaScript
2.股票信息抓取案例(Jupyter Notebook编写python程序)
1)网页请求:如何构建请求URL、使用requests库请求数据
2)网页解析:如何解析网页、使用BeautifulSoup库解析数据
3.金融历史数据的获取(Jupyter Notebook编写python程序)
1)通过tushare库获取历史数据
2)通过pandas_datareader库获取历史数据
4.应用案例(Jupyter Notebook编写python程序)
1)静态网页数据抓取——新浪财经大宗交易数据
2)动态网页数据抓取——上市公司信息披露报告
第四天 经济金融统计分析应用 1.统计分析库statsmodels简介
2.描述性统计(Jupyter Notebook编写python程序)
3.随机变量与随机过程(Jupyter Notebook编写python程序)
4.蒙特卡洛模拟及应用(估值、风险测度)(Jupyter Notebook编写python程序)
5.参数估计与检验(Jupyter Notebook编写python程序)
6.均值方差理论及投资组合优化(Jupyter Notebook编写python程序)
7.相关性分析与回归(Jupyter Notebook编写python程序)
第五天 经济金融量化投资策略与分析 1.量化交易概述(PPT)
2.金融时间序列数据(Python代码示例)
1) 时间序列基础
2) 重采样及频率转换
3) 移动窗口函数
3.金融时间序列模型(Python代码示例)
1) 时间序列数据特点
2) 时间序列预测方法
3) 时间序列波动建模
4) 时间序列因果关系
4.应用案例(Jupyter Notebook 编写Python代码)
1)金融量化交易策略实战——移动平均与海龟交易
2)资本资产定价模型实战——CAPM模型与FF3模型
第六天 经济金融量化投资策略与分析 1.机器学习与数据挖掘概述(PPT)
a)机器学习基础知识
b)常用机器学习模型简介
2.机器学习库scikit-learn简介
3.基于机器学习的股票预测(Jupyter Notebook编写python程序)
1)股票涨停分类预测
2)股票估值回归预测
4.聚类算法及应用(Jupyter Notebook编写python程序)
1)股票聚类
2)基于聚类交易策略
5.风控与贷款违约预测(Jupyter Notebook编写python程序)
第七天 深度学习在经济金融中的应用 1.深度学习与自然语言处理概述(PPT)
2.深度学习框架实践(Python代码示例)
1)多层神经网络回归
2)多层神经网络分类
3.文本表示方法实践(Python代码示例)
1)中文分词工具
2)文本表示方法
4.应用案例(Jupyter Notebook 编写Python代码)
1)基于股票的时间序列预测分析
2)基于股评的文本数据情感分析

刘老师

中国科学院软件研究所副研究员、硕士生导师,中国科学院青年创新促进会会员

作为负责人承担国家自然科学基金项目和国家重点研发计划课题,并作为骨干参与多个国家和部委科研项目。
在大数据挖掘分析平台及优化关键技术方向,研究大数据分析开发环境、大数据分布式系统优化、自动化机器学习等,研制可视化大数据分析平台,在医疗、科学大数据领域应用。在知识图谱与语义计算方向,研究知识图谱构建管理、问答系统等,在民航领域和法律领域开展应用。
在国内外著名学术期刊和会议(如CIKM、ICSME、DASSFA)发表论文30 余篇,获得发明专利4 项。

马老师

中国科学院软件研究所高级工程师

主要研究方向为文本语义分析、数据挖掘。
在大数据智能分析和数据集成中间件领域进行长期的技术攻关、系统研发、系统应用等工作,参与多项国家科研项目和企业合作项目,取得较好的科研成果,积累丰富的经验。
产品已经在政务、军工、教育、医疗、法律等多个行业和领域进行了成功应用。
合作企业:京东、中航信、华为等。在国内外期刊会议发表论文10余篇,获得国家发明专利1项。