进阶必备-定制自己的数据接口 -《AKShare 源码解析》

数据科学实战

共 5853字,需浏览 12分钟

 ·

2024-06-23 12:00

前言

AKShare 开源财经数据接口库,目前在 GitHub 已有 8.5K star,同时也是目前国内最流行的开源财经数据接口库之一。无论在学术研究、量化投研还是数据科学(人工智能与大模型)领域,AKShare 都占据一席之地!随着现在大模型领域如火如荼的发展,在财经领域,采集到高质量的财经数据的价值越来越凸显,比如最新的学术论文《AlphaFin: Benchmarking Financial Analysis with RetrievalAugmented Stock-Chain Framework》就利用 AKShare 来采集数据,在流行的开源组织 AI4Finance 中 FinRL 项目也集成 AKShare 来获取财经数据!

本次推出《AKShare 源码解析》课程,秉承授人以鱼不如授人以渔的宗旨,通过对 AKShare 源码的解析,让大家了解并掌握相关财经接口的使用及进一步开发的方法,在讲解源码的过程中了解如何进行财经网络数据采集。从而让使用 AKShare 的小伙伴能够定制适合自己的数据接口,也能够掌握网络数据采集中的各项工具和技能。

课程简介

《AKShare 源码解析》课程采用录制视频进行教学,方便大家不断巩固学习。每节课程都会按照知识点介绍、实战应用和总结三部分进行,同时课程配套:教程、代码和参考资料。既可以让大家了解相关 AKShare 接口的使用,也可以学习其实现原理,并且会给大家介绍在财经网络数据采集中的注意事项,以解决碰到的各种实际问题。

课程特色

  1. 以财经数据为特色:在讲授网络数据采集的过程中结合财经数据自身的特点,所有案例都围绕财经数据展开
  2. 以实际案例为核心:利用最合适的技术栈解决实际问题
  3. 丰富数据衍生后续:数据清洗、数据分析、数据可视化及相关财经知识
  4. 课程配套资料丰富:教程、代码和参考资料等一应俱全
  5. 持续更新维护:课程动态更新,案例不断增加
  6. 结识更多大佬:由 AKShare 和 PyBroker 的维护者亲自讲解,还有更多领域的大佬参与!

适用人群

  1. 对利用 Python 进行财经网络数据采集感兴趣的小伙伴
  2. 对量化投资领域感兴趣的小伙伴,拓展策略的数据来源
  3. 对参与开源项目感兴趣的小伙伴,通过本课程的学习,手把手教学如何给开源项目提交代码!

得到的收获

  1. 了解国内外学术数据源、业界数据源及另类数据源,扩充数据的广度和深度
  2. 掌握利用 Python 进行财经数据采集的技能,提高获取数据的能力
  3. 掌握流行开源项目的开发流程并可以参与到 AKShare 项目中,让自己开发的接口给广大小伙伴使用
  4. 为进一步进行量化投研、数据科学打下坚实的基础
  5. 结识一群志同道合的朋友,共同学习交流,不断提升技能

课程目录

前置知识(已更新完毕)

  1. 第一章:选择趁手的工具
    1. Python 介绍及版本选择
    2. IDE 介绍及版本选择
    3. 虚拟环境搭建
    4. 需要使用到的相关工具介绍
  2. 第二章:网页知识初探
    1. HTML
    2. CSS
    3. JavaScript
    4. 网页结构介绍
  3. 第三章:财经数据源介绍
    1. 国内财经数据源
    2. 国际财经数据源
    3. 业界财经数据源
    4. 学界财经数据源
    5. 另类财经数据源

网络数据采集基础(正在更新中)

  1. 第四章:网络数据采集基础
    1. HTTP 及网络数据采集的基本原理
    2. 网络请求库 requests 介绍和使用
    3. 解析库 beautifulsoup 介绍和使用
  2. 第五章:网络数据采集进阶
    1. 多线程、多进程和协程
    2. JavaScript 动态渲染页面采集
    3. 模拟登录
    4. JavaScript 逆向
    5. 网页通用解析工具
    6. Scrapy 框架
  3. 第六章:数据效验
    1. 通用数据验证库 pandatic 库介绍
    2. pandas.DataFrame 数据效验库 pandera 库介绍
    3. 先验知识介绍
  4. 第七章:本地数据存储
    1. CSV 数据存储
    2. JSON 数据存储
    3. MySQL 数据存储

数据处理基础

  1. 第八章:数据清洗
    1. 文本数据清洗
    2. JSON 数据清洗
    3. 特殊数据格式处理
  2. 第九章:数据处理
    1. Pandas 介绍
    2. 缺失值处理
    3. 重复值处理
    4. 异常值处理
    5. 数据整合
    6. 数据格式转换

财经数据采集

  1. 第十章:股票数据采集
    1. 龙虎榜
    2. 热门股票
    3. 资金流入
    4. 概念板块
    5. …………
    6. 东方财富
    7. 新浪财经
    8. 其他网站
    9. 东方财富
    10. 新浪财经
    11. 其他网站
    12. 股票量价数据
    13. 股票财务数据
    14. 股票衍生数据
  2. 第十一章:期货数据采集
    1. 基差计算
    2. …………
    3. 期货手续费
    4. 主力合约
    5. OHLC 数据
    6. 持仓数据
    7. 龙虎榜数据
    8. 期货量价数据
    9. 期货特色数据
    10. 期货衍生数据
  3. 第十二章:宏观数据采集
    1. 国内宏观数据
    2. 国际宏观数据
    3. 国际财经数据采集-英为财情
    4. 商品指数
    5. …………
  4. 第十三章:另类数据采集
    1. 空气指数数据采集
    2. 财富数据采集
    3. 电竞数据采集
    4. 娱乐数据采集
    5. 电影票房数据采集
    6. 奥运会数据采集
    7. 疫情数据采集
    8. …………

数据分析及可视化

  1. 第十四章:财经数据可视化
    1. 股票数据分析及可视化
    2. 期货数据分析及可视化
    3. 基金数据分析及可视化
  2. 第十五章:另类数据可视化
    1. 数据可视化工具:matplotlib
    2. 动态可视化工具:pyecharts 和 plotly 衍生知识
  3. 第十六章:财经衍生知识
    1. 基础产品
    2. 衍生产品
  4. 第十七章:财经数据工具
    1. AKShare 及其他数据接口库
    2. AKTools HTTP API 工具
    3. 网络数据采集提高


扫描二维码即可进入课程页面


🔆Q&A

Q1. 学员如何找到我的已购课程?

A. 微信搜索【小鹅通小程序】或者下载【小鹅通APP】两种方式查看我的已购课程

Q2. 如何在PC端观看课程?

A.  方法一: 在电脑端登录微信,通过微信小程序观看;

方法二:通过Q1进入课程页面后,点击“分享“获取课程链接,在浏览器粘贴链接后登录订阅课程的账号即可通过浏览器观看课程

Q3. 如何同时绑定微信和QQ账号?

A.  用微信/QQ登录小鹅通时,绑定同一个手机号,即可促进账号融合。



👇点击阅读原文也可跳转到课程页面


浏览 16
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报