用Pandas Dataframe来架构起金融股票数据的内部形态

2. 金融股票数据的另一个形态,怎样在业务内部流动,同时怎样避免错误

前一篇讲解了股票的原始状态,那麽在业务过程中,数据会变成怎样的形态,来完成众多奇奇怪怪的业务呢,以下将会解答。

首先,任何股票都有机会停市,退市。或者退市了再二次上市。

例子,阿里爸爸(9988.HK)在港交所二次上市。

再例如,富力地产(2777.HK),12供2股的方法向市场增发当天,停牌一天。

这种情况下,某些股票的数据就会断断续续,不连贯。

那麽惟一叁考的标准,就只有大盘指数的数据,才是最信得过的依靠。

因此把数据拿了回来,应该用大市指数的交易日,作为整个Dataframe的index,然后注入其他股票数据在这Dataframe,才能最完整地保证不出错。

以上数据全是乱编,不用细看。

假设邵匡概念基金,在1月9日~1月10日之间停牌分红,那麽该2天就不会有收市价。

可其他股票0700腾讯,1299友邦是正常交易日。

所以这就避免了很多业务问题,如:

a. 邵匡概念基金和友邦的过往5天股价对比图,由於邵匡概念基金是停牌,所以那2天不能画到股价线。这避免了拿错了1月2日,1月3日,1月7日,1月8日,1月11日,这样5个交易日的数据。

b. 计算含多只股票的板块的贝塔值,波动率等,由於邵匡概念基金和该2天停牌,那麽计算均值应该是(370+82)/2,(腾讯+友邦)/2。而不是(370+82+0)/3,(腾讯+友邦+邵匡概念)/3,这样计算肯定寻死。

原文地址:https://www.cnblogs.com/chenkuang/p/12236084.html

时间: 2024-10-05 11:04:41

用Pandas Dataframe来架构起金融股票数据的内部形态的相关文章

股票数据的原始数据形态&数据驱动来设计金融股票业务场景

1. 数据源 其实金融数据没大家想象的那麽复杂,只需要最原始状态的数据,保存到本地即可以. 那麽,怎样才是股票数据的原始状态呢.那就看看1920's年代的道氏理论,他是怎样计算道琼斯指数,那麽他采用的就是最原始形态. 假设股票是一个有市价的产品,全由市场价格来操作,那麽以下的数据,就能体现一个市场价格竞争商品的原始状态. 日期和股票编号是主键,股票名称是外键. 因为每只股票编号和交易日,必定是独一无异,而且这里涉及2个业务场景: a. 抓取2020年1月18日的港股数据 b. 抓取00700.H

数据分析--pandas DataFrame

pandas DataFrame是一个表格类型的数据,含有一组有序的列,每列可以是不同的值类型(数值,字符串,布尔值).DataFrame即有行索引,也有列索引,可以看作由Series组成的字典(公用同一个索引). DataFrame是以一个或者多个二维块存放的(而不是列表,字典或别的一维数据结构) 构建DataFrame 传入一个等长列表或Numpy数组组成的字典 DataFrame会自动加上索引,且全部列会被有序排列 可以指定序列的排序 传入的列在数据中找不到,会产生Na值 从DataFra

python+Sqlite+Dataframe打造金融股票数据结构

5. 本地数据库 很简单的用本地Sqlite查找股票数据. DataSource类,返回的是Dataframe物件.这个Dataframe物件,在之后的业务,如计算股票指标,还需要特别处理. import os import sqlite3 as sqlite3 import numpy as np import pandas as pd # 数据源 class DataSource: def __init__(self): self.db = None # 数据库 self.cursor =

pandas.DataFrame.plot

pandas.DataFrame.plot¶ DataFrame.plot(x=None, y=None, kind='line', ax=None, subplots=False, sharex=None, sharey=False, layout=None, figsize=None, use_index=True, title=None, grid=None, legend=True, style=None, logx=False, logy=False, loglog=False, xt

pandas.DataFrame学习系列2——函数方法(1)

DataFrame类具有很多方法,下面做用法的介绍和举例. pandas.DataFrame学习系列2--函数方法(1) 1.abs(),返回DataFrame每个数值的绝对值,前提是所有元素均为数值型 1 import pandas as pd 2 import numpy as np 3 4 df=pd.read_excel('南京银行.xlsx',index_col='Date') 5 df1=df[:5] 6 df1.iat[0,1]=-df1.iat[0,1] 7 df1 8 Open

pandas.DataFrame学习系列1——定义及属性

定义: DataFrame是二维的.大小可变的.成分混合的.具有标签化坐标轴(行和列)的表数据结构.基于行和列标签进行计算.可以被看作是为序列对象(Series)提供的类似字典的一个容器,是pandas中主要的数据结构. 形式: class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False) 参数含义: data : numpy ndarray(多维数组)(结构化或同质化的), dict(字典

Python pandas.DataFrame调整列顺序及修改index名

1. 从字典创建DataFrame >>> import pandas >>> dict_a = {'user_id':['webbang','webbang','webbang'],'book_id':['3713327','4074636','26873486'],'rating':['4','4','4'],'mark_date':['2017-03-07','2017-03-07','2017-03-07']} >>> df = pandas.

Python Pandas -- DataFrame

pandas.DataFrame class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)[source] Two-dimensional size-mutable, potentially heterogeneous tabular data structure with labeled axes (rows and columns). Arithmetic operations al

pandas DataFrame(1)

之前介绍了numpy的二维数组,但是numpy二维数组有一些局限性,比如,它数组里所有的值的类型必须相同,不能某一列是数值型,某一列是字符串型,这样会导致无法使用 mean() , std() 等方法去计算某一行或某一列. 但是,使用pandas DataFrame可以解决这一问题. pandas DataFrame也是二维数据,和pandas Series一样, pandas DataFrame也有'索引'这个概念,它每一列都有一个索引值: import pandas as pd df = p