针对可交易的投资商品,理性地运用逻辑分析和回归统计判断市场趋势称为量化交易。
量化策略
量化策略就是赚钱"因子",可以分为基本面和技术面。
- 基本面
- 居民消费指数
- 人均国内生产总值(GDP)
- 净资产收益率(ROE)
- 技术面
- 股票收盘价
- K线(日/周/月/年)
- 均线(5/10/20/60)
技术面分析更关注基于商品价格相关的数值和合成的指标。基本面更关注企业本身和宏观经济,大的市场环境的变化。
获取股票数据
使用JQData查询行情数据
申请试用:https://www.joinquant.com/default/index/sdk#jq-sdk-apply
安装环境
pip install jqdatasdk
登录并查询股票数据
from jqdatasdk import * if __name__ == '__main__': auth('账户', '密码') # 获取深交所(XSHE)股票代码为000001的在2024年的股票数据(开盘价和收盘价) df = get_price('000001.XSHE', count=2, end_date='2024-05-01', frequency='daily', fields=['open', 'close']) print(df)
运行结果
auth success
open close
2024-04-29 9.86 10.09
2024-04-30 10.08 10.07
当然我们也可以不考虑设置字段,取更多数据
from jqdatasdk import * if __name__ == '__main__': auth('账户', '密码') # 获取深交所(XSHE)股票代码为000001的在2024年的股票数据(开盘价和收盘价) df = get_price('000001.XSHE', count=100, end_date='2024-05-01', frequency='daily') print(df)
运行结果
auth success
open close high low volume money
2023-11-30 9.04 9.03 9.08 8.98 96617632.0 8.714817e+08
2023-12-01 9.01 9.02 9.03 8.94 83363249.0 7.496684e+08
2023-12-04 9.03 8.99 9.03 8.97 64868341.0 5.836643e+08
2023-12-05 8.97 8.85 8.98 8.84 84361980.0 7.509612e+08
2023-12-06 8.81 8.87 8.93 8.77 80684563.0 7.140295e+08
... ... ... ... ... ... ...
2024-04-24 9.82 9.83 9.87 9.76 100882258.0 9.890935e+08
2024-04-25 9.80 9.90 9.91 9.78 119337026.0 1.176305e+09
2024-04-26 9.88 9.89 9.96 9.78 172245805.0 1.698581e+09
2024-04-29 9.86 10.09 10.17 9.82 232411861.0 2.337351e+09
2024-04-30 10.08 10.07 10.15 10.01 141916771.0 1.431408e+09
[100 rows x 6 columns]
这里我们需要跟真实数据进行比对,比对结果如下
这里我们可以看到平安银行4月30号的开盘价是10.08,收盘价是10.07,这是能对上的。
如果我们想获取的是分钟数据
from jqdatasdk import * if __name__ == '__main__': auth('账户', '密码') # 获取深交所(XSHE)股票代码为000001的在2024年的股票数据(开盘价和收盘价) df = get_price('000001.XSHE', count=10, end_date='2024-05-01', frequency='1m') print(df)
运行结果
auth success
open close high low volume money
2024-04-30 14:51:00 10.07 10.07 10.08 10.06 2238011.0 22551672.0
2024-04-30 14:52:00 10.07 10.08 10.08 10.07 385071.0 3880720.0
2024-04-30 14:53:00 10.07 10.08 10.08 10.07 309964.0 3123238.0
2024-04-30 14:54:00 10.07 10.07 10.08 10.07 608250.0 6127837.0
2024-04-30 14:55:00 10.08 10.08 10.08 10.07 795964.0 8022444.0
2024-04-30 14:56:00 10.08 10.08 10.09 10.07 1819929.0 18335986.0
2024-04-30 14:57:00 10.07 10.07 10.08 10.07 350484.0 3530845.0
2024-04-30 14:58:00 10.07 10.07 10.07 10.07 14571.0 146823.0
2024-04-30 14:59:00 10.07 10.07 10.07 10.07 0.0 0.0
2024-04-30 15:00:00 10.07 10.07 10.07 10.07 3000536.0 30217395.0
具体的时间设置可以在https://joinquant.com/help/api/help#name:api查询。
获取A股所有的行情数据
from jqdatasdk import * if __name__ == '__main__': auth('账户', '密码') # 获取所有的股票代码 stocks = list(get_all_securities(['stock']).index) print(stocks)
运行结果
['000001.XSHE', '000002.XSHE', '000004.XSHE', '000005.XSHE', '000006.XSHE', '000007.XSHE',
'000008.XSHE', '000009.XSHE', '000010.XSHE', '000011.XSHE', '000012.XSHE', '000014.XSHE',
'000016.XSHE', '000017.XSHE', '000018.XSHE', '000019.XSHE', '000020.XSHE', '000021.XSHE',
'000022.XSHE', '000023.XSHE', '000024.XSHE', '000025.XSHE', '000026.XSHE', '000027.XSHE',
'000028.XSHE', '000029.XSHE', '000030.XSHE', '000031.XSHE', '000032.XSHE', '000033.XSHE',
'000034.XSHE', '000035.XSHE', '000036.XSHE', '000037.XSHE', '000038.XSHE', '000039.XSHE',
'000040.XSHE', '000042.XSHE', '000043.XSHE', '000045.XSHE', '000046.XSHE', '000048.XSHE',
'000049.XSHE', '000050.XSHE', '000055.XSHE', '000056.XSHE', '000058.XSHE', '000059.XSHE',
'000060.XSHE', '000061.XSHE', '000062.XSHE', '000063.XSHE', '000065.XSHE', '000066.XSHE',
'000068.XSHE', '000069.XSHE', '000070.XSHE', '000078.XSHE', '000088.XSHE', '000089.XSHE',
'000090.XSHE', '000096.XSHE', '000099.XSHE', '000100.XSHE', '000150.XSHE', '000151.XSHE',
'000153.XSHE', '000155.XSHE', '000156.XSHE', '000157.XSHE', '000158.XSHE', '000159.XSHE',
'000166.XSHE', '000301.XSHE', '000333.XSHE', '000338.XSHE', '000400.XSHE', '000401.XSHE',
'000402.XSHE', '000403.XSHE', '000404.XSHE', '000406.XSHE', '000407.XSHE', '000408.XSHE',
'000409.XSHE', '000410.XSHE', '000411.XSHE', '000413.XSHE', '000415.XSHE', '000416.XSHE',
'000417.XSHE', '000418.XSHE', '000419.XSHE', '000420.XSHE', '000421.XSHE', '000422.XSHE',
'000423.XSHE', '000425.XSHE', '000426.XSHE', '000428.XSHE', '000429.XSHE', '000430.XSHE',
'000488.XSHE', '000498.XSHE', '000501.XSHE', '000502.XSHE', '000503.XSHE', '000504.XSHE',
'000505.XSHE', '000506.XSHE', '000507.XSHE', '000509.XSHE', '000510.XSHE', '000511.XSHE',
'000513.XSHE', '000514.XSHE', '000515.XSHE', '000516.XSHE', '000517.XSHE', '000518.XSHE',
'000519.XSHE', '000520.XSHE', '000521.XSHE', '000522.XSHE', '000523.XSHE', '000524.XSHE',
'000525.XSHE', '000526.XSHE', '000527.XSHE', '000528.XSHE', '000529.XSHE', '000530.XSHE',
'000531.XSHE', '000532.XSHE', '000533.XSHE', '000534.XSHE', '000535.XSHE', '000536.XSHE',
'000537.XSHE', '000538.XSHE', '000539.XSHE', '000540.XSHE', '000541.XSHE', '000543.XSHE',

from jqdatasdk import * if __name__ == '__main__': auth('账户', '密码') # 获取所有的股票代码 stocks = list(get_all_securities(['stock']).index) # print(stocks) # 获取A股所有的行情数据 for stock in stocks: df = get_price(stock, count=10, end_date='2024-05-01', frequency='daily', panel=False) print(df)
运行结果
auth success
open close high low volume money
2024-04-17 9.58 9.91 9.92 9.53 239211490.0 2.337577e+09
2024-04-18 9.87 10.08 10.29 9.86 339205099.0 3.427339e+09
2024-04-19 10.00 9.98 10.10 9.95 156179466.0 1.562376e+09
2024-04-22 9.93 9.80 10.09 9.75 215337682.0 2.125723e+09
2024-04-23 9.81 9.84 9.94 9.76 132860036.0 1.308866e+09
2024-04-24 9.82 9.83 9.87 9.76 100882258.0 9.890935e+08
2024-04-25 9.80 9.90 9.91 9.78 119337026.0 1.176305e+09
...
使用resample函数转化时间序列
日K => 周K
日期 | 周期 | 开盘价 | 收盘价 | 最高价 | 最低价 | 成交量 |
---|---|---|---|---|---|---|
1月1日 | 周一 | 1.11 | 1.23 | 1.31 | 1.01 | 122 |
1月2日 | 周二 | 1.22 | 1.33 | 1.41 | 1.02 | 133 |
1月3日 | 周三 | 1.33 | 1.43 | 1.51 | 1.03 | 144 |
1月4日 | 周四 | 1.44 | 1.53 | 1.61 | 1.04 | 155 |
1月5日 | 周五 | 1.55 | 1.63 | 1.71 | 1.05 | 166 |
这里我们需要将日K转化为周K,周K的开盘价是当周第一天的开盘价,即这里周一的开盘价1.11;收盘价是当周最后一天的收盘价,即这里周五的收盘价1.63;最高价是当周的最高价,即这里的周五的最高价1.71;最低价是当周的最低价,即这里周一的最低价1.01。周成交量即是把每天的成交量加和,这里Sum=720。
月K,年K的选取规则是一样的,只不过月K的周期是一个月,年K的周期是一年。
from jqdatasdk import * import pandas as pd if __name__ == '__main__': auth('账户', '密码') # 转换周期:日K转换为周K df = get_price('000001.XSHE', count=20, end_date='2024-05-01', frequency='daily', panel=False) # 增加星期几的字段,0表示星期一,1表示星期二,以此类推 df['weekday'] = df.index.weekday print(df) df_week = pd.DataFrame() # 获取周开盘价,这里取一周最后一天周日的日期表示一周 df_week['open'] = df['open'].resample('W').first() # 获取周收盘价 df_week['close'] = df['close'].resample('W').last() # 获取周最高价 df_week['high'] = df['high'].resample('W').max() # 获取周最低价 df_week['low'] = df['low'].resample('W').min() # 获取周成交量 df_week['volume'] = df['volume'].resample('W').sum() # 获取周成交额 df_week['money'] = df['money'].resample('W').sum() print(df_week)
运行结果
auth success
open close high low volume money weekday
2024-04-01 9.82 9.93 9.94 9.81 127616567.0 1.261770e+09 0
2024-04-02 9.92 9.85 9.97 9.83 116299099.0 1.149701e+09 1
2024-04-03 9.83 9.76 9.85 9.73 105197770.0 1.028649e+09 2
2024-04-08 9.73 9.73 9.79 9.68 97110056.0 9.452904e+08 0
2024-04-09 9.73 9.71 9.77 9.67 91838221.0 8.914690e+08 1
2024-04-10 9.69 9.59 9.72 9.59 133541874.0 1.288696e+09 2
2024-04-11 9.56 9.57 9.60 9.45 108237150.0 1.030820e+09 3
2024-04-12 9.54 9.39 9.59 9.37 139870040.0 1.322012e+09 4
2024-04-15 9.40 9.60 9.63 9.39 155700279.0 1.486326e+09 0
2024-04-16 9.59 9.59 9.70 9.54 158361046.0 1.523138e+09 1
2024-04-17 9.58 9.91 9.92 9.53 239211490.0 2.337577e+09 2
2024-04-18 9.87 10.08 10.29 9.86 339205099.0 3.427339e+09 3
2024-04-19 10.00 9.98 10.10 9.95 156179466.0 1.562376e+09 4
2024-04-22 9.93 9.80 10.09 9.75 215337682.0 2.125723e+09 0
2024-04-23 9.81 9.84 9.94 9.76 132860036.0 1.308866e+09 1
2024-04-24 9.82 9.83 9.87 9.76 100882258.0 9.890935e+08 2
2024-04-25 9.80 9.90 9.91 9.78 119337026.0 1.176305e+09 3
2024-04-26 9.88 9.89 9.96 9.78 172245805.0 1.698581e+09 4
2024-04-29 9.86 10.09 10.17 9.82 232411861.0 2.337351e+09 0
2024-04-30 10.08 10.07 10.15 10.01 141916771.0 1.431408e+09 1
open close high low volume money
2024-04-07 9.82 9.76 9.97 9.73 3.491134e+08 3.440120e+09
2024-04-14 9.73 9.39 9.79 9.37 5.705973e+08 5.478288e+09
2024-04-21 9.40 9.98 10.29 9.39 1.048657e+09 1.033676e+10
2024-04-28 9.93 9.89 10.09 9.75 7.406628e+08 7.298568e+09
2024-05-05 9.86 10.07 10.17 9.82 3.743286e+08 3.768759e+09
如果我们要转换月K,只需要进行如下修改即可
df = get_price('000001.XSHE', start_date='2024-01-01', end_date='2024-05-01', frequency='daily', panel=False)
df_mounth = pd.DataFrame() # 获取月开盘价 df_mounth['open'] = df['open'].resample('M').first() # 获取月收盘价 df_mounth['close'] = df['close'].resample('M').last() # 获取月最高价 df_mounth['high'] = df['high'].resample('M').max() # 获取月最低价 df_mounth['low'] = df['low'].resample('M').min()
使用JQData查询财务指标
- 资产负债表:体现企业家底和负债情况。
- 利润表:公司盈利能力,赚了多少,怎么赚的。隐含着对未来利润增长的预期。体现市场空间、成长能力。资产负债表和利润表都是基于权责发生制(比如商业合同,应收账款)。
- 现金流量表:基于收付实现制,只有资金真实到账,现金流量表上才会有。体现造血能力、竞争优势、议价优势。
from jqdatasdk import * import pandas as pd if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) # 获取股票财务指标 df = get_fundamentals(query(indicator), statDate='2023') df.to_csv('finance2023.csv')
运行结果
上图中,code为股票代码;statDate为报表对应的期末值;pubDate为报表公布日期,该日期最晚要在第二年4月份公布,每家公司公布的时间不太一样;eps为每股收益,表示净利润/股本数,代表公司盈利能力;operating_profit为经营活动净收益=营业总收入-营业总成本;roe为净资产收益率,归属于母公司的两倍的净利润/归属于母公司净资产,相当于公司资产的产出;inc_net_profit_year_on_year为净利润的同比增长率=\(今年的利润-去年的利润\over 去年的利润\)。
from jqdatasdk import * import pandas as pd if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) # 获取股票财务指标 df = get_fundamentals(query(indicator), statDate='2023') # df.to_csv('finance2023.csv') # 基于盈利指标选股:eps,operating_profit,roe,inc_net_profit_year_on_year df = df[(df['eps'] > 0) & (df['operating_profit'] > df['operating_profit'].mean()) & (df['roe'] > 11) & (df['inc_net_profit_year_on_year'] > 10)] print(df)
运行结果(略)
使用JQData查询估值指标
对企业进行估值,分为绝对估值和相对估值。
- 绝对估值法
绝对估值法是一种定价模型,计算企业的内在价值。
上图是伊利股份的极简的DCF模型(现金流折现模型),FCFF实际值表示该公司近n年的现金流情况,借此去预测该公司未来n年的现金流情况(FCFF预测值)。按照预测的数据进行折现,也就是未来n年的价格换算到今天是多少钱来判断当前的股价是贵还是便宜。贵还是便宜决定我们是否购买,一般来说一个公司越值钱它的股价是越贵的,但这个不绝对,我们想要的就是找到一个公司价值不错但是股价不高的公司,利用公司本身的内在价值和它在市场价格的差价赚钱。
在绝对估值法中有一个很重要的指标叫做折现率,即未来的钱转化为现在的钱要折掉多少,这里设置的是10%,这个值是可以随意调整的,这个值设置不同会导致我们最后计算企业价值不同。
我们将企业价值除以股本数得到上图中的每股价值28.2,但是我们看到现在市场的价值是48.8,它们差了20.6,处于高估的情况,做过对比之后,我们的选择应该是不购买该公司的股票。现金流折算模型中的参数会极大影响最终的结果,从而很难利用这样的模型去做出准确的判断。
- 相对估值法
估值指标:PE市盈率,PB市净率,PS市销率
计算方法 | 含义 | 公式 | 统计方式 |
---|---|---|---|
PE市盈率 | 市值收益率,可理解为:按当前收益水平,需要多少年收回成本,与盈利增速有关 | \(Price(每股价格or市值)\over Earnings(每股收益or净利润)\) |
|
PS市销率 | 市值主营收比,考察收益的稳定性与可靠性 | \(Price(每股价格or市值)\over Book\ Value(每股销售额or主营收)\) | 市销率(主营业务收入,近4季度总主营业务收入) |
PB市净率 | 市值净资产比,主要为有形资产,常被低估(无形资产、固定资产增值、应收问题) | \(Price(每股价格or市值)\over Sales(每股净资产or净资产)\) | 市净率(归属于母公司股东权益合计,报告期末) |
from jqdatasdk import * import pandas as pd if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) # 获取股票估值指标 df = get_fundamentals(query(valuation), statDate='2023') df.to_csv('valuation.csv')
运行结果
上图中,code为股票代码;pe_ratio为PE市盈率;turnover_ratio为换手;pb_ratio为PB市净率;ps_ratio为PS市销率;pcf_ratio为PCF市现率;capitalization为总股本;market_cap为市值;circulating_cap为流通股本;circulating_market_cap为流通市值。
结合之前的盈利选股指标,我们可以看一下该股的PE市盈率,我们希望PE市盈率足够低,这样未来的成长空间就会比较大。
from jqdatasdk import * import pandas as pd if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) # 获取股票财务指标 df = get_fundamentals(query(indicator), statDate='2023') # df.to_csv('finance2023.csv') # 基于盈利指标选股:eps,operating_profit,roe,inc_net_profit_year_on_year df = df[(df['eps'] > 0) & (df['operating_profit'] > df['operating_profit'].mean()) & (df['roe'] > 11) & (df['inc_net_profit_year_on_year'] > 10)] df.index = df['code'] # 获取股票估值指标 df_valuation = get_fundamentals(query(valuation), statDate='2023') # df.to_csv('valuation.csv') df_valuation.index = df_valuation['code'] # 以股票代码为索引,拼接挑选出的财务指标与市盈率,并指定市盈率小于50的股票 df['pe_ratio'] = df_valuation['pe_ratio'] df = df[df['pe_ratio'] < 50] df.to_csv('result.csv')
运行结果
计算交易指标
使用Shift函数结算涨跌幅
\(涨跌幅={当期收盘价-前期收盘价\over 前期收盘价}\)
from jqdatasdk import * import pandas as pd if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) # 获取平安银行的行情数据(日K) data = get_price('000001.XSHE', start_date='2024-04-01', end_date='2024-05-01', frequency='daily') # 计算涨跌幅,验证准确性 data['close_pct'] = (data['close'] - data['close'].shift(1)) / data['close'].shift(1) print(data) # 获取周K df_week = pd.DataFrame() # 获取周开盘价,这里取一周最后一天周日的日期表示一周 df_week['open'] = data['open'].resample('W').first() # 获取周收盘价 df_week['close'] = data['close'].resample('W').last() # 获取周最高价 df_week['high'] = data['high'].resample('W').max() # 获取周最低价 df_week['low'] = data['low'].resample('W').min() # 获取周成交量 df_week['volume'] = data['volume'].resample('W').sum() # 获取周成交额 df_week['money'] = data['money'].resample('W').sum() # 周K涨跌幅 df_week['close_pct'] = (df_week['close'] - df_week['close'].shift(1)) / df_week['close'].shift(1) print(df_week)
运行结果
auth success
open close high low volume money close_pct
2024-04-01 9.82 9.93 9.94 9.81 127616567.0 1.261770e+09 NaN
2024-04-02 9.92 9.85 9.97 9.83 116299099.0 1.149701e+09 -0.008056
2024-04-03 9.83 9.76 9.85 9.73 105197770.0 1.028649e+09 -0.009137
2024-04-08 9.73 9.73 9.79 9.68 97110056.0 9.452904e+08 -0.003074
2024-04-09 9.73 9.71 9.77 9.67 91838221.0 8.914690e+08 -0.002055
2024-04-10 9.69 9.59 9.72 9.59 133541874.0 1.288696e+09 -0.012358
2024-04-11 9.56 9.57 9.60 9.45 108237150.0 1.030820e+09 -0.002086
2024-04-12 9.54 9.39 9.59 9.37 139870040.0 1.322012e+09 -0.018809
2024-04-15 9.40 9.60 9.63 9.39 155700279.0 1.486326e+09 0.022364
2024-04-16 9.59 9.59 9.70 9.54 158361046.0 1.523138e+09 -0.001042
2024-04-17 9.58 9.91 9.92 9.53 239211490.0 2.337577e+09 0.033368
2024-04-18 9.87 10.08 10.29 9.86 339205099.0 3.427339e+09 0.017154
2024-04-19 10.00 9.98 10.10 9.95 156179466.0 1.562376e+09 -0.009921
2024-04-22 9.93 9.80 10.09 9.75 215337682.0 2.125723e+09 -0.018036
2024-04-23 9.81 9.84 9.94 9.76 132860036.0 1.308866e+09 0.004082
2024-04-24 9.82 9.83 9.87 9.76 100882258.0 9.890935e+08 -0.001016
2024-04-25 9.80 9.90 9.91 9.78 119337026.0 1.176305e+09 0.007121
2024-04-26 9.88 9.89 9.96 9.78 172245805.0 1.698581e+09 -0.001010
2024-04-29 9.86 10.09 10.17 9.82 232411861.0 2.337351e+09 0.020222
2024-04-30 10.08 10.07 10.15 10.01 141916771.0 1.431408e+09 -0.001982
open close high low volume money close_pct
2024-04-07 9.82 9.76 9.97 9.73 3.491134e+08 3.440120e+09 NaN
2024-04-14 9.73 9.39 9.79 9.37 5.705973e+08 5.478288e+09 -0.037910
2024-04-21 9.40 9.98 10.29 9.39 1.048657e+09 1.033676e+10 0.062833
2024-04-28 9.93 9.89 10.09 9.75 7.406628e+08 7.298568e+09 -0.009018
2024-05-05 9.86 10.07 10.17 9.82 3.743286e+08 3.768759e+09 0.018200
模拟股票交易
- 买入、卖出信号
- 创建周期选股策略,这里只是一个简单的示例,某日买入,某日卖出;
- 生成交易信号
from jqdatasdk import * import pandas as pd import numpy as np if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) # 获取平安银行的行情数据(日K) data = get_price('000001.XSHE', start_date='2024-04-01', end_date='2024-05-01', frequency='daily', panel=False) # 创建星期字段 data['weekday'] = data.index.weekday # 周四买入 data['buy_signal'] = np.where((data['weekday'] == 3), 1, 0) # 周一卖出 data['sell_signal'] = np.where((data['weekday'] == 0), -1, 0) print(data[['close', 'weekday', 'buy_signal', 'sell_signal']])
运行结果
auth success
close weekday buy_signal sell_signal
2024-04-01 9.93 0 0 -1
2024-04-02 9.85 1 0 0
2024-04-03 9.76 2 0 0
2024-04-08 9.73 0 0 1
2024-04-09 9.71 1 0 0
2024-04-10 9.59 2 0 0
2024-04-11 9.57 3 1 0
2024-04-12 9.39 4 0 0
2024-04-15 9.60 0 0 -1
2024-04-16 9.59 1 0 0
2024-04-17 9.91 2 0 0
2024-04-18 10.08 3 1 0
2024-04-19 9.98 4 0 0
2024-04-22 9.80 0 0 1
2024-04-23 9.84 1 0 0
2024-04-24 9.83 2 0 0
2024-04-25 9.90 3 1 0
2024-04-26 9.89 4 0 0
2024-04-29 10.09 0 0 -1
2024-04-30 10.07 1 0 0
如果我们要周四、周五都买入的话,则改为
from jqdatasdk import * import pandas as pd import numpy as np if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) # 获取平安银行的行情数据(日K) data = get_price('000001.XSHE', start_date='2024-04-01', end_date='2024-05-01', frequency='daily', panel=False) # 创建星期字段 data['weekday'] = data.index.weekday # 周四、周五买入 data['buy_signal'] = np.where((data['weekday'] == 3) | (data['weekday'] == 4), 1, 0) # 周一卖出 data['sell_signal'] = np.where((data['weekday'] == 0), -1, 0) print(data[['close', 'weekday', 'buy_signal', 'sell_signal']])
运行结果
auth success
close weekday buy_signal sell_signal
2024-04-01 9.93 0 0 -1
2024-04-02 9.85 1 0 0
2024-04-03 9.76 2 0 0
2024-04-08 9.73 0 0 -1
2024-04-09 9.71 1 0 0
2024-04-10 9.59 2 0 0
2024-04-11 9.57 3 1 0
2024-04-12 9.39 4 1 0
2024-04-15 9.60 0 0 -1
2024-04-16 9.59 1 0 0
2024-04-17 9.91 2 0 0
2024-04-18 10.08 3 1 0
2024-04-19 9.98 4 1 0
2024-04-22 9.80 0 0 -1
2024-04-23 9.84 1 0 0
2024-04-24 9.83 2 0 0
2024-04-25 9.90 3 1 0
2024-04-26 9.89 4 1 0
2024-04-29 10.09 0 0 -1
2024-04-30 10.07 1 0 0
整合信号,如果购买信号连续出现两个1的时候消除第二个1。
from jqdatasdk import * import pandas as pd import numpy as np if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) # 获取平安银行的行情数据(日K) data = get_price('000001.XSHE', start_date='2024-04-01', end_date='2024-05-01', frequency='daily', panel=False) # 创建星期字段 data['weekday'] = data.index.weekday # 周四、周五买入 data['buy_signal'] = np.where((data['weekday'] == 3) | (data['weekday'] == 4), 1, 0) # 周一卖出 data['sell_signal'] = np.where((data['weekday'] == 0), -1, 0) # 整合信号,消除连续的第二个买入信号 data['buy_signal'] = np.where((data['buy_signal'] == 1) & (data['buy_signal'].shift(1) == 1), 0, data['buy_signal']) print(data[['close', 'weekday', 'buy_signal', 'sell_signal']])
运行结果
auth success
close weekday buy_signal sell_signal
2024-04-01 9.93 0 0 -1
2024-04-02 9.85 1 0 0
2024-04-03 9.76 2 0 0
2024-04-08 9.73 0 0 -1
2024-04-09 9.71 1 0 0
2024-04-10 9.59 2 0 0
2024-04-11 9.57 3 1 0
2024-04-12 9.39 4 0 0
2024-04-15 9.60 0 0 -1
2024-04-16 9.59 1 0 0
2024-04-17 9.91 2 0 0
2024-04-18 10.08 3 1 0
2024-04-19 9.98 4 0 0
2024-04-22 9.80 0 0 -1
2024-04-23 9.84 1 0 0
2024-04-24 9.83 2 0 0
2024-04-25 9.90 3 1 0
2024-04-26 9.89 4 0 0
2024-04-29 10.09 0 0 -1
2024-04-30 10.07 1 0 0
最后我们将买卖信号放到同一个字段内
from jqdatasdk import * import pandas as pd import numpy as np if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) # 获取平安银行的行情数据(日K) data = get_price('000001.XSHE', start_date='2024-04-01', end_date='2024-05-01', frequency='daily', panel=False) # 创建星期字段 data['weekday'] = data.index.weekday # 周四、周五买入 data['buy_signal'] = np.where((data['weekday'] == 3) | (data['weekday'] == 4), 1, 0) # 周一卖出 data['sell_signal'] = np.where((data['weekday'] == 0), -1, 0) # 整合信号,消除连续的第二个买入信号 data['buy_signal'] = np.where((data['buy_signal'] == 1) & (data['buy_signal'].shift(1) == 1), 0, data['buy_signal']) # 整合买卖信号 data['signal'] = data['buy_signal'] + data['sell_signal'] print(data[['close', 'weekday', 'buy_signal', 'sell_signal', 'signal']])
运行结果
auth success
close weekday buy_signal sell_signal signal
2024-04-01 9.93 0 0 -1 -1
2024-04-02 9.85 1 0 0 0
2024-04-03 9.76 2 0 0 0
2024-04-08 9.73 0 0 -1 -1
2024-04-09 9.71 1 0 0 0
2024-04-10 9.59 2 0 0 0
2024-04-11 9.57 3 1 0 1
2024-04-12 9.39 4 0 0 0
2024-04-15 9.60 0 0 -1 -1
2024-04-16 9.59 1 0 0 0
2024-04-17 9.91 2 0 0 0
2024-04-18 10.08 3 1 0 1
2024-04-19 9.98 4 0 0 0
2024-04-22 9.80 0 0 -1 -1
2024-04-23 9.84 1 0 0 0
2024-04-24 9.83 2 0 0 0
2024-04-25 9.90 3 1 0 1
2024-04-26 9.89 4 0 0 0
2024-04-29 10.09 0 0 -1 -1
2024-04-30 10.07 1 0 0 0
- 计算持仓收益
在上图中,我们需要知道这些指标是怎么得到的
- 总盈亏=(市价-成本价)*股数
- \(浮动盈亏比={市价-成本价\over 成本价}\)
- \(成本价={买入金额\over 持有股数}\) (这里可能是分批次的买入平均值)
- 股数=累计买入股数
from jqdatasdk import * import pandas as pd import numpy as np if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) # 获取平安银行的行情数据(日K) data = get_price('000001.XSHE', start_date='2024-04-01', end_date='2024-05-01', frequency='daily', panel=False) # 创建星期字段 data['weekday'] = data.index.weekday # 周四、周五买入 data['buy_signal'] = np.where((data['weekday'] == 3) | (data['weekday'] == 4), 1, 0) # 周一卖出 data['sell_signal'] = np.where((data['weekday'] == 0), -1, 0) # 整合信号,消除连续的第二个买入信号 data['buy_signal'] = np.where((data['buy_signal'] == 1) & (data['buy_signal'].shift(1) == 1), 0, data['buy_signal']) # 整合买卖信号 data['signal'] = data['buy_signal'] + data['sell_signal'] # 计算单次收益率:开仓、平仓(开仓的全部股数) data = data[data['signal'] != 0] # 这里只接受一买一卖 to_exclude_indices = [] for i in range(len(data)): if i + 1 < len(data): if data['signal'][i] == -1: if data['signal'][i + 1] == -1: to_exclude_indices.append(data.index[i]) to_exclude_indices.append(data.index[i + 1]) data = data.drop(to_exclude_indices) data['profit_pct'] = (data['close'] - data['close'].shift(1)) / data['close'].shift(1) # 只需要卖出的收益率 data = data[data['signal'] == -1] print(data[['close', 'signal', 'profit_pct']])
运行结果
auth success
close signal profit_pct
2024-04-15 9.60 -1 0.003135
2024-04-22 9.80 -1 -0.027778
2024-04-29 10.09 -1 0.019192
如果我们要获取该股票从上市的日期开始算,可以进行如下修改
from jqdatasdk import * import pandas as pd import numpy as np if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) # 获取平安银行上市日期 start_date = get_security_info('000001.XSHE').start_date # 获取平安银行的行情数据(日K) data = get_price('000001.XSHE', start_date=start_date, end_date='2024-05-01', frequency='daily', panel=False) # 创建星期字段 data['weekday'] = data.index.weekday # 周四、周五买入 data['buy_signal'] = np.where((data['weekday'] == 3) | (data['weekday'] == 4), 1, 0) # 周一卖出 data['sell_signal'] = np.where((data['weekday'] == 0), -1, 0) # 整合信号,消除连续的第二个买入信号 data['buy_signal'] = np.where((data['buy_signal'] == 1) & (data['buy_signal'].shift(1) == 1), 0, data['buy_signal']) # 整合买卖信号 data['signal'] = data['buy_signal'] + data['sell_signal'] # 计算单次收益率:开仓、平仓(开仓的全部股数) data = data[data['signal'] != 0] # 这里只接受一买一卖 to_exclude_indices = [] for i in range(len(data)): if i + 1 < len(data): if data['signal'][i] == -1: if data['signal'][i + 1] == -1: to_exclude_indices.append(data.index[i]) to_exclude_indices.append(data.index[i + 1]) data = data.drop(to_exclude_indices) data['profit_pct'] = (data['close'] - data['close'].shift(1)) / data['close'].shift(1) # 只需要卖出的收益率 data = data[data['signal'] == -1] print(data[['close', 'signal', 'profit_pct']])
运行结果(部分)
auth success
close signal profit_pct
2005-01-10 1.32 -1 0.007634
2005-01-17 1.25 -1 -0.053030
2005-01-24 1.30 -1 0.083333
2005-01-31 1.21 -1 -0.016260
2005-02-21 1.34 -1 0.022901
2005-02-28 1.30 -1 -0.022556
2005-03-07 1.25 -1 -0.031008
2005-03-14 1.22 -1 -0.008130
2005-03-21 1.19 -1 -0.008333
2005-03-28 1.06 -1 -0.018519
2005-04-04 1.09 -1 0.048077
2005-04-11 1.39 -1 0.120968
2005-04-18 1.29 -1 -0.022727
...
最后我们看一下单次收益率的各个统计量
from jqdatasdk import * import pandas as pd import numpy as np import matplotlib.pyplot as plt if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) # 获取平安银行上市日期 start_date = get_security_info('000001.XSHE').start_date # 获取平安银行的行情数据(日K) data = get_price('000001.XSHE', start_date=start_date, end_date='2024-05-01', frequency='daily', panel=False) # 创建星期字段 data['weekday'] = data.index.weekday # 周四、周五买入 data['buy_signal'] = np.where((data['weekday'] == 3) | (data['weekday'] == 4), 1, 0) # 周一卖出 data['sell_signal'] = np.where((data['weekday'] == 0), -1, 0) # 整合信号,消除连续的第二个买入信号 data['buy_signal'] = np.where((data['buy_signal'] == 1) & (data['buy_signal'].shift(1) == 1), 0, data['buy_signal']) # 整合买卖信号 data['signal'] = data['buy_signal'] + data['sell_signal'] # 计算单次收益率:开仓、平仓(开仓的全部股数) data = data[data['signal'] != 0] # 这里只接受一买一卖 to_exclude_indices = [] for i in range(len(data)): if i + 1 < len(data): if data['signal'][i] == -1: if data['signal'][i + 1] == -1: to_exclude_indices.append(data.index[i]) to_exclude_indices.append(data.index[i + 1]) data = data.drop(to_exclude_indices) data['profit_pct'] = (data['close'] - data['close'].shift(1)) / data['close'].shift(1) # 只需要卖出的收益率 data = data[data['signal'] == -1] # print(data[['close', 'signal', 'profit_pct']]) print(data.describe()) # 画出收益率折线图 data['profit_pct'].plot() plt.show()
运行结果
auth success
open close high low volume \
count 883.000000 883.000000 883.000000 883.000000 8.830000e+02
mean 7.811971 7.817916 7.940453 7.689807 1.227682e+08
std 4.351606 4.354984 4.427351 4.271594 9.570331e+07
min 1.080000 1.060000 1.080000 1.050000 0.000000e+00
25% 4.765000 4.765000 4.835000 4.700000 6.221475e+07
50% 7.280000 7.280000 7.400000 7.180000 1.014664e+08
75% 10.555000 10.595000 10.745000 10.445000 1.544504e+08
max 22.110000 22.020000 22.190000 21.420000 7.848542e+08
money weekday buy_signal sell_signal signal profit_pct
count 8.830000e+02 883.0 883.0 883.0 883.0 883.000000
mean 1.039308e+09 0.0 0.0 -1.0 -1.0 0.002574
std 1.030744e+09 0.0 0.0 0.0 0.0 0.038639
min 0.000000e+00 0.0 0.0 -1.0 -1.0 -0.140964
25% 3.668098e+08 0.0 0.0 -1.0 -1.0 -0.017963
50% 7.412006e+08 0.0 0.0 -1.0 -1.0 0.000000
75% 1.412729e+09 0.0 0.0 -1.0 -1.0 0.019402
max 8.596942e+09 0.0 0.0 -1.0 -1.0 0.211604
这里我们只看profit_pct的统计量,均值为0.002574,标准差为0.038639,最小值为-0.140964,25%分位点为-0.017963,50%分位点,即中位数为0.000000,75%分位点为0.019402,最大值为0.211604。
通过上图,如果我们每周四买入,周一卖出,它的单次收益率是上下不断起伏波动的。
- 计算累计收益
假设有一个理财产品,它每天的收益率都不同
理财产品 | 累计收益 |
---|---|
第一天:3% | 1*(1+3%)=103 |
第二天:2% | 以上*(1+2%)=103+2.06=105.06 |
第三天:5% | 以上*(1+5%)=105.06+5.25=110.31 |
第四天:6% | 以上*(1+6%)=110.31+6.62=116.93 |
... | (1+当天收益率)的累计乘积-1 |
这里的1代表本金100块,最后的-1是要扣除本金才是最终的累计收益率。
from jqdatasdk import * import pandas as pd import numpy as np import matplotlib.pyplot as plt if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) # 获取平安银行上市日期 start_date = get_security_info('000001.XSHE').start_date # 获取平安银行的行情数据(日K) data = get_price('000001.XSHE', start_date=start_date, end_date='2024-05-01', frequency='daily', panel=False) # 创建星期字段 data['weekday'] = data.index.weekday # 周四、周五买入 data['buy_signal'] = np.where((data['weekday'] == 3) | (data['weekday'] == 4), 1, 0) # 周一卖出 data['sell_signal'] = np.where((data['weekday'] == 0), -1, 0) # 整合信号,消除连续的第二个买入信号 data['buy_signal'] = np.where((data['buy_signal'] == 1) & (data['buy_signal'].shift(1) == 1), 0, data['buy_signal']) # 整合买卖信号 data['signal'] = data['buy_signal'] + data['sell_signal'] # 计算单次收益率:开仓、平仓(开仓的全部股数) data = data[data['signal'] != 0] # 这里只接受一买一卖 to_exclude_indices = [] for i in range(len(data)): if i + 1 < len(data): if data['signal'][i] == -1: if data['signal'][i + 1] == -1: to_exclude_indices.append(data.index[i]) to_exclude_indices.append(data.index[i + 1]) data = data.drop(to_exclude_indices) data['profit_pct'] = (data['close'] - data['close'].shift(1)) / data['close'].shift(1) # 只需要卖出的收益率 data = data[data['signal'] == -1] # 计算累计收益率 data['cum_profit'] = (1 + data['profit_pct']).cumprod() - 1 print(data[['close', 'signal', 'profit_pct', 'cum_profit']]) print(data.describe()) # 画出累计收益率折线图 data['cum_profit'].plot() plt.show()
运行结果(每期的,部分)
auth success
close signal profit_pct cum_profit
2005-01-10 1.32 -1 0.007634 0.007634
2005-01-17 1.25 -1 -0.053030 -0.045802
2005-01-24 1.30 -1 0.083333 0.033715
2005-01-31 1.21 -1 -0.016260 0.016907
2005-02-21 1.34 -1 0.022901 0.040195
2005-02-28 1.30 -1 -0.022556 0.016732
2005-03-07 1.25 -1 -0.031008 -0.014795
2005-03-14 1.22 -1 -0.008130 -0.022805
2005-03-21 1.19 -1 -0.008333 -0.030948
2005-03-28 1.06 -1 -0.018519 -0.048894
2005-04-04 1.09 -1 0.048077 -0.003167
2005-04-11 1.39 -1 0.120968 0.117417
...
统计量
money weekday buy_signal sell_signal signal profit_pct \
count 8.830000e+02 883.0 883.0 883.0 883.0 883.000000
mean 1.039308e+09 0.0 0.0 -1.0 -1.0 0.002574
std 1.030744e+09 0.0 0.0 0.0 0.0 0.038639
min 0.000000e+00 0.0 0.0 -1.0 -1.0 -0.140964
25% 3.668098e+08 0.0 0.0 -1.0 -1.0 -0.017963
50% 7.412006e+08 0.0 0.0 -1.0 -1.0 0.000000
75% 1.412729e+09 0.0 0.0 -1.0 -1.0 0.019402
max 8.596942e+09 0.0 0.0 -1.0 -1.0 0.211604
cum_profit
count 883.000000
mean 2.647691
std 2.008637
min -0.111908
25% 1.125868
50% 2.433471
75% 4.055035
max 8.822420
这里我们只看cum_profit的统计量,均值为2.647691,标准差为2.008637,最小值为-0.111908,25%分位数为1.125868,50%分位数,即中位数为2.433471,75%分位数为4.055035,最大值为8.822420。
通过上图,如果我们每周四买入,周一卖出,它的累计收益率在2021年是不断上升的,之后在不断下降。如果我们在2005年买入该股1000块钱,在股市里面不断的滚动,在2021年可以达到1000000。
计算风险指标:最大回撤
最大回撤:在选定周期内任一历史时点往后推,产品净值走到最低点时的收益率回撤幅度的最大值。是一个非常重要的风险指标。
假设上图是大盘的表现,横坐标是时间,纵坐标是净值。我们选定一个周期(0到低谷值),即上图红框内的时间。
\(MDD={Trough\ value-Peak\ Value\over Peak\ Value}\)
上式中MDD表示最大回撤值,Trough value表示低谷值,Peak Value表示最高值。表示一段周期内最低值减最高值再除以最高值。假设上图中红色框周期内的最高值为4000,最低值为2000,
\(MDD={2000-4000\over 4000}=50\%\)
这里我们计算最大回撤值的时候是不计正负号的。
最大回撤描述的是我们购买后可能产生最糟糕的情况,亏损最大的比例是多少。假设有两个理财产品,它们的收益率是一样的
收益率 | 回撤A | 回撤B |
---|---|---|
近一周:7% | 2% | 1% |
近一月:11% | 5% | 3.8% |
近一年:28% | 17% | 13% |
通过上表我们知道在相同的收益率条件下,产品B的回撤更小,亏损更小。如果这两个产品挑一种购买,那我们肯定挑产品B,因为该产品更扛跌,虽然大家都在跌,但是产品B跌的更少。最大回撤的意义就在于帮助我们去做风险控制。
from os import close from jqdatasdk import * import pandas as pd if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) # 获取平安银行的行情数据(日K) data = get_price('000001.XSHE', start_date='2024-03-01', end_date='2024-05-01', frequency='daily', panel=False) # 计算最大回撤 window = 7 # 选取时间周期,7天 # 选择时间周期中的最大净值 data['roll_max'] = data['close'].rolling(window=window, min_periods=1).max() # 计算当天回撤比=(谷值-峰值)/峰值=谷值/峰值-1 data['daily_dd'] = data['close'] / data['roll_max'] - 1 # 选取时间周期内最大的回撤比,即最大回撤,因为是负值,所以用min() data['max_dd'] = data['daily_dd'].rolling(window=window, min_periods=1).min() print(data[['close', 'roll_max', 'daily_dd', 'max_dd']])
运行结果
auth success
close roll_max daily_dd max_dd
2024-03-01 9.79 9.79 0.000000 0.000000
2024-03-04 9.64 9.79 -0.015322 -0.015322
2024-03-05 9.73 9.79 -0.006129 -0.015322
2024-03-06 9.64 9.79 -0.015322 -0.015322
2024-03-07 9.69 9.79 -0.010215 -0.015322
2024-03-08 9.69 9.79 -0.010215 -0.015322
2024-03-11 9.77 9.79 -0.002043 -0.015322
2024-03-12 9.86 9.86 0.000000 -0.015322
2024-03-13 9.64 9.86 -0.022312 -0.022312
2024-03-14 9.55 9.86 -0.031440 -0.031440
2024-03-15 9.89 9.89 0.000000 -0.031440
2024-03-18 9.84 9.89 -0.005056 -0.031440
2024-03-19 9.71 9.89 -0.018200 -0.031440
2024-03-20 9.75 9.89 -0.014156 -0.031440
2024-03-21 9.77 9.89 -0.012133 -0.031440
2024-03-22 9.67 9.89 -0.022245 -0.031440
2024-03-25 9.71 9.89 -0.018200 -0.022245
2024-03-26 9.89 9.89 0.000000 -0.022245
2024-03-27 9.83 9.89 -0.006067 -0.022245
2024-03-28 9.79 9.89 -0.010111 -0.022245
2024-03-29 9.82 9.89 -0.007078 -0.022245
2024-04-01 9.93 9.93 0.000000 -0.022245
2024-04-02 9.85 9.93 -0.008056 -0.018200
2024-04-03 9.76 9.93 -0.017120 -0.017120
2024-04-08 9.73 9.93 -0.020141 -0.020141
2024-04-09 9.71 9.93 -0.022155 -0.022155
2024-04-10 9.59 9.93 -0.034240 -0.034240
2024-04-11 9.57 9.93 -0.036254 -0.036254
2024-04-12 9.39 9.85 -0.046701 -0.046701
2024-04-15 9.60 9.76 -0.016393 -0.046701
2024-04-16 9.59 9.73 -0.014388 -0.046701
2024-04-17 9.91 9.91 0.000000 -0.046701
2024-04-18 10.08 10.08 0.000000 -0.046701
2024-04-19 9.98 10.08 -0.009921 -0.046701
2024-04-22 9.80 10.08 -0.027778 -0.046701
2024-04-23 9.84 10.08 -0.023810 -0.027778
2024-04-24 9.83 10.08 -0.024802 -0.027778
2024-04-25 9.90 10.08 -0.017857 -0.027778
2024-04-26 9.89 10.08 -0.018849 -0.027778
2024-04-29 10.09 10.09 0.000000 -0.027778
2024-04-30 10.07 10.09 -0.001982 -0.027778
这里我们需要说明的是由于时间周期为7天,所以roll_max并不是一直都取的close的最大值,我们可以看到
2024-04-11 9.57 9.93 -0.036254 -0.036254
2024-04-12 9.39 9.85 -0.046701 -0.046701
4月12日的roll_max比4月11日的roll_max小,实际上roll_max只是向上7天内的最大的close值。
现在我们将时间跨度拉大,时间周期为1年
from jqdatasdk import * import pandas as pd import matplotlib.pyplot as plt if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) # 获取平安银行的行情数据(日K) data = get_price('000001.XSHE', start_date='2023-01-01', end_date='2024-05-01', frequency='daily', panel=False) # 计算最大回撤 window = 255 # 选取时间周期,255天 # 选择时间周期中的最大净值 data['roll_max'] = data['close'].rolling(window=window, min_periods=1).max() # 计算当天回撤比=(谷值-峰值)/峰值=谷值/峰值-1 data['daily_dd'] = data['close'] / data['roll_max'] - 1 # 选取时间周期内最大的回撤比,即最大回撤,因为是负值,所以用min() data['max_dd'] = data['daily_dd'].rolling(window=window, min_periods=1).min() print(data[['close', 'roll_max', 'daily_dd', 'max_dd']]) # 画出当天回撤比,最大回撤比折线图 data[['daily_dd', 'max_dd']].plot() plt.show()
运行结果(部分)
auth success
close roll_max daily_dd max_dd
2023-01-03 12.55 12.55 0.000000 0.000000
2023-01-04 13.05 13.05 0.000000 0.000000
2023-01-05 13.19 13.19 0.000000 0.000000
2023-01-06 13.32 13.32 0.000000 0.000000
2023-01-09 13.48 13.48 0.000000 0.000000
2023-01-10 13.16 13.48 -0.023739 -0.023739
2023-01-11 13.37 13.48 -0.008160 -0.023739
2023-01-12 13.37 13.48 -0.008160 -0.023739
2023-01-13 13.62 13.62 0.000000 -0.023739
2023-01-16 13.74 13.74 0.000000 -0.023739
2023-01-17 13.64 13.74 -0.007278 -0.023739
2023-01-18 13.77 13.77 0.000000 -0.023739
2023-01-19 13.75 13.77 -0.001452 -0.023739
2023-01-20 13.79 13.79 0.000000 -0.023739
2023-01-30 13.80 13.80 0.000000 -0.023739
2023-01-31 13.66 13.80 -0.010145 -0.023739
2023-02-01 13.39 13.80 -0.029710 -0.029710
2023-02-02 13.30 13.80 -0.036232 -0.036232
...
计算风险收益指标:夏普比率
夏普比率(Sharpe Ratio):夏普指数,衡量的是一项投资在对其调整风险后,相对于无风险资产的收益表现。在1966年,由威廉⋅F⋅夏普提出,美国金融经济学学者,曾在1990年获得过诺贝尔经济学奖。
\(SharpeRatio={E(R_P)-R_f\over σ_P}\)
上式中\(E(R_P)\)表示期望的投资回报率;\(R_f\)表示无风险利率,指的是没有风险的资产所获的的回报,通常为国债年化回报3%左右;\(σ_P\)表示投资回报率标准差,指的是一种离散指标,体现数据样本内部的差异性,公式为
\(\sqrt{\sum_i^n(x_i-mean(x))^2\over n}\)
这里的\(x_i\)表示样本的每一个数据项,mean(x)为样本均值。它代表的是股票或者基金的波动很大,风险很大。
夏普比率整体代表着投资者额外承受的每一单位风险所获得的额外收益。该值越大越好,该值越大,大于1说明收益高于风险,小于1说明风险高于收益。
import numpy as np from jqdatasdk import * import pandas as pd if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) # 获取平安银行的行情数据(日K) data = get_price('000001.XSHE', start_date='2023-01-01', end_date='2024-05-01', frequency='daily', panel=False) # 计算夏普比率:sharp=(回报率的均值-无风险利率) / 回报率标准差 # 计算收盘价的百分比变化,回报率,等同于(当前-之前)/之前 daily_return = data['close'].pct_change() avg_return = daily_return.mean() # 回报率均值 sd_return = daily_return.std() # 回报率标准差 sharp = avg_return / sd_return # 每日夏普比率 sharp_year = sharp * np.sqrt(252) # 年化夏普比率 print(sharp, sharp_year)
运行结果
auth success
-0.04118789415018597 -0.6538375496870648
- 比较三支股票的夏普指数
import numpy as np from jqdatasdk import * import pandas as pd import matplotlib.pyplot as plt def calculate_sharp(data): ''' 计算夏普比率:sharp=(回报率的均值-无风险利率) / 回报率标准差 :param data: :return: ''' # 计算收盘价的百分比变化,回报率,等同于(当前-之前)/之前 daily_return = data['close'].pct_change() avg_return = daily_return.mean() # 回报率均值 sd_return = daily_return.std() # 回报率标准差 sharp = avg_return / sd_return # 每日夏普比率 sharp_year = sharp * np.sqrt(252) # 年化夏普比率 return sharp, sharp_year if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) # 获取3支股票的数据:比亚迪、宁德时代、隆基 codes = ['002594.XSHE', '300750.XSHE', '601012.XSHG'] sharps = [] for code in codes: data = get_price(code, start_date='2023-01-01', end_date='2024-05-01', frequency='daily', panel=False) daily_sharp, annual_sharp = calculate_sharp(data) sharps.append([code, annual_sharp]) sharps = pd.DataFrame(sharps, columns=['code', 'sharp']).set_index('code') print(sharps) # 绘制三支股票夏普值的条形图 sharps.plot.bar(title='Compare Annul Sharp Ratio') plt.xticks(rotation=30) plt.show()
运行结果
auth success
sharp
code
002594.XSHE -0.326931
300750.XSHE 0.091455
601012.XSHG -1.614862
通过上图,我们可以看出这三支股票中,宁德时代在23年到24年4月的风险收益是最高的。
设计交易策略:择时策略
均线策略
均线:由美国投资专家Joseph E.Granville 1962年提出,利用股价和均线择时。代表过去n日股价平均走势。如
\(5日均线={第1天价格+...+第5天价格\over 5天}\)
一般是每日的收盘价。如果是日内交易,分时的,那么价格可能是每分钟、每小时的最终价格。这里得到的只是一个值,叫做5日均线值,通过不断的计算近5日均线的点位,连点成线,就形成了均线。
- 双均线策略
上图是五粮液的2024年的日K图,我们用红色框标记出来的MA5为5日均线,MA10为10日均线,MA20为20日均线,MA30为30日均线,MA60为60日均线。我们可以看到近期处于一个暴跌的走势,首先我们可以看到MA60,它是最长期的均线,比较滞后,它离主体K线图是最远的;MA5是最及时的,周期最短的,最能反映近期的情况,基本上是贴着K线图走的;其次是MA10,它贴着K线图也是比较近的;再就是MA20和MA30。
结合之前的暴涨和现在的暴跌,MA60是比较平缓的,这是MA60和其他均线非常不一样的原因。在做择时策略的时候,通常我们挑的均线周期越短,则买卖的周期就会越短,比如说1周;如果我们挑的均线周期越长,则买卖的周期就会越长,比如说1个月甚至更长。这和交易的频次有关系,和市场行情的表现有关系,和股价的表现有关系。
现在我们挑选MA5和MA30来做择时策略(双均线策略)
在上图中,我们可以看到MA5和MA10有一个交叉点,是MA5上穿MA10,是较短周期的均线上穿了较长周期的均线,这个点位称为金叉。也就是短期的均价超过了长期的均价,从市场层面来看,短期的做多趋势大于做空的趋势,也就是股价要涨。
在上图中,我们可以看到MA5和MA10也有一个交叉点,是MA5下穿MA10,是较短周期的均线下穿了较长周期的均线,这个点位称为死叉。也就是长期的均价超过了短期的均价,从市场层面来看,短期的做空趋势大于做多的趋势,也就是股价要跌。
利用金叉和死叉,我们就可以买入和卖出。策略实现思路为:
- 获取标的行情
- 计算技术指标,移动平均线:5日、10日等等.....
- 生成交易信号,金叉买入、死叉卖出。
- 计算收益率,包括单次收益率和累计收益率。
- 寻找最优参数,如均线周期、投资标的。
- 与市场基准比较,如沪深300、上证、中证500。
- 策略评估,如收益率、夏普比、波动率、最大回撤、胜率(指的是赚钱的次数占总次数的比率,一般在50%到60%)。
import numpy as np from jqdatasdk import * import pandas as pd def compos_signal(data): ''' 整合信号 :param data: :return: ''' data['buy_signal'] = np.where((data['buy_signal'] == 1) & (data['buy_signal'].shift(1) == 1), 0, data['buy_signal']) data['sell_signal'] = np.where((data['sell_signal'] == -1) & (data['sell_signal'].shift(1) == -1), 0, data['sell_signal']) data['signal'] = data['buy_signal'] + data['sell_signal'] return data def ma_strategy(data, short_window=5, long_window=20): ''' 双均线策略 :param data: 交易数据 :param short_window: 短期均线时间 :param long_window: 长期均线时间 :return: ''' # 短期均线 data['short_ma'] = data['close'].rolling(window=short_window).mean() # 长期均线 data['long_ma'] = data['close'].rolling(window=long_window).mean() # 生成信号:金叉买入、死叉卖出 data['buy_signal'] = np.where(data['short_ma'] > data['long_ma'], 1, 0) data['sell_signal'] = np.where(data['short_ma'] < data['long_ma'], -1, 0) # 过滤信号 data = compos_signal(data) data.drop(labels=['buy_signal', 'sell_signal'], axis=1) return data if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) data = get_price('000001.XSHE', start_date='2023-01-01', end_date='2024-05-01', frequency='daily', panel=False) data = ma_strategy(data) # 筛选有信号点 data = data[data['signal'] != 0] print('开仓次数', int(len(data) / 2)) print(data[['close', 'short_ma', 'long_ma', 'signal']])
运行结果
auth success
开仓次数 11
close short_ma long_ma signal
2023-02-06 12.76 13.232 13.3880 -1
2023-03-03 13.02 12.786 12.7190 1
2023-03-09 12.03 12.494 12.6230 -1
2023-04-18 11.84 11.598 11.5520 1
2023-04-25 11.19 11.386 11.4920 -1
2023-05-08 12.14 11.620 11.5000 1
2023-05-17 11.38 11.556 11.5580 -1
2023-07-17 10.56 10.576 10.5680 1
2023-07-24 10.51 10.544 10.5460 -1
2023-07-25 10.94 10.632 10.5665 1
2023-08-16 10.95 11.048 11.1105 -1
2024-01-03 8.59 8.656 8.6255 1
2024-01-08 8.54 8.576 8.5920 -1
2024-01-16 8.72 8.588 8.5810 1
2024-01-23 8.55 8.560 8.5885 -1
2024-01-25 8.87 8.636 8.6175 1
2024-03-15 9.89 9.742 9.7450 -1
2024-03-21 9.77 9.792 9.7695 1
2024-03-25 9.71 9.722 9.7405 -1
2024-03-26 9.89 9.758 9.7450 1
2024-04-10 9.59 9.728 9.7645 -1
2024-04-19 9.98 9.832 9.7585 1
这里我们可以看到第一个买入信号1,是2023年3月3日,对比K线图
我们会发现该日5日均线确实上穿了20日均线。但是我们会发现3月9日就出现了死叉
如果我们此时卖出,反而是亏的。说明策略不一定一直有效,此时我们要做出调整,并不是说看见无效的情况就丢弃,而是要基于这个基础之上进行优化,比如做止损优化,调参优化(如更换两条均线的周期,如换成MA5和MA10去比)。这里先不讨论。
- 计算信号收益率
import numpy as np from jqdatasdk import * import pandas as pd def calculate_prof_pct(data): ''' 计算单次收益 :param data: :return: ''' data = data[data['signal'] != 0] # 这里只接受一买一卖 to_exclude_indices = [] for i in range(len(data)): if i + 1 < len(data): if data['signal'][i] == -1: if data['signal'][i + 1] == -1: to_exclude_indices.append(data.index[i]) to_exclude_indices.append(data.index[i + 1]) data = data.drop(to_exclude_indices) # 收益率,等同于(当前-之前)/之前 data['profit_pct'] = data['close'].pct_change() # 只需要卖出的收益率 data = data[data['signal'] == -1] return data def calculate_cum_prof(data): ''' 计算累计收益 :param data: :return: ''' data['cum_profit'] = (1 + data['profit_pct']).cumprod() - 1 return data def compos_signal(data): ''' 整合信号 :param data: :return: ''' data['buy_signal'] = np.where((data['buy_signal'] == 1) & (data['buy_signal'].shift(1) == 1), 0, data['buy_signal']) data['sell_signal'] = np.where((data['sell_signal'] == -1) & (data['sell_signal'].shift(1) == -1), 0, data['sell_signal']) data['signal'] = data['buy_signal'] + data['sell_signal'] return data def ma_strategy(data, short_window=5, long_window=20): ''' 双均线策略 :param data: 交易数据 :param short_window: 短期均线时间 :param long_window: 长期均线时间 :return: ''' # 短期均线 data['short_ma'] = data['close'].rolling(window=short_window).mean() # 长期均线 data['long_ma'] = data['close'].rolling(window=long_window).mean() # 生成信号:金叉买入、死叉卖出 data['buy_signal'] = np.where(data['short_ma'] > data['long_ma'], 1, 0) data['sell_signal'] = np.where(data['short_ma'] < data['long_ma'], -1, 0) # 过滤信号 data = compos_signal(data) # 计算单次收益 data = calculate_prof_pct(data) # 计算累计收益 data = calculate_cum_prof(data) data.drop(labels=['buy_signal', 'sell_signal'], axis=1) return data if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) data = get_price('000001.XSHE', start_date='2023-01-01', end_date='2024-05-01', frequency='daily', panel=False) data = ma_strategy(data) # print('开仓次数', int(len(data) / 2)) print(data[['close', 'signal', 'profit_pct', 'cum_profit']])
运行结果
auth success
close signal profit_pct cum_profit
2023-02-06 12.76 -1 NaN NaN
2023-03-09 12.03 -1 -0.076037 -0.076037
2023-04-25 11.19 -1 -0.054899 -0.126761
2023-05-17 11.38 -1 -0.062603 -0.181429
2023-07-24 10.51 -1 -0.004735 -0.185304
2023-08-16 10.95 -1 0.000914 -0.184560
2024-01-08 8.54 -1 -0.005821 -0.189306
2024-01-23 8.55 -1 -0.019495 -0.205111
2024-03-15 9.89 -1 0.114994 -0.113703
2024-03-25 9.71 -1 -0.006141 -0.119146
2024-04-10 9.59 -1 -0.030334 -0.145866
由结果,我们可以看出从2023年到2024年4月总的累积收益率是负的14.6%,也就是说我们不但没有赚钱还亏钱,这里有两个方向,第一个方向是投资标的的问题,这里我们投的是平安银行,也许这一支股票不赚钱但是不代表其他股票不赚钱,对于某些股票很烂,一直下跌,很难赚钱。如果一直开仓、平仓周期很短,很难抓到长期的趋势。又或者波动很小,很难有一个买入卖出点。这里的时间是一年四个月,正常的策略回测可能取的是3到5年,越近的有效性越高,越长越容易了解该股的趋势性;另一方面就是策略是否有效的问题,这里只是测的是MA5和MA20的金叉、死叉,如果我们加入了一些其他的辅助的方式,比如说止损策略,它最终的累计收益率的结果又会不同。
对于第一个方向,我们可以使用多支股票来进行测试,并且延长交易的时间
import numpy as np from jqdatasdk import * import pandas as pd import matplotlib.pyplot as plt def calculate_prof_pct(data): ''' 计算单次收益 :param data: :return: ''' data = data[data['signal'] != 0] # 这里只接受一买一卖 to_exclude_indices = [] for i in range(len(data)): if i + 1 < len(data): if data['signal'][i] == -1: if data['signal'][i + 1] == -1: to_exclude_indices.append(data.index[i]) to_exclude_indices.append(data.index[i + 1]) data = data.drop(to_exclude_indices) # 收益率,等同于(当前-之前)/之前 data['profit_pct'] = data['close'].pct_change() # 只需要卖出的收益率 data = data[data['signal'] == -1] return data def calculate_cum_prof(data): ''' 计算累计收益 :param data: :return: ''' data['cum_profit'] = (1 + data['profit_pct']).cumprod() - 1 return data def compos_signal(data): ''' 整合信号 :param data: :return: ''' data['buy_signal'] = np.where((data['buy_signal'] == 1) & (data['buy_signal'].shift(1) == 1), 0, data['buy_signal']) data['sell_signal'] = np.where((data['sell_signal'] == -1) & (data['sell_signal'].shift(1) == -1), 0, data['sell_signal']) data['signal'] = data['buy_signal'] + data['sell_signal'] return data def ma_strategy(data, short_window=5, long_window=20): ''' 双均线策略 :param data: 交易数据 :param short_window: 短期均线时间 :param long_window: 长期均线时间 :return: ''' # 短期均线 data['short_ma'] = data['close'].rolling(window=short_window).mean() # 长期均线 data['long_ma'] = data['close'].rolling(window=long_window).mean() # 生成信号:金叉买入、死叉卖出 data['buy_signal'] = np.where(data['short_ma'] > data['long_ma'], 1, 0) data['sell_signal'] = np.where(data['short_ma'] < data['long_ma'], -1, 0) # 过滤信号 data = compos_signal(data) # 计算单次收益 data = calculate_prof_pct(data) # 计算累计收益 data = calculate_cum_prof(data) data.drop(labels=['buy_signal', 'sell_signal'], axis=1) return data if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) # 平安银行、五粮液、比亚迪 stocks = ['000001.XSHE', '000858.XSHE', '002594.XSHE'] # 存放累计收益率 cum_profits = pd.DataFrame() for code in stocks: data = get_price(code, start_date='2019-01-01', end_date='2024-01-01', frequency='daily', panel=False) data = ma_strategy(data) cum_profits[code] = data['cum_profit'].reset_index(drop=True) print('开仓次数:', len(data)) print(cum_profits) cum_profits.plot() plt.title('Comparison of Ma Strategy Profits') plt.show()
运行结果
auth success
开仓次数: 34
开仓次数: 33
开仓次数: 40
000001.XSHE 000858.XSHE 002594.XSHE
0 0.101053 0.572578 NaN
1 0.060980 0.419285 0.015656
2 0.171173 0.628251 -0.006533
3 0.127689 0.693723 -0.038171
4 0.064470 0.653854 -0.117529
5 0.195224 0.631528 -0.117529
6 0.210504 0.394660 -0.158473
7 0.148244 0.334218 -0.185948
8 0.149266 0.156963 -0.190120
9 0.167508 0.974205 0.081976
10 0.112144 0.942267 0.092778
11 0.054119 1.040683 0.557437
12 0.103675 1.134788 2.095945
13 0.182731 1.086764 2.029389
14 0.170013 0.863219 2.520753
15 0.336079 0.800270 2.375753
16 0.260904 0.948485 2.302132
17 0.283762 0.868942 3.276296
18 0.187119 0.846104 4.063234
19 0.020110 1.058119 4.444919
20 -0.052672 0.935974 4.313736
21 -0.091069 0.944996 3.715171
22 -0.163122 1.226222 3.549445
23 -0.196488 1.040772 3.306997
24 -0.214803 1.067218 4.819191
25 -0.216018 1.729220 4.762849
26 -0.218808 1.583998 4.520381
27 -0.114499 1.444360 4.403016
28 -0.099682 1.315695 3.910924
29 -0.168139 1.184578 3.833190
30 -0.213807 1.171091 4.119964
31 -0.263025 1.127741 3.898140
32 -0.266515 1.118122 3.633480
33 -0.265844 NaN 3.687981
这里我们可以看到对于平安银行、五粮液、比亚迪三支股票从2019年到2023年5年的时间里,它们的累计收益分别为-26.6%,118.8%,368.8%。
验证策略的可靠性
双均线策略是一种基于不同周期平均价格的突破型策略。如何验证策略的可靠性,比如策略A:100次开仓、平仓,90次亏钱,10次赚钱,最终收益为正。
我们不敢保证这个策略A是一个可靠的策略,需要进行验证。简单来讲可以去看一些评估指标,比如胜率、年化收益、最大回撤、夏普......。比如年化收益还不错,但是胜率很低,夏普也不高(低于1),那么这个策略A可能不稳定,风险较高,比较适合特殊的行情,比如大牛市。
除上面说的简单检验方法,还可以使用统计学中的假设检验方法来进行判断收益>0是否为大概率事件。有关假设检验的内容可以参考统计学整理(二) 中的假设检验 (Hypothesis Testing)。
这里我们以周四买入,周一卖出的周期策略为例来看看该如何进行假设检验
上图是该周期策略的频数直方图,横轴为每日收益率,纵轴为频数。样本数count=773,收益率的均值mean=0.003749,标准差std=0.03988,最小值min=-0.141176,最大值max=0.209091。我们可以看到它整体呈一种正态分布的趋势,但是它的整体方差未知,故而使用t检验来进行假设检验。
- \(H_0\):μ=0
- \(H_A\):μ>0
这里我们的零假设是收益率的总体均值为0,表示不赚也不亏;备择假设为收益率的总体均值>0,赚钱。构建T统计量
\(T={mean(X)-μ\over {S\over \sqrt{n}}}\)~t(n-1)
计算得
\({mean(X)-μ\over {S\over \sqrt{n}}}={0.003749-0\over {0.03988\over \sqrt{773}}}=2.61366569\)
这里我们使用程序来计算整个过程
import math from scipy.stats import t def t_test(tail, mu): ''' t检验(方差未知) :param mu: 总体均值 :return: ''' assert tail in ['both', 'left', 'right'], 'tail should be one of "both", "left", "right"' mean_val = 0.003749 # 样本均值 n = 773 # 样本容量 df = n - 1 # t分布的自由度 s = 0.03988 # 样本标准差 se = s / math.sqrt(n) # 标准误 t_value = (mean_val - mu) / se if tail == 'both': p_value = 2 * (1 - t.cdf(abs(t_value), df)) elif tail == 'left': p_value = t.cdf(t_value, df) else: p_value = 1 - t.cdf(t_value, df) return t_value, p_value if __name__ == '__main__': print(t_test(tail='right', mu=0))
运行结果
(2.613665695358198, 0.0045660672538097025)
由于我们的备择假设是μ>0,故使用右尾检验。由结果可知,p-value=0.0045660672538097025<0.05,拒绝\(H_0\),故收益率的总体均值>0,是赚钱的。
- 对双均线策略的统计检验
首先我们需要知道数据总体的分布情况,可以通过频率直方图来进行观察。
import numpy as np from jqdatasdk import * import pandas as pd import matplotlib.pyplot as plt from scipy.stats import shapiro def calculate_prof_pct(data): ''' 计算单次收益 :param data: :return: ''' data = data[data['signal'] != 0] # 这里只接受一买一卖 to_exclude_indices = [] for i in range(len(data)): if i + 1 < len(data): if data['signal'][i] == -1: if data['signal'][i + 1] == -1: to_exclude_indices.append(data.index[i]) to_exclude_indices.append(data.index[i + 1]) data = data.drop(to_exclude_indices) # 收益率,等同于(当前-之前)/之前 data['profit_pct'] = data['close'].pct_change() # 只需要卖出的收益率 data = data[data['signal'] == -1] return data def calculate_cum_prof(data): ''' 计算累计收益 :param data: :return: ''' data['cum_profit'] = (1 + data['profit_pct']).cumprod() - 1 return data def compos_signal(data): ''' 整合信号 :param data: :return: ''' data['buy_signal'] = np.where((data['buy_signal'] == 1) & (data['buy_signal'].shift(1) == 1), 0, data['buy_signal']) data['sell_signal'] = np.where((data['sell_signal'] == -1) & (data['sell_signal'].shift(1) == -1), 0, data['sell_signal']) data['signal'] = data['buy_signal'] + data['sell_signal'] return data def ma_strategy(data, short_window=5, long_window=20): ''' 双均线策略 :param data: 交易数据 :param short_window: 短期均线时间 :param long_window: 长期均线时间 :return: ''' # 短期均线 data['short_ma'] = data['close'].rolling(window=short_window).mean() # 长期均线 data['long_ma'] = data['close'].rolling(window=long_window).mean() # 生成信号:金叉买入、死叉卖出 data['buy_signal'] = np.where(data['short_ma'] > data['long_ma'], 1, 0) data['sell_signal'] = np.where(data['short_ma'] < data['long_ma'], -1, 0) # 过滤信号 data = compos_signal(data) # 计算单次收益 data = calculate_prof_pct(data) # 计算累计收益 data = calculate_cum_prof(data) data.drop(labels=['buy_signal', 'sell_signal'], axis=1) return data if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) start_date = get_security_info('000001.XSHE').start_date data = get_price('000001.XSHE', start_date=start_date, end_date='2024-01-01', frequency='daily', panel=False) data = ma_strategy(data) # 这里我们的数据为单日收益率 data_return = data['profit_pct'].dropna() print(data_return) # 正态性检验 stat, p = shapiro(data_return) print(stat, p) # 画出频率直方图 plt.hist(data_return, bins=30) plt.show()
运行结果
auth success
2005-03-04 -0.037879
2005-04-27 -0.072581
2005-06-01 -0.032520
2005-06-30 -0.084615
2005-08-22 0.016807
2005-09-21 -0.039683
2005-11-01 -0.102362
2006-01-17 0.098214
2006-02-13 -0.023622
2006-03-08 0.015873
2006-06-13 0.092308
2006-07-19 -0.111801
2007-03-02 1.563380
2007-07-04 0.442500
2007-08-21 0.264881
2007-08-30 -0.017730
2007-11-12 0.096659
2007-12-17 -0.112885
2008-01-22 -0.082558
2008-04-15 -0.093248
2008-05-21 -0.055195
2008-07-17 -0.108460
2008-08-11 -0.072052
2008-09-01 -0.060674
2008-11-28 -0.081851
2008-12-26 -0.105769
2009-04-20 0.521311
2009-05-26 0.018672
2009-07-27 0.262357
2009-08-11 -0.030702
2009-09-23 -0.057143
2009-11-26 0.118033
2009-12-11 0.004196
2009-12-21 -0.076398
2010-02-24 0.006452
2010-03-18 0.026357
2010-03-24 -0.015038
2010-04-09 -0.032689
2010-07-05 -0.056285
2010-09-13 -0.061185
2010-11-10 0.009690
2011-01-18 -0.063694
2011-03-16 -0.004348
2011-05-06 0.063291
2011-06-01 -0.025292
2011-07-25 -0.010204
2011-08-23 -0.024490
2011-09-06 -0.060000
2011-09-26 -0.059184
2011-11-16 -0.041580
2011-12-13 -0.008791
2012-02-20 0.041850
2012-03-13 -0.004115
2012-05-10 -0.002151
2012-07-11 -0.018391
2012-07-20 -0.011574
2012-08-21 -0.025229
2012-10-30 -0.013021
2012-11-19 -0.033163
2013-02-21 0.399015
2013-03-19 -0.067365
2013-03-28 -0.127820
2013-06-07 -0.035836
2013-07-24 -0.059794
2013-07-30 0.004435
2013-09-30 0.198276
2013-10-15 -0.022260
2013-11-28 0.047697
2013-12-05 -0.023328
2014-02-24 -0.064516
2014-04-21 -0.007937
2014-05-06 -0.024762
2014-07-09 0.045714
2014-08-20 0.025818
2014-09-15 -0.023295
2014-10-27 -0.015544
2014-11-20 0.032423
2015-01-13 0.298600
2015-03-05 -0.030573
2015-05-06 0.303249
2015-06-02 -0.051528
2015-06-17 -0.035619
2015-09-23 -0.023841
2015-11-27 0.053455
2015-12-31 -0.041763
2016-02-29 -0.071932
2016-04-22 0.015363
2016-05-06 -0.017615
2016-09-07 0.091413
2016-11-04 -0.014194
2016-12-15 0.007792
2017-03-07 0.033898
2017-08-11 0.117955
2017-09-19 0.002116
2017-10-26 -0.032553
2017-11-06 -0.024390
2017-12-05 0.116371
2018-01-09 -0.032174
2018-02-01 0.035559
2018-02-07 -0.077246
2018-05-03 -0.066327
2018-08-07 0.006353
2018-08-14 -0.023839
2018-09-14 0.050680
2018-10-15 -0.053145
2018-11-12 -0.052960
2019-03-25 0.198167
2019-05-06 -0.036395
2019-07-23 0.103860
2019-08-06 -0.037129
2019-08-28 -0.056061
2019-11-12 0.122835
2020-01-16 0.012784
2020-03-02 -0.051433
2020-04-17 0.000890
2020-05-18 0.015873
2020-06-16 -0.047421
2020-07-24 -0.052174
2020-09-29 0.047012
2020-11-13 0.071629
2020-12-10 -0.010753
2021-02-23 0.141935
2021-04-13 -0.056266
2021-06-15 0.018128
2021-08-27 -0.075281
2021-09-23 -0.140684
2021-11-02 -0.071347
2021-12-16 -0.040532
2022-01-28 -0.079272
2022-02-16 -0.039869
2022-04-25 -0.022794
2022-07-12 -0.001547
2022-09-22 -0.003559
2022-12-22 0.133525
2023-02-06 0.016733
2023-03-09 -0.076037
2023-04-25 -0.054899
2023-05-17 -0.062603
2023-07-24 -0.004735
2023-08-16 0.000914
Name: profit_pct, dtype: float64
0.49042731523513794 5.024614280664747e-20
无论是频率直方图还是正态性检验,我们都可以看出来该数据分布并不符合正态分布。我们先假设其符合正态分布,来看一下t检验的结果,之后使用非参数的威尔科克森符号秩检验来进行重新检验。有关威尔科克森符号秩检验的内容可以参考统计学整理(四) 中的单样本 / 配对 t 检验 <=> 威尔科克森符号秩检验 (Wilcoxon signed-rank test)。
import numpy as np from jqdatasdk import * import pandas as pd from scipy.stats import ttest_1samp def calculate_prof_pct(data): ''' 计算单次收益 :param data: :return: ''' data = data[data['signal'] != 0] # 这里只接受一买一卖 to_exclude_indices = [] for i in range(len(data)): if i + 1 < len(data): if data['signal'][i] == -1: if data['signal'][i + 1] == -1: to_exclude_indices.append(data.index[i]) to_exclude_indices.append(data.index[i + 1]) data = data.drop(to_exclude_indices) # 收益率,等同于(当前-之前)/之前 data['profit_pct'] = data['close'].pct_change() # 只需要卖出的收益率 data = data[data['signal'] == -1] return data def calculate_cum_prof(data): ''' 计算累计收益 :param data: :return: ''' data['cum_profit'] = (1 + data['profit_pct']).cumprod() - 1 return data def compos_signal(data): ''' 整合信号 :param data: :return: ''' data['buy_signal'] = np.where((data['buy_signal'] == 1) & (data['buy_signal'].shift(1) == 1), 0, data['buy_signal']) data['sell_signal'] = np.where((data['sell_signal'] == -1) & (data['sell_signal'].shift(1) == -1), 0, data['sell_signal']) data['signal'] = data['buy_signal'] + data['sell_signal'] return data def ma_strategy(data, short_window=5, long_window=20): ''' 双均线策略 :param data: 交易数据 :param short_window: 短期均线时间 :param long_window: 长期均线时间 :return: ''' # 短期均线 data['short_ma'] = data['close'].rolling(window=short_window).mean() # 长期均线 data['long_ma'] = data['close'].rolling(window=long_window).mean() # 生成信号:金叉买入、死叉卖出 data['buy_signal'] = np.where(data['short_ma'] > data['long_ma'], 1, 0) data['sell_signal'] = np.where(data['short_ma'] < data['long_ma'], -1, 0) # 过滤信号 data = compos_signal(data) # 计算单次收益 data = calculate_prof_pct(data) # 计算累计收益 data = calculate_cum_prof(data) data.drop(labels=['buy_signal', 'sell_signal'], axis=1) return data if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) start_date = get_security_info('000001.XSHE').start_date data = get_price('000001.XSHE', start_date=start_date, end_date='2024-01-01', frequency='daily', panel=False) data = ma_strategy(data) # 这里我们的数据为单日收益率 data_return = data['profit_pct'].dropna() # t检验 t, p = ttest_1samp(data_return, 0) # 单尾检验 p = p / 2 print(t, p)
运行结果
auth success
1.1427300912583633 0.12755756478725003
由结果可知,p值0.12755756478725003>0.05,故接受\(H_0\),即既不赚钱也不亏钱。但由于我们知道数据整体并不呈现正态分布,故而这个假设检验是有很大问题的。
import numpy as np from jqdatasdk import * import pandas as pd from scipy.stats import wilcoxon def calculate_prof_pct(data): ''' 计算单次收益 :param data: :return: ''' data = data[data['signal'] != 0] # 这里只接受一买一卖 to_exclude_indices = [] for i in range(len(data)): if i + 1 < len(data): if data['signal'][i] == -1: if data['signal'][i + 1] == -1: to_exclude_indices.append(data.index[i]) to_exclude_indices.append(data.index[i + 1]) data = data.drop(to_exclude_indices) # 收益率,等同于(当前-之前)/之前 data['profit_pct'] = data['close'].pct_change() # 只需要卖出的收益率 data = data[data['signal'] == -1] return data def calculate_cum_prof(data): ''' 计算累计收益 :param data: :return: ''' data['cum_profit'] = (1 + data['profit_pct']).cumprod() - 1 return data def compos_signal(data): ''' 整合信号 :param data: :return: ''' data['buy_signal'] = np.where((data['buy_signal'] == 1) & (data['buy_signal'].shift(1) == 1), 0, data['buy_signal']) data['sell_signal'] = np.where((data['sell_signal'] == -1) & (data['sell_signal'].shift(1) == -1), 0, data['sell_signal']) data['signal'] = data['buy_signal'] + data['sell_signal'] return data def ma_strategy(data, short_window=5, long_window=20): ''' 双均线策略 :param data: 交易数据 :param short_window: 短期均线时间 :param long_window: 长期均线时间 :return: ''' # 短期均线 data['short_ma'] = data['close'].rolling(window=short_window).mean() # 长期均线 data['long_ma'] = data['close'].rolling(window=long_window).mean() # 生成信号:金叉买入、死叉卖出 data['buy_signal'] = np.where(data['short_ma'] > data['long_ma'], 1, 0) data['sell_signal'] = np.where(data['short_ma'] < data['long_ma'], -1, 0) # 过滤信号 data = compos_signal(data) # 计算单次收益 data = calculate_prof_pct(data) # 计算累计收益 data = calculate_cum_prof(data) data.drop(labels=['buy_signal', 'sell_signal'], axis=1) return data if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) start_date = get_security_info('000001.XSHE').start_date data = get_price('000001.XSHE', start_date=start_date, end_date='2024-01-01', frequency='daily', panel=False) data = ma_strategy(data) # 这里我们的数据为单日收益率 data_return = data['profit_pct'].dropna() # 威尔科克森符号秩检验 t, p = wilcoxon(data_return) # 单尾检验 p = p / 2 print(t, p)
运行结果
auth success
3898.0 0.015501358727512897
由结果可知,p值0.015501358727512897<0.05,拒绝\(H_0\),即赚钱。
寻找最优参数
这里我们要寻找的参数包括股票标的,均线周期。
import numpy as np from jqdatasdk import * import pandas as pd from numexpr.expressions import long_ from scipy.stats import wilcoxon def calculate_prof_pct(data): ''' 计算单次收益 :param data: :return: ''' data = data[data['signal'] != 0] # 这里只接受一买一卖 to_exclude_indices = [] for i in range(len(data)): if i + 1 < len(data): if data['signal'][i] == -1: if data['signal'][i + 1] == -1: to_exclude_indices.append(data.index[i]) to_exclude_indices.append(data.index[i + 1]) data = data.drop(to_exclude_indices) # 收益率,等同于(当前-之前)/之前 data['profit_pct'] = data['close'].pct_change() # 只需要卖出的收益率 data = data[data['signal'] == -1] return data def calculate_cum_prof(data): ''' 计算累计收益 :param data: :return: ''' data['cum_profit'] = (1 + data['profit_pct']).cumprod() - 1 return data def compos_signal(data): ''' 整合信号 :param data: :return: ''' data['buy_signal'] = np.where((data['buy_signal'] == 1) & (data['buy_signal'].shift(1) == 1), 0, data['buy_signal']) data['sell_signal'] = np.where((data['sell_signal'] == -1) & (data['sell_signal'].shift(1) == -1), 0, data['sell_signal']) data['signal'] = data['buy_signal'] + data['sell_signal'] return data def ma_strategy(data, short_window=5, long_window=20): ''' 双均线策略 :param data: 交易数据 :param short_window: 短期均线时间 :param long_window: 长期均线时间 :return: ''' print('========当前周期参数对:', short_window, long_window) # 短期均线 data['short_ma'] = data['close'].rolling(window=short_window).mean() # 长期均线 data['long_ma'] = data['close'].rolling(window=long_window).mean() # 生成信号:金叉买入、死叉卖出 data['buy_signal'] = np.where(data['short_ma'] > data['long_ma'], 1, 0) data['sell_signal'] = np.where(data['short_ma'] < data['long_ma'], -1, 0) # 过滤信号 data = compos_signal(data) # 计算单次收益 data = calculate_prof_pct(data) # 计算累计收益 data = calculate_cum_prof(data) data.drop(labels=['buy_signal', 'sell_signal'], axis=1) return data if __name__ == '__main__': auth('账户', '密码') pd.set_option('display.max_rows', 5000) pd.set_option('display.max_columns', 100) # 股票池 stocks = ['000001.XSHE'] # 周期参数 params = [5, 10, 20, 60, 120, 250] # 存放参数与收益 res = [] for code in stocks: for short in params: for long in params: if long > short: data = get_price(code, start_date='2019-01-01', end_date='2024-01-01', frequency='daily', panel=False) data = ma_strategy(data, short_window=short, long_window=long) print(data[['close', 'short_ma', 'long_ma', 'signal', 'cum_profit']]) # 获取周期参数,及其对应累计收益值(最后一行) cum_profit = data['cum_profit'].iloc[-1] res.append([short, long, cum_profit]) res = pd.DataFrame(res, columns=['short_window', 'long_window', 'cum_profit']) # 对累积收益进行排序(倒序) res = res.sort_values(by='cum_profit', ascending=False) print(res)
运行结果
auth success
========当前周期参数对: 5 10
close short_ma long_ma signal cum_profit
2019-03-12 10.68 10.852 10.917 -1 0.206780
2019-03-26 10.45 10.752 10.819 -1 0.141253
2019-04-26 11.91 12.194 12.292 -1 0.177844
2019-05-23 10.62 10.726 10.826 -1 0.169038
2019-07-10 11.84 11.984 12.069 -1 0.274531
2019-07-23 12.01 12.038 12.040 -1 0.280931
2019-08-05 11.65 12.170 12.228 -1 0.231258
2019-08-22 12.49 12.848 12.923 -1 0.165031
2019-09-17 12.43 12.656 12.685 -1 0.137575
2019-10-22 14.33 14.546 14.581 -1 0.217435
2019-11-01 14.72 14.512 14.547 -1 0.214136
2019-11-05 14.97 14.600 14.613 -1 0.230576
2019-11-12 14.26 14.514 14.557 -1 0.184876
2019-12-27 14.52 14.326 14.341 -1 0.285830
2020-01-14 14.63 14.646 14.719 -1 0.300048
2020-02-27 13.19 13.262 13.303 -1 0.306984
2020-03-12 12.82 12.854 12.895 -1 0.299886
2020-04-07 11.24 11.198 11.242 -1 0.292984
2020-05-14 11.61 11.990 12.012 -1 0.334360
2020-06-12 11.54 11.876 11.938 -1 0.280009
2020-07-15 12.67 13.184 13.217 -1 0.392079
2020-08-25 12.97 13.002 13.016 -1 0.477517
2020-09-25 13.49 13.742 13.774 -1 0.483014
2020-11-02 15.66 15.726 15.752 -1 0.628612
2020-11-11 15.82 15.826 15.855 -1 0.583567
2020-12-08 16.62 17.066 17.241 -1 0.572215
2020-12-21 16.23 16.576 16.590 -1 0.565463
2021-02-19 21.18 21.552 21.638 -1 0.944664
2021-03-10 18.12 19.202 19.333 -1 0.776074
2021-03-23 18.85 18.860 18.880 -1 0.734663
2021-04-09 18.92 19.126 19.184 -1 0.678763
2021-05-14 20.87 20.872 20.896 -1 0.714919
2021-06-03 21.27 21.530 21.628 -1 0.710897
2021-06-15 20.78 21.474 21.514 -1 0.611624
2021-07-02 19.52 20.182 20.358 -1 0.542860
2021-08-24 17.33 17.728 17.744 -1 0.567278
2021-09-22 16.09 16.912 17.250 -1 0.464431
2021-11-01 17.35 17.646 17.682 -1 0.463587
2021-11-23 16.00 16.120 16.175 -1 0.419236
2021-12-16 15.86 16.020 16.189 -1 0.362535
2022-01-17 14.52 15.028 15.150 -1 0.285511
2022-01-28 14.17 14.826 14.925 -1 0.183606
2022-02-17 14.70 14.820 14.830 -1 0.137190
2022-04-18 14.23 14.336 14.407 -1 0.190744
2022-05-26 12.70 13.036 13.062 -1 0.155267
2022-06-23 12.71 12.786 12.795 -1 0.143571
2022-07-08 13.01 13.126 13.155 -1 0.135714
2022-09-07 11.23 11.392 11.426 -1 0.156307
2022-09-21 11.33 11.460 11.478 -1 0.129393
2022-11-24 10.72 10.652 10.692 -1 0.221705
2022-12-16 12.15 12.028 12.134 -1 0.379527
2023-02-02 13.30 13.588 13.646 -1 0.545721
2023-03-02 12.97 12.708 12.709 -1 0.566250
2023-03-09 12.03 12.494 12.601 -1 0.493026
2023-04-12 11.37 11.462 11.477 -1 0.469758
2023-04-25 11.19 11.386 11.492 -1 0.389071
2023-05-16 11.50 11.620 11.702 -1 0.358360
2023-06-15 10.84 10.766 10.826 -1 0.333752
2023-07-10 10.45 10.522 10.532 -1 0.317364
2023-07-21 10.58 10.554 10.554 -1 0.319859
2023-08-10 11.35 11.366 11.386 -1 0.369323
2023-09-04 10.79 10.540 10.543 -1 0.397824
2023-09-13 10.50 10.540 10.575 -1 0.380729
2023-10-09 10.37 10.428 10.429 -1 0.370159
2023-11-13 9.57 9.732 9.774 -1 0.340738
========当前周期参数对: 5 20
close short_ma long_ma signal cum_profit
2019-03-25 10.46 10.872 10.8725 -1 0.101053
2019-05-06 11.12 11.878 12.0455 -1 0.060980
2019-07-23 12.01 12.038 12.0460 -1 0.171173
2019-08-06 11.67 11.994 12.1170 -1 0.127689
2019-08-28 12.46 12.534 12.5705 -1 0.064470
2019-11-12 14.26 14.514 14.5715 -1 0.195224
2020-01-16 14.26 14.542 14.5450 -1 0.210504
2020-03-02 12.91 12.996 13.0510 -1 0.148244
2020-04-17 11.25 11.156 11.1595 -1 0.149266
2020-05-18 11.52 11.724 11.7520 -1 0.167508
2020-06-16 11.45 11.594 11.7085 -1 0.112144
2020-07-24 11.99 12.636 12.7435 -1 0.054119
2020-09-29 13.14 13.508 13.6015 -1 0.103675
2020-11-13 15.26 15.736 15.7665 -1 0.182731
2020-12-10 16.56 16.746 16.8300 -1 0.170013
2021-02-23 19.47 20.650 20.8035 -1 0.336079
2021-04-13 18.45 18.824 18.9430 -1 0.260904
2021-06-15 20.78 21.474 21.5595 -1 0.283762
2021-08-27 16.46 16.946 17.1085 -1 0.187119
2021-09-23 15.82 16.608 16.7685 -1 0.020110
2021-11-02 16.27 17.310 17.3155 -1 -0.052672
2021-12-16 15.86 16.020 16.0350 -1 -0.091069
2022-01-28 14.17 14.826 15.0490 -1 -0.163122
2022-02-16 14.69 14.922 14.9250 -1 -0.196488
2022-04-25 13.29 14.030 14.0720 -1 -0.214803
2022-07-12 12.91 12.954 13.0090 -1 -0.216018
2022-09-22 11.20 11.332 11.4505 -1 -0.218808
2022-12-22 11.80 11.840 11.8820 -1 -0.114499
2023-02-06 12.76 13.232 13.3880 -1 -0.099682
2023-03-09 12.03 12.494 12.6230 -1 -0.168139
2023-04-25 11.19 11.386 11.4920 -1 -0.213807
2023-05-17 11.38 11.556 11.5580 -1 -0.263025
2023-07-24 10.51 10.544 10.5460 -1 -0.266515
2023-08-16 10.95 11.048 11.1105 -1 -0.265844
========当前周期参数对: 5 60
close short_ma long_ma signal cum_profit
2019-05-10 10.95 10.932 11.105500 -1 -0.051127
2019-11-26 13.64 13.746 13.808667 -1 0.098696
2020-01-22 14.05 14.190 14.202167 -1 0.074229
2020-05-14 11.61 11.990 11.997833 -1 0.023957
2020-06-17 11.41 11.480 11.552500 -1 -0.028815
2020-07-29 12.02 12.012 12.056167 -1 -0.077182
2021-03-12 19.08 18.758 18.871167 -1 0.411977
2021-03-19 18.18 18.944 19.057000 -1 0.363237
2021-06-23 20.71 20.410 20.432833 -1 0.365214
2021-06-29 19.99 20.532 20.536167 -1 0.305148
2021-11-03 16.14 16.972 17.018000 -1 0.225427
2022-04-25 13.29 14.030 14.086833 -1 0.109395
2022-07-07 12.91 13.194 13.233500 -1 0.073635
2022-11-21 10.44 10.672 10.723167 -1 0.061435
2023-03-08 12.33 12.682 12.697667 -1 0.180116
2023-08-21 10.57 10.812 10.815667 -1 0.090370
========当前周期参数对: 5 120
close short_ma long_ma signal cum_profit
2020-02-03 12.21 13.632 13.726083 -1 -0.013732
2020-07-29 12.02 12.012 12.082917 -1 -0.148352
2021-07-05 19.74 20.052 20.055667 -1 0.375739
2021-07-08 19.25 19.816 20.127667 -1 0.298822
2023-03-20 11.45 11.674 11.732250 -1 0.245520
2023-08-07 11.35 11.384 11.385417 -1 0.231416
2023-08-11 11.10 11.290 11.343250 -1 0.203232
========当前周期参数对: 5 250
close short_ma long_ma signal cum_profit
2020-03-16 12.00 12.642 12.71708 -1 -0.181446
2020-07-17 12.56 12.812 12.87036 -1 -0.265640
2020-08-26 12.76 12.872 12.90276 -1 -0.303314
2021-07-27 15.90 17.452 17.53100 -1 -0.175795
2021-08-23 17.27 17.784 17.88460 -1 -0.228927
2023-03-13 11.89 12.138 12.22820 -1 -0.311707
========当前周期参数对: 10 20
close short_ma long_ma signal cum_profit
2019-03-21 10.96 10.835 10.8460 -1 0.153684
2019-05-07 11.19 12.016 12.0245 -1 0.118694
2019-07-19 12.21 12.002 12.0125 -1 0.235014
2019-09-02 12.62 12.570 12.6385 -1 0.256925
2019-11-04 14.77 14.549 14.5555 -1 0.448111
2019-11-08 14.54 14.640 14.6495 -1 0.406515
2019-11-15 14.26 14.508 14.5275 -1 0.407502
2020-01-21 13.97 14.455 14.5215 -1 0.365473
2020-03-06 13.12 13.051 13.1040 -1 0.346993
2020-04-17 11.25 11.148 11.1595 -1 0.349392
2020-04-21 11.74 11.231 11.2365 -1 0.396989
2020-05-21 11.70 11.817 11.8265 -1 0.415132
2020-06-19 11.37 11.632 11.6755 -1 0.329756
2020-07-24 11.99 12.724 12.7435 -1 0.145386
2020-10-13 14.26 13.670 13.6985 -1 0.297316
2020-11-17 15.83 15.760 15.7745 -1 0.396092
2020-12-14 16.77 16.954 16.9565 -1 0.398594
2021-02-26 18.99 20.539 20.7555 -1 0.529033
2021-04-15 18.08 18.824 18.8620 -1 0.448136
2021-06-15 20.78 21.514 21.5595 -1 0.477283
2021-08-31 15.93 17.056 17.0915 -1 0.317644
2021-09-28 16.08 16.581 16.6290 -1 0.212806
2021-11-04 15.99 17.258 17.3075 -1 0.123567
2021-12-23 15.50 15.831 15.9320 -1 0.058680
2022-04-27 14.01 14.063 14.0965 -1 0.128775
2022-07-15 11.85 12.780 12.8730 -1 0.042556
2022-09-26 10.93 11.403 11.4075 -1 0.008419
2022-12-23 11.83 11.902 11.9190 -1 0.095463
2023-02-08 12.79 13.324 13.3950 -1 0.073638
2023-03-09 12.03 12.601 12.6230 -1 -0.007998
2023-04-26 11.04 11.459 11.4680 -1 -0.064757
2023-05-23 11.12 11.450 11.4615 -1 -0.111878
2023-08-18 10.79 11.083 11.1325 -1 -0.094250
2023-09-19 10.46 10.532 10.5385 -1 -0.101125
========当前周期参数对: 10 60
close short_ma long_ma signal cum_profit
2019-05-15 11.16 11.139 11.161500 -1 -0.032929
2019-11-29 13.35 13.780 13.860167 -1 0.112965
2020-02-03 12.21 14.061 14.156167 -1 -0.045024
2020-05-18 11.52 11.915 11.937500 -1 -0.075519
2020-06-22 11.22 11.544 11.575333 -1 -0.139197
2020-08-05 12.22 12.054 12.055333 -1 -0.244324
2021-03-18 19.30 19.017 19.034500 -1 0.177123
2021-06-29 19.99 20.482 20.536167 -1 0.134556
2021-11-08 15.59 16.801 17.011333 -1 0.009573
2022-04-29 13.71 13.929 13.987000 -1 -0.036125
2023-02-28 12.56 12.606 12.625167 -1 0.091639
2023-03-08 12.33 12.678 12.697667 -1 0.042595
2023-08-24 10.39 10.755 10.794667 -1 -0.045589
========当前周期参数对: 10 120
close short_ma long_ma signal cum_profit
2020-02-05 12.77 13.667 13.736167 -1 0.031502
2020-08-06 12.34 12.044 12.049083 -1 -0.090804
2021-07-09 19.04 19.951 20.139417 -1 0.422439
2023-03-23 11.75 11.720 11.740167 -1 0.355528
2023-08-14 10.89 11.291 11.332000 -1 0.300590
========当前周期参数对: 10 250
close short_ma long_ma signal cum_profit
2020-03-17 11.71 12.692 12.71988 -1 -0.201228
2020-07-23 12.44 12.845 12.88372 -1 -0.248357
2021-07-30 15.83 17.247 17.56716 -1 -0.072602
2023-03-16 11.68 12.163 12.20560 -1 -0.176899
========当前周期参数对: 20 60
close short_ma long_ma signal cum_profit
2019-05-23 10.62 11.2435 11.262833 -1 -0.079723
2019-12-05 13.47 13.8660 13.921333 -1 0.013584
2020-02-07 12.76 14.0210 14.021167 -1 -0.131991
2021-03-24 18.23 19.1120 19.186833 -1 0.399099
2021-07-07 20.18 20.5540 20.623500 -1 0.332412
2021-11-11 16.42 16.9570 16.960833 -1 0.218841
2022-05-12 12.87 13.7940 13.826167 -1 0.190174
2023-03-07 12.47 12.6880 12.696167 -1 0.263104
2023-09-05 10.63 10.7410 10.764333 -1 0.182977
========当前周期参数对: 20 120
close short_ma long_ma signal cum_profit
2020-02-12 12.89 13.7005 13.767333 -1 0.041195
2021-07-13 18.90 20.0895 20.148500 -1 0.509095
2023-04-03 11.54 11.7320 11.770000 -1 0.395429
========当前周期参数对: 20 250
close short_ma long_ma signal cum_profit
2020-03-19 10.68 12.6715 12.72192 -1 -0.271487
2021-08-05 15.82 17.5135 17.63056 -1 -0.152568
2023-03-23 11.75 12.1605 12.17956 -1 -0.275304
========当前周期参数对: 60 120
close short_ma long_ma signal cum_profit
2020-02-27 13.19 13.793333 13.80100 -1 0.065428
2021-08-11 17.73 19.557000 19.58950 -1 0.545830
2023-05-04 11.60 11.987833 11.99625 -1 0.341184
========当前周期参数对: 60 250
close short_ma long_ma signal cum_profit
2020-04-09 11.12 12.719833 12.74204 -1 -0.241473
2021-09-09 17.01 18.005333 18.06520 -1 -0.070422
2023-05-12 11.50 11.889500 11.89104 -1 -0.126622
========当前周期参数对: 120 250
close short_ma long_ma signal cum_profit
2020-05-29 11.54 12.726833 12.74176 -1 -0.212824
2021-11-08 15.59 18.412750 18.45200 -1 -0.236811
2023-07-31 11.50 11.445333 11.44832 -1 -0.214264
short_window long_window cum_profit
10 20 120 0.395429
12 60 120 0.341184
0 5 10 0.340738
7 10 120 0.300590
3 5 120 0.203232
9 20 60 0.182977
2 5 60 0.090370
6 10 60 -0.045589
5 10 20 -0.101125
13 60 250 -0.126622
8 10 250 -0.176899
14 120 250 -0.214264
1 5 20 -0.265844
11 20 250 -0.275304
4 5 250 -0.311707
由结果可知,对于平安银行这支股票来说,从2019年到2023年使用双均线策略来说,最好的结果是短期均线为MA20和长期均线为MA120的两条均线。
数据回测与优化
回测:测试历史数据的预测模型,是一种反向测试,旨在估计策略或模型的在过去一段时间内的表现,需要提供足够的细节模拟过去的条件。
它是以一种大数据的方式去验证策略,设定的交易是否有效,从各种评价指标或者统计学层面。同时,我们也需要正确看待回测:
回测结果好≠100%赚钱
我们需要去看交割单,开仓和平仓的价格是否正确,收益是在哪个节点产生变化,节点数是否正确,从亏损到产生正收益的时候需要查看数据是否准确。
数据回测 vs 实盘交易
- 这两种情况其实是有一定差异的,产生差异的原因之一——未来函数。
如果我们真实使用过一个策略,针对一个个股,尝试进行交易,不管是手工开仓、平仓还是使用自动化交易的方式,都会产生未来函数的问题。比如在上图中使用的布林道策略,这里简单介绍一下布林道策略
一、布林带指标介绍
布林带由三条轨道线组成:
- 中轨:通常是一条简单移动平均线,如 20 日移动平均线。
- 上轨:中轨加上一定倍数的标准差。
- 下轨:中轨减去一定倍数的标准差。
二、布林策略的原理
- 价格波动特性:价格通常在布林带的上下轨之间波动。当价格接近上轨时,可能被视为超买状态,价格有回调的可能;当价格接近下轨时,可能被视为超卖状态,价格有反弹的可能。
- 趋势判断:布林带的中轨可以作为趋势的参考。当价格在中轨上方运行时,通常被认为处于上升趋势;当价格在中轨下方运行时,通常被认为处于下降趋势。
三、布林策略的具体应用
- 买入信号:
- 当价格从下轨附近向上突破中轨时,可以考虑买入。这表明价格可能从超卖状态转为上涨趋势。
- 当价格在中轨附近获得支撑,且布林带呈现收口后重新开口向上的形态时,也可以作为买入信号。
- 卖出信号:
- 当价格从上轨附近向下跌破中轨时,可以考虑卖出。这表明价格可能从超买状态转为下跌趋势。
- 当价格在中轨附近遇到阻力,且布林带呈现收口后重新开口向下的形态时,也可以作为卖出信号。
由于我们平时使用的是日K的收盘价数据,对于实盘来说,收盘后我们是无法买入的。这里有两种解决方案
- T+1而不是T+0,产生的信号都是在第二天进行交易。
- 使用一天中的分时数据去替代收盘价,只要今天的价格,从历来的收盘价来看,碰到了下轨就买入,碰到了上轨就卖出。
方式1的问题
- 错过最佳入场时机
- 交易成本变高(第二天的开盘价90%会升高),收益变低,亏损的概率提升。
方式2的问题
- 代码的复杂度提升,因为取的是分时价格,对数据处理的要求会提升。
- 产生差异的原因之二——滑点
滑点指的是一笔交易或挂单交易中所要求的价格和实际订单执行或成交价格之间的差异。简单说就是委托价和实际成交价不一样。如
- 市价单:理论价格1,实际价格1.1,按照实际价格成交,造成损失。
- 限价单:理论价格1,可能无法成交。