雪球作为投资交流平台,其粉丝数量较多的大V用户是股票市场参与者的重要构成。我们在《雪球大V用户的选股行为alpha》专题报告中,介绍了雪球用户数据整体框架:雪球用户基本信息、自选股信息、模拟组合信息和发帖文本信息,并基于用户自选股和模拟组合信息构建了选股策略。进一步,我们对用户发帖文本信息进行了获取,本文将着重对雪球大V用户的发帖行为进行深度剖析。
01
雪球大V用户发帖行为信息
1.1、 雪球大V用户发帖数据
我们选择粉丝数量500以上的雪球用户,获取了各个用户的历史发帖信息。表1给出了雪球用户发帖信息数据示例,主要内容包含:用户id、用户发帖日期和时刻、关联个股信息、发帖文本内容和帖子情绪信息。我们对发帖信息处理流程分为三步:发帖过滤—文本映射股票代码—发帖多空情感分析。
我们从帖子内容可以发现,大部分帖子文本会涉及到股票信息,包括股票名称或股票代码。但部分发帖可能并不涉及股票信息,因此我们需要首先过滤掉没有股票的发帖样本。从所有发帖与含有股票发帖数量分布来看(图2):从-,所有发帖月均数量为5.7万条,其中含股票发帖月均数量为3.1万条。
过滤得到含股票发帖样本后,我们需要提取出帖子中涉及的个股代码信息。这里我们进行了股票名称和股票代码映射,首先获取A股所有个股的当前股票名称和历史股票名称,并与发帖文本进行匹配,最终得到发帖样本和股票代码的对应关系。
雪球大V发帖行为上,用户发帖中可能涉及单只股票或多只股票。从单只股票样本与多只股票样本数量分布来看(图3):从-,单只股票发帖月均数量1.8万条,多只股票发帖月均数量1.3万条,单只股票样本数量占比更高。
不同雪球用户对单一个股的关注持续周期存在差异。我们统计了不同用户对单一个股发帖次数分布(图4),其中发帖次数1次占比最高,但小部分单只股票发帖会超过10次。从用户对个股关注的持续天数分布来看(图5):部分用户对个股关注的持续天数会持续较长时间。
1.2、 雪球大V用户发帖事件收益
在进行发帖多空情感分析之前,我们先测算发帖股票样本事件收益。考虑当日涨跌停个股关注度相对更高,用户发帖更容易提及涨跌停个股。我们将当日涨跌停的发帖样本进行剔除,进一步测算发帖后60交易日相对中证800指数的累计超额收益(图6):雪球大V发帖样本60日事件收益均值为0.7%。我们在《雪球大V用户的选股行为alpha》中,测算出雪球大V自选股加自选事件收益均值为3.2%,模拟组合调增个股样本事件收益均值为2.3%。
从不同粉丝数量雪球大V发帖样本事件收益来看(图7),整体上粉丝数量较高的用户事件收益高于粉丝数量较低的用户事件收益:1万粉丝以上的样本事件收益为正,1万粉丝数量以下的样本事件收益为负。
从图6对比结果可以看出,如果不对发帖内容进行多空情感分析,其收益水平较低,显著低于自选股行为和模拟组合调仓行为的收益水平。因此接下来我们对雪球大V发帖内容进行情感分析,判断用户对个股的多空情感态度。
02
雪球大V用户发帖情感分析
2.1、 多空关键词判断发帖多空情感
用户发帖信息主要包含文本信息,首先我们可以利用看多或看空关键词,来判断发帖的多空情感。关键词判断方法一般用在股票研报标题、股票研报摘要、股票财报附注等文本信息,这里我们选择雪球大V用户发帖文本进行情感分析。
看多关键词判断发帖情感效果优异。表2给出了30个看多个股的关键词,包含“预增”、“扭亏为盈”、“低估”、“量价齐升”等。我们选择发帖文本中含有对应关键词的帖子涉及的个股样本,测算得到对应关键词个股的60日事件收益。可以发现,30个看多关键词股票样本事件收益提升,整体优于所有样本事件收益(0.7%)。其中,14个看多关键词样本事件收益超过2%,2个看多关键词样本事件收益超过3%。
图8展示了部分看多关键词的60日事件收益结构。可以发现,相对所有样本事件收益,这些看多关键词的事件收益回撤较小,整体事件收益走势向上,事件收益结构优于所有样本。
看空关键词发帖个股样本事件收益低于全部样本。表3展示了8个看空个股的关键词,包含“顶部”、“清仓”、“减仓”、“不及预期”等。我们选择发帖文本中含有对应关键词的帖子涉及的个股样本,测算得到对应关键词个股的60日事件收益。可以发现,8个看空关键词股票样本事件收益低于所有样本事件收益(0.7%),其中 2个看空关键词样本事件收益为负。
2.2、 个股关注度影响发帖个股收益
在雪球大V发帖行为中,不同个股的关注度存在差异。我们在前文提到,单一帖子可能涉及单只或多只个股,同时不同雪球大V对单一个股的发帖频率和关注持续天数存在差异。我们以发帖涉及股票数量差异以及大V对个股的日内关注度出发,分析个股关注度是否会影响发帖个股收益。
单只股票发帖样本事件收益优于多只股票发帖样本。我们按照发帖涉及股票数量,将发帖样本分为单只股票发帖样本和多只股票发帖样本,并测算得到两类股票样本事件收益(图9)。可以看出:单只股票发帖样本事件收益0.9%,多只股票样本事件收益0.5%,关注度相对更高的单只股票发帖样本收益水平更优。
发帖个股日内关注度上升,事件收益水平整体下降。我们将单个雪球大V对单一个股日内发帖次数,定义为该大V对个股的日内关注度。图10给出了,不同个股日内关注度样本个股的事件收益水平。随着日内关注度增加,个股事件收益水平整体下降。其中,1次和2次样本个股事件收益分别为1.2%和1.3%,10次以上关注个股事件收益甚至降为负值。我们从图11对比可以发现,日内关注度10次以上的样本在发帖前后超额收益更高,原因在于这些个股更大概率为市场高度关注个股。
2.3、 发帖情感分析:结合自选股与模拟组合行为
考虑到雪球大V用户发帖行为会同时伴随其他行为,例如自选股加自选和模拟组合调仓。投资者不同行为之间可以交叉验证,帮助判断对于个股的多空态度。因此,我们尝试借助用户的其他行为,来辅助判断用户发帖行为的多空情感。
自选股挑选样本事件收益提升至2.0%。基于《雪球大V用户的选股行为alpha》专题报告中的结论,雪球大V用户加入自选股行为存在正向超额收益,因此加入自选股行为本身偏向看多相应个股。我们结合自选股行为对用户发帖样本进行挑选,选择发帖前用户曾将发帖个股加入自选的样本,测算挑选后样本事件收益。自选股挑选样本股票事件收益提升至2.0%,显著优于所有样本事件收益(0.7%)。结合自选股行为的发帖情感分析效果提升显著。
模拟组合调仓挑选样本事件收益提升至2.8%。雪球大V模拟组合买入或调增个股行为,表明用户看多该股票。我们结合模拟组合调仓行为对用户发帖样本进行挑选,选择发帖前用户曾调仓买入或增仓的股票样本,测算挑选后样本事件收益。模拟组合调仓挑选样本股票事件收益提升至2.8%,显著优于所有样本事件收益(0.7%)。结合模拟组合调仓行为的发帖情感分析效果提升显著。
03
雪球大V用户分时能力刻画
我们在《雪球大V用户的选股行为alpha》中,构建了雪球大V用户的五维指标评价体系(图14),用来分析用户多维能力。从日内高频交易出发,私募量化机构相比公募量化机构更加关注雪球大V用户的日内分时影响能力。这里我们尝试补充雪球大V用户的分时能力刻画指标。
雪球大V用户分时能力是影响力和判断力的综合体现。图15给出了某大V用户发帖后对应个股的分时走势(虚线框左侧对应发帖时候,虚线框内对应发帖后走势)。可以看出在发帖后,该个股分时图显著放量,或说明该用户的分时影响能力较强。
为了刻画雪球用户的分时能力,样本选择上,我们剔除当天涨跌停股票、上市不满60天次新股样本,选择发帖时刻在9:50-14:40之间样本数据。指标计算方面,读取样本个股和指数日内分钟数据,计算发帖时刻后5min,个股相对基准指数累计超额收益。进一步对每个大V用户,我们计算各个用户所有符合条件样本的超额收益均值,记为分时能力指标R。
图16给出了所有雪球大V分时能力指标R的频率分布。所有用户分时能力指标均值为0.13%,整体具有分时能力。我们对所有雪球大V用户的分时能力指标进行排序,筛选了大V个股样本数量10次以上、指标均值靠前的大V名单,其中超额收益均值2%以上的大V用户有12位(表4)。
04
雪球大V用户发帖行为组合优选
4.1、 雪球大V发帖情绪指标优选组合
我们基于发帖情感分析结果,对不同发帖个股样本计算情感分析综合指标。综合指标是融合发帖文本关键词、发帖个股关注度、结合自选股与模拟组合行为后的综合结果。进一步,我们选择综合情绪指标靠前的20%个股样本,等权构建事件组合得到情绪指标优选组合。从情绪指标优选组合绩效表现来看(图17,表5):全区间内,情绪指标优选组合年化收益率为9.6%,收益表现优于同期的沪深300指数年化收益率(0.6%)和中证500指数年化收益率(-2.9%)。
4.2、 自选股绩效&情绪优选组合收益表现提升
我们在《雪球大V用户的选股行为alpha》中,构建了基础自选股事件组合,并基于基础自选股股票池,利用绩效指标优选得到自选股绩效优选组合。这里我们展示自选股超额收益波动比(自选股超额收益均值/自选股超额收益标准差)指标,优选后的自选股绩效优选组合表现(图18,表6,表7)。自选股绩效优选组合年化收益提升至25.6%,优于基础自选股组合年化收益11.0%。
自选股绩效&情绪优选组合收益表现提升。考虑到雪球大V用户加入自选行为,涉及个股样本本身存在情感差异,可以通过发帖行为进行辅助判断。我们尝试将发帖行为信息融入到自选股优选中,对自选股样本进行情绪优选。我们基于自选股绩效优选组合股票池,进一步选择发帖情绪指标靠前的50%个股样本,构建得到自选股绩效&情绪优选组合。自选股绩效&情绪优选组合月均持股数量为146只,组合全区间年化收益率为31.1%,相对于自选股绩效优选组合(25.6%)收益表现提升。分年收益来看,自选股绩效&情绪优选组合分年度均显著跑赢基准指数。
05
风险提示
模型基于历史数据测算,市场未来可能发生重大改变。
(END)
一地基毛朋友圈开张了:
为方便与一地基毛的读者们直接有效沟通,我们决定直接跟大家建立好友关系。
大家可以直接加基毛哥微信。
未来我们会在基毛哥朋友圈分享行业动态、基金经理深度分析和投资感悟,偶尔还会分享一些市场八卦,与大家一起吃瓜。
投资策略
1、
2、
3、
4、
5、
6、
7、
8、
9、
11、
12、
13、
14、
15、
16、
指增点评:沪深300丨中证500|中证1000|红利指数|标普500|上证50|科创板100
1、
2、
3、
6、
晨星点评
1、
2、
3、
4、
6、
7、
8、
9、
10、
明星经理
五年期:|||||||||||||||||||||
十年期:||||||||||||||
FOF:||||
避雷手册
我就知道你在看!