对于数据钞票,近期神想数据(SensData)之前已为群众带来了多份数据。今天咱们再次诈欺最新的盘问文件,为群众整理带来上市公司数据钞票分享的测算数据。
01|简要证实
及第“数据钞票分享”为种子词,借助Word2Vec本事对种子词进行扩展。在年报中形容企业数据钞票分享时,频频会出现多个语义附进、表意相易的词汇,因此需要进一步对种子词进行近义词扩展,以擢升要道词及第的全面性。完成数据钞票分享辞书的构建!
凭据已构建的辞书,通过Python统计上市公司1999年-2023年时候年度酌量文本的要道词词频,再通过对数化料理获得可臆度上市公司数据钞票分享进度的替代变量。
02|数据证实
流程最终统计,获得认为约6.3W+条数据样本。如下;
注1:由于咱们还未统计上市公司年度论说整个笔墨的总词频,因此暂时不可使用数据钞票分享要道词的总词频与年度论说总词频进行比值,只可对数据钞票分享要道词总词频进行对数化料理获得最终成果!
注2:本数据已上传至(神想数据-恒久会员数据-数据钞票)专区!推选加入神想数据恒久会员,即可免费使用更多优质数据!
03|🔍神想数据加入会员|下载海量优质数据|开具发票
#数据钞票#