本研究的研究目的为对世界各国的投资风险进行定量研究,生成风险指标及其标准方差,为企业投资决策提供参考。本研究与现有通行的通过人工选择风险构成指标和人工主观赋值的方法不同,采用大数据和机器学习的方法,旨在控制风险指标生成过程中的选择偏差和权重主观性的重大缺陷。研究课题组通过对大量数据源进行运用,共搜集和整理了8000多条数据,每条数据包括大于200个维度的信息,包含了全世界151个国家54年来在地理、历史、文化、经济、政治、社会等各个方面的情况。使用数据之大、维度之高、信息之全、覆盖面之广,大大超过现有的风险评估系统。在统计方法上,本研究运用了多重增补法解决数据缺失问题;运用多种统计手段(包括相关性分析和单变量回归模型等等)进行数据降维处理,并采用机器学习方法、通过LASSO模型对风险构成指标进行筛选。在机器学习确定变量之后,本研究建立了基于向前一年、两年和五年的政治风险和政策风险预测模型。