当前位置:首页 >新闻 >

将替代数据进行情境化是获得真知灼见的关键

来源:   2020-12-08 17:57:59

这些数字令人难以置信,对于我们的人脑而言,实在太多了。对于资产管理行业而言,寻找一种可以以能够将洞察力带入投资组合的方式利用技术的方法,很可能会成为演进的下一个重要阶段,在此阶段,数据管理将确定失败者的赢家。

SEI在其最新的白皮书《创新的指数拉动》中将其称为金融服务的“融合”。Google不仅仅是大数据概念的占位符,“ Google发挥了从数据中获取实用知识的可靠方法的作用。这是数据丰富的象征,我们在有效使用这些数据方面迈进了一步。”白皮书指出。

数据布道

资产经理如何处理大数据远非直截了当。许多传统,保守的企业发现很难证明在创新上花费大量预算并摆脱多年来为他们服务良好的稳定基础的合理性。

要有人提出建议,他们可能想重新考虑他们的业务方式,而如今他们做事的方式可能会在10年后消失……这是很难下的药。

Lombard Odier Investment Managers的1798年Q战略投资组合经理Qaisar Hasan评论道:“在任何资产管理公司中进行变革都非常困难。”

1798 Q是股票市场中立策略,将严格的数据科学与基础分析相结合。在2018年5月加入LOIM之前,Hasan是Point 72 Asset Management的投资组合经理,在那里他发起了该公司的替代数据驱动的多头/空头投资策略。

要走上更大的创新之路,需要更多的资源(人力和财力),更多的数据和系统访问权限,以及可能给现有人员和流程带来的破坏,因此人们可以理解为什么资产管理者之间会有些勉强。

在成功跨越那条道路上,有些人会比其他人更好。

“我们运行一种专门的策略,该策略是围绕替代数据的优缺点量身定制的,并从基本角度获取数据集。LOIM看好大数据,并在数据方面建立了跨团队协作的文化。

“您必须成为传教士。您必须宣传并帮助人们了解其好处。如果他们看到您将其付诸实践,那么他们很可能会跟随您,而不是将大数据视为主要是学术活动。”

大数据很重要

正如SEI的白皮书所指出的那样,全世界的分析师都在为电子表格而苦苦挣扎,因为它们会整理数据集以在数据过时之前收集见解。为了解决这个问题,公司希望通过自动分析流数据来解决该问题。

为此,一些资产管理者正忙于从描述性分析的老式世界过渡到更具前沿性的预测性分析,而这些尖端的复杂性以先进的机器学习工具为基础,这些工具以与黑洞相同的胃口消耗原始数据。

并不是说这必然意味着传统资产管理者必须变得完全定量。

LOIM通过1798年的Q策略,试图将定量和基础投资的两个截然不同的传统世界融合在一起。

“从历史上看,这两种风格就像油和水一样,”哈桑说,“他们从来没有真正融为一体。五年前左右,我们确定替代数据有可能充当两者之间的桥梁,因为有了替代数据,您将获得任何基本投资者都将关注的公司洞察力,例如定价,收入增长。但同时,您需要统计建模和计算机科学专业知识(保留定量投资)才能清理数据,可视化并正确解释数据。”

LOIM去年在LOIM撰写的一篇论文中说:“大数据是一件大事”,Hasan写道,随着围绕处理数据的数据和技术类型的发展,我们的投资方法也必须发展。但是,如果数据是汽油,而机器学习是内燃机,则这种新形式的替代数据是原油。

换句话说,为了理解替代数据,资产经理将需要以消除杂质的方式利用技术,以便用于投资组合管理的任何数据集都是可加的,并且不会引入误报或错误信号。

哈桑说:“我们将自己视为下一代基本投资者,在这里我们试图像任何基本投资者一样了解公司动态,但是除此之外,我们还从外部供应商那里寻找数据集。这样一来,我们可以几乎实时地了解公司所发生的事情,并且更加详细。”

为此,Hasan和他的团队建立了一个庞大的数据库,该数据库结合了三种不同类型的数据集:1)公司基本数据(资产负债表,现金流量信息等),2)市场数据(公司的价值如何,投资者定位),以及3)替代数据,以更好地了解需求,收入,成本,利润等的驱动因素。

哈桑说:“只有当您能够使所有这些数据集相互交流后,它们才被清理干净,真正的见解就开始出现。”

他认为,关键在于如何将数据上下文化。

“我认为很多纯量子力学都在这里挣扎;替代数据引发了许多可能的排列,当您回测时,在将它们应用于现实世界之前,它们总是看起来难以置信。

“真正的挑战是确定替代数据集何时真正重要-即使它不一定能很好地进行回测-因为我们知道它适合特定公司的基本模型。

“这是良好的数据来源技能,良好的工程技能以及基础分析的叠加。”

数据过时的挑战

公司如何将不同的数据集整合在一起以创建元集将在某种程度上解决主要挑战之一,即过时。大多数替代数据集的保质期很短。Hasan曾担任过通信设备公司的负责人。一天,他遇到了一个数据集(来自美国分销商),该数据集很好地跟踪了思科在美国的销售情况。一年后,他遇到了另一个数据集,即国际分销商提供的镜像。

“两个数据集都不能很好地发挥作用,它们都有局限性,但是当我能够将它们组合在一起时,它给了我关于该公司全球销售的更全面的信息。

“每个替代数据集都是这样。它可能占公司业务的1%,您正在尝试从更广泛的公司业绩中推断出来。但是,如此小的样本量会带来地理偏见,消费者偏见等。当您可以将不同的数据集组合在一起以克服这些偏见时,就可以产生关于公司绩效的更强有力的信号。” Hasan说道。

正如SEI渴望在其论文中指出的那样,除了隐私问题外,“很明显,在可预见的未来,数据和分析将继续被视为竞争优势的关键来源”。

哈桑总结说,最终,人们将最终决定谁将成功完成数据挑战,谁将失败。

“我们的投资团队中有五位数据工程师和计算机科学家以及三位基础分析师。

“展望未来,我认为我们将看到投资专业人士必须戴上两顶帽子,但这将是一个挑战,因为研究生课程的设计方式并非如此。您可能会发现计算机科学专业的毕业生攻读MBA或CFA,而更传统的金融分析师则学习Python编码。也许我们将在接下来的10到15年中开始融合两种技能的混合学位。”

相关文章

TOP