从情绪分析中发掘加密货币的价值

深度学习通过扫描与评估网上的评论(包括新闻标题、Twitter 和 Reddit 帖子),提供了分析加密货币情绪的方法。

“据我的了解,情绪和加密货币价格有关。这一发现可能对其他开发人员有帮助:他们可以探索新的行业并发现如何使用目前的人工智能技术在新的领域内创建解决方案或洞察。”

—英特尔公司人工智能校园大使计划 Teju Tadi

挑战

确定加密货币的估值很困难,因为其价值不同于传统股市那样与现金流、可用资产等因素紧密相关。由于目前市场上流通的加密货币有数十种,需要一个系统来全面评估它们的价值。

解决方案

包括递归神经张量网络 (RNTN) 在内的新兴神经网络模型利用有前景的机制,通过扫描与解析社交媒体中的评论来确定公众对特定货币的感受。结果显示,某种货币引发的良好情绪与数字货币交易中货币价值的上涨有关。

背景和项目历史

Teju Tadi 是一名对区块链和加密货币有浓厚兴趣的英特尔人工智能校园大使,他在 2017 年 5 月发起了一个项目,旨在利用深度学习技术来研究交易者对加密货币的情绪及其市场价值之间的相关性。用于帮助预测交易趋势的情绪分析已在传统股市中收获了一批支持者。由于加密货币的估值数据更加模糊,Teju 正对技术进行优化,力求将交易者情绪与其他因素相结合,以创建预测趋势的更好方法。

他表示:“许多上市公司都采用多项技术,基于社交媒体数据和新闻标题制定关键投资决策。许多算法可以在正面消息发布后,立即执行购买的决定,它们的速度非人力所能及。我认为可以将这一技术用于加密货币,因为许多加密货币属于情绪驱动型。社交媒体和新闻对各种货币价格产生很大影响,这是不可避免的。”

Teju 表示:“早在高中时期,我就被区块链技术和加密货币所吸引。当时仅有不到 100 种加密货币,该行业正处于发展初期。以太坊区块链协议发布后,市场开始蓬勃发展。以太坊和其他平台令牌支持开发人员更快速地部署面向区块链协议的软件。截至今天,共有 1600 多种加密货币和区块链协议,还有许多项目正在启动。”

Teju 毕业后开始从事各种项目,他对机器学习和深度学习的兴趣也越来越大。采用机器学习策略的 ProvidR* 项目在谷歌* 社区领袖计划 (CLP) 案例比赛中夺得桂冠。ProvidR 提供了可扩展的食品安全解决方案,汇总了光顾食品银行的人士的要求。然后,他与英特尔、Face It* 合作开展了一个项目,利用深度学习技术来绘制人的面部结构,并推荐适合他们外形的发型。他的早期工作为目前的项目 - 面向加密货币交易的深度学习提供了契机,该项目用到了他在金融、区块链架构、加密货币和人工智能领域的专业知识。

Teju Tadi presenting his project
图 1.Teju Tadi 在 2018 年旧金山英特尔® AI DevCon(英特尔® AIDC)大会上展示他的项目。

Teju 表示:“参加英特尔人工智能校园大使计划为我提供了许多机会。我有幸结识了世界各地的人工智能同行与英特尔工程师,他们非常热心地为我提供项目上的帮助。英特尔还允许我访问硬件,这些硬件能帮助我测试与部署我正在开发的任何应用。最重要的是,它为我提供了一个绝佳的环境,支持我做感兴趣的事,创建与人工智能有关的项目。”

观看 Teju 介绍自己项目.

加密货币与区块链的演变

加密货币是数字资产交易的媒介;使用区块链技术对该媒介内的交易进行记录,该技术通过加密的数字账本永久保存所有活动的历史。由于加密货币的供应量有限,投资者预计长期需求的增长将增加货币的价值。区块链历史条目(在连续链内逻辑互联)的防篡改性提供了安全授权与记录双方加密货币交易的机制。

尽管区块链已成为传统金融流程的安全数字替代方案,支持分布式数据库功能的底层区块链架构也为其他应用提供了许多机遇。企业正探索将区块链集成至物联网 (IoT) 解决方案的方法,以管理并深入了解供应链活动和全球运营。医疗信息系统也可以使用区块链架构来发布医疗设备信息,整合并发布个人健康档案。

“由于区块链基于分布式对等拓扑,数据可存储在全球数千台服务器上,而且任何网络用户均可以实时看到其他人的记录,因此,单个实体基本不可能控制网络或钻空子。”1

—《计算机世界》高级记者 Lucas Mearian

商机

英特尔® 开发人员专区的一篇文章中,Teju 表示:“该项目的长期愿景是开发一款人工智能加密货币交易机器人,它不仅能将交易者情绪作为交易决策的考虑因素,还能利用套利等其他优势,套利指的是购买与销售资产,以获取差价收益。”

帮助创建 Mycointrac*(一家专门提供加密货币市场情报的公司)的过程中,Teju 从自己的研究中获得了一些洞察。他表示:“产品完全开发后,我打算利用它提供的数据为 Sentience Investments L.P. 制定关键投资决策,Sentience Investments 是我新创立的加密货币对冲基金,于 1 月 1 日开始运营。我的计划是开发基于多项高频机器学习技术和深度学习与情绪分析的交易策略。”

Teju 解释道,每次个人交易均有各自的供应与需求,以及买家与卖家。从目前的情况来看,市场效率极低。特定市场中的加密货币可能值 3 美元,在另一个市场中,相同的货币可能值 5 美元。交易者利用估值的差别通过套利牟利 - 在某个交易所以 3 美元的价格买入,在另一个交易所以 5 美元的价格售出,零风险地获益 2 美元。

Teju 表示:“在 Mycointrac 中,点击市场中的某种货币并向下滚动,您将看到差别价格与指数。这基本上就是套利。它展示了某个交易所内的价格波动情况。有时大约波动几个百分点,有时是 50% 或 100%,多数货币的波动范围通常是 5% 到 10%”。图 2 展示了 Mycointrac 中的实时情绪跟踪。Teju 通过与团队合作,从该项目中获得了洞察,并发布了新网站Mycoinrisk,专注于加密货币领域欺诈防范和风险规避。

Live sentiment mapping cryptocurrency on MyCointrac
图 2.Mycointrac 上的实时情绪映射预测网上的加密货币变化。

“随着机器学习与人工智能 (AI) 的发展,应用将不断增长,并影响会计和金融责任,人类专业人员也面临许多机遇。它们不仅更高效、更熟练,还能处理更多客户端,发挥更大的价值,因为它们可以确定可行洞察,而不是只处理数字。机器将推动行业创新。”2

—作家兼业务与技术主讲人 Bernard Marr

和所有人工智能项目一样,使用迭代训练对模型进行不断修改,以改善结果,提高输出准确性。Teju 探索了几种神经网络模型,最后确定 RNTN 是执行社交媒体信息和新闻自然语言处理的最高效的方式。

Teju 表示:“多种加密货币的价格变动由羊群心理决定。根据行为金融学,羊群心理指的是一种缺乏个人决策的心理,导致人们的想法和行为与周围大众趋同。价格变动一般基于市场情绪和社区对加密货币的意见。鉴于以上原因,我相信新闻标题、Reddit 和 Twitter* 帖子的情绪分析应是反映加密货币价格变动方向的最佳风向标。”

Teju 发现,递归神经网络 (RNN) 是一项执行情绪分析的卓越技术。RNN 解析文本字符串,对单词进行令牌华,确定单词的使用频率,并创建名为 bag-of-words 的模型。该模型常用于文档分类,使用词频来训练分类器。从词典中搜索出每个单词的主观性,在该词典中,研究人员预先记录了情感价值。根据该数据评估整体情绪。

Teju 表示:“RNN 擅长处理较长的文本,但是在分析新闻标题、Reddit 和 Twitter 帖子等短文本引发的情绪时表现不佳。RNN 无法考虑组合性(字符串中单词的顺序),从而无法考虑所有语言学语义。因此,RNN 在确定情绪变化和理解否定范围方面表现不佳。”

递归神经张量网络

考虑使用替代方案后,Teju 认定 RNTN 是最适合项目的选择,因为它能评估文本的语义组合性。对于较短的文本,如推文,组合性对于准确确定稀疏信息集的情绪至关重要。

Teju 表示:“RNTN 擅长考虑句法顺序。RNTN 由多个部分构成,包括称作根的父组、称作叶的子组和分数。叶组接收输入,根组利用分类器来确定类别和分数。”

递归神经张量网络 (RNTN) 是面向自然语言处理的神经网络。它们的每个节点都包含神经网络和树结构。您可以使用递归神经张量网络进行边界分割,以确定哪些词组是贬义,哪些词组是褒义。您也可以用它分析整个句子。

词矢量被用作特性和顺序分类的基础。然后,将它们划分为子短语,并将子短语整合为可按照情绪和其他指标分类的句子。

—摘录于 《递归神经张量网络》, Deeplearning4J

情绪分析器获取的数据被解析为二进制树。特定矢量由所有单词构成,表示为叶。从下到上,这些矢量成为优化参数,用作 softmax 分类器*的特性输入。将矢量划分为 5 类,并为其分配一个分数。

Teju 表示:“下一步就是递归发生的地方。”在两个单词之间编码相似性时,两个矢量被转移至下一个根。输出一个分数和类别。分数表示解析的积极性和消极性,类别解码当前解析的结构。第一个叶组接收解析,然后第二个叶组接收下一个单词。输出 3 个单词的解析分数,然后将其迁移至下一个根组。”

“递归流程将持续到所有输入用完之时,包括每个单词。在实际应用中,RNTN 比它更复杂。RNTN 尝试后面的所有单词,最终检查表示整个子解析的矢量,而不是将句中后面邻近的单词用于下一个叶组。通过在递归流程的每一步执行该操作,RNTN 可分析句法解析所有可能的分数。”

图 3 显示了使用 RNTN 方法对句子进行解析与分析的示例。

如欲详细了解 Teju 在该项目中使用的技术,请参阅英特尔® 开发人员专区的 《面向加密货币交易的深度学习》一文。

Example of scoring from the Stanford Treebank
图 3.斯坦福树库评分示例。

支持技术

Teju 对英特尔® 技术为项目提供的优势予以肯定。他表示:“我的解决方案利用英特尔® AI DevCloud、英特尔® Python* 分发版和英特尔® 优化型 Caffe*。”

英特尔 AI DevCloud 在项目初期用作开发平台。“项目初期,根据沙盒版本,我使用了 AI DevCloud 来运行递归神经网络,并试验 Twitter 数据,以了解模型的工作原理。在与英特尔协作的第一个项目和当前项目中,我们完全采用了英特尔 AI DevCloud 及其支持技术。”

英特尔 AI DevCloud 是一款搭载英特尔® 至强® 可扩展处理器的处理器集群,面向英特尔® 人工智能研究院成员免费开放,它的预加载框架和工具支持快速启动机器学习与深度学习项目。预安装组件包括 neon™ 框架、英特尔® Theano* 优化包、面向 TensorFlow* 的英特尔® 优化、英特尔® 优化型 Caffe* 和 Keras* 库。一旦审批通过,通过 Linux® 终端或图形用户界面客户端(如 PuTTY*)设置连接仅需 10 分钟左右。同时支持通过 Microsoft Windows* 访问。此时,您可以开始训练模型或运行 Python 代码了。有关该流程的全面介绍,请参阅《英特尔 AI DevCloud 入门》. 。对于新手,深度学习可能具有一定的挑战性,但幸运的是,可以通过多种资源来了解模型并开始训练。

在项目开发过程中,连接库、代码和示例也非常重要。Teju 表示:"英特尔® 开发人员专区 提供了宝贵资源,帮助我学习如何利用英特尔技术更好地构建我的项目。人工智能领域的同行们也构建了许多项目,这为我提供了动力,使我更深入地了解在各个行业与用例中使用人工智能与机器学习的多种方法。”

“建议您参阅斯坦福情绪树库以了解关于递归神经张量网络的更多信息。此外,建议您访问英特尔开发人员专区,您将从中获取库、教程、技术文章和大量数字内容。”

面向人工智能初学者的其他宝贵资源包括:

视频:什么是英特尔® 优化 Caffe*

文章:《利用面向英特尔® 架构优化的 Caffe* 管理深度学习网络》

文章:《英特尔® Python* 分发包入门》

人工智能为金融领域提供了新机会

通过专用芯片的设计和开发、研究资助、教育推广与行业合作等,英特尔坚定致力于推动人工智能 (AI) 的发展,帮助化解医学、制造、农业、科学研究和其他行业的挑战。英特尔与政府机构、非政府机构、教育机构和公司紧密合作,探索和完善可应对重大科学挑战的解决方案。

例如,即使对于经验丰富的投资者,在股市投资中一直获取高收益也是非常困难的。借助人工智能技术,一个国际团队设计出使用过去的市场数据模拟实时投资的算法,以应对该挑战。这些技术获得了 73% 的投资回报率,在真实的市场场景中,投资回报率通常为 9%。该算法对极端市场波动特别有效,这表明人工智能可检测与响应人类投资经理无法识别的模式。该研究的首席作者为德国 Friedrich-Alexander- Universität Erlangen-Nürnberg 商业与经济学院统计与计量经济学教授 Christopher Kraus 博士。4

“人工智能在经济领域发挥的作用可能没有在好莱坞中耀眼,但是相比消费类技术,它将带来更大的经济影响。从为无法享受银行服务的用户带来投资机会,到打击欺诈与消除投资风险,人工智能不仅能革新行业,还能改善美国与全球数百万人的财务状况。”5

—KCD PR 总裁 Kevin Dinino

本实施使用的英特尔人工智能技术包括:

Intel Xeon logo

英特尔® 至强® 可扩展处理器:借助针对深度学习等广泛人工智能工作负载优化的计算架构,化解人工智能挑战。

Framework Optimization

框架优化:在强大的可扩展基础设施上更快速训练深度神经网络。

Intel AI DevCloud logo

对于英特尔® 人工智能研究院会员,英特尔® AI DevCloud 提供了一个面向机器学习和深度学习训练的云平台和框架。英特尔 AI DevCloud 采用英特尔至强可扩展处理器,提供长达 30 天的免费远程访问,以支持研究院成员的项目。

立即加入:software.intel.com/ai/sign-up

如欲全面了解人工智能产品组合,请访问 ai.intel.com/technology.

Naveen Rao

“人工智能的积极影响使英特尔员工倍受鼓舞,丰富的开发人员社区为我们提供了动力。人工智能用于实时绘制脑图, 发现古代遗失的城市, 确定探索月球的资源, 帮助保护地球上的海洋, and 打击每年造成全球数十亿美元损失的  欺诈, 等项目。由于该社区在各个垂直市场、用例和地区提供了改变世界的人工智能技术,支持该社区是我们的责任。”6

—英特尔人工智能产品事业部副总裁兼总经理 Naveen Rao

 

资源

英特尔® 人工智能研究院

人工智能:英特尔人工智能打造新一代计算能力

用于加密货币交易的深度学习。 详细介绍了评估加密货币交易的情绪分析

情绪树库上面向情绪组合性的递归深度模型 (PDF)

英特尔® AI DevCloud。英特尔人工智能研究院成员可免费获得的云计算资源

英特尔® 开发人员专区. 为开发人员提供库、教程、技术文章和数字内容

英特尔® 软件创新者计划. 支持创新的独立开发人员

英特尔®优化型 Caffe*

英特尔® 数学核心函数库(英特尔® MLK)

参考资料

1. Mearian, Lucas. 《什么是区块链?数十年最具颠覆性的技术》.《计算机世界》,2018 年 5 月。

2. Marr, Bernard. 《会计与财务的数字转型 - 人工智能、机器人和聊天机器人》, 《福布斯》,2018 年 6 月。

3. Barsolai, Chris. 《面向英特尔人工智能资源与工具的完整开发人员指南》,《Medium》. 2017 年 10 月。

4. Walters, Greg. 《股市研究显示,人工智能能帮助投资者获取巨额回报》. 《Seeker》,2017 年 3 月。

5. Dinino, Kevin. 《人工智能颠覆金融服务的 5 种方式》.《FinTech Futures》,2018 年 4 月。

6. Rao, Naveen. 《帮助开发人员实现人工智能》. 英特尔,2018 年 5 月 16 日。

有关编译器优化的更完整信息,请参阅优化通知