赛思互动出品
CRM免费试用

扫一扫免费试用

Salesforce宣布AI新突破!通过文本总结提高生产力

社区2017-07-26媒体资讯
当今,人们预计会花超过半天的时间阅读电子邮件,文章或社交媒体上的帖子,只会变得更糟。为了帮助解决这个问题,Salesforce的研究人员已经开发出一种算法,根据麻省理工学院技术评估,使用机器学习产生“令人惊讶的一致和准确”的摘要。
 
自动总结对于Salesforce来说将是一个特别有用的技术,它可以生产各种以客户为中心的重点产品。该公司指出,所得到的摘要可以被销售或客户服务代表用来快速消化电子邮件和信息,这将使他们花更多的时间专注于客户。
 
为此,Salesforce正在转向机器学习,以找到方法来总结较长的文本块,最终将其纳入其产品。该公司宣布在自然语言处理方面取得了两项突破,引入了一种新的“情境语言生成模式”,并提出了“新的汇总模型的新方式”。这两个进步一起使研究人员能够自动创建较长文本的摘要准确可读。该公司去年收购了一个深入学习的MetaMind,这是研究的背后。
 
研究人员解释说,自动文本摘要有两种方式:提取或抽象。通过提取,计算机可以从文本中的预先存在的措辞中获取,但并不是非常灵活。抽象允许计算机引入新词,但系统必须了解原文足以能够引入正确的单词。
 
这就是深度学习神经网络发挥作用的地方。他们处理许多句子和单词的例子,以吐出每个短语的新表示,这使得系统能够解读文本并引入自己的单词。研究人员让他们的模型回顾了它正在为更多的上下文而工作的文本。它还回顾了早期生成的示例,以确保它不会重复。
 
另一个突破就是研究人员如何训练系统来学习和改进自身。他们使用两种方法:教师强迫和强化学习。加强学习是一种从动物学习中吸取灵感的方法,并被用来教Google的DeepMind如何玩视频游戏。在这种情况下,允许模型生成单词序列,然后用自动评估指标(称为ROUGE(用于评估评估的回调面向下研究))对结果进行评分。该算法以较高的分数更新自身,从而为将来的摘要带来更好的结果。老师的强迫是当结果以一个既定参考的词语得分时,这提供了“非常体面的结果”,但这不能允许很大的灵活性。
 
研究人员发现,“ROUGE优化的RL有助于提高召回率,而词级学习监督可确保良好的语言流程,从而使总结更加一致和可读。”对这个系统进行评分,他们发现他们的联合模式得分高于其他方法,而Salesforce的首席科学家理查德·苏格赫(Richard Socher)指出,他并没有认为他曾经看过“任何[自然语言处理]任务都有如此巨大的进步。”
 
结果非常惊人:研究人员提供了几个例子,显示了原始文章,人造总结以及由他们自己的模型生成的摘要,并且在每种情况下,总结比原始文本短得多,但包含必需品以可读形式。尽管取得了进展,但在这一领域仍有相当多的工作要做:麻省理工学院技术评论与西北大学教授克里斯蒂安·哈蒙德(Kristian Hammond)进行了交流,他指出,提前“显示纯粹依赖统计机器学习的局限性”,但它是在正确方向迈出的一步。
 
文章关键词
Salesforce