为了在100多万份合同中找到所需的具体信息,埃森哲转向了自然语言处理和人工智能,并在此过程中推出了一个法律分析中心。
专注于文本文档的组织在简化业务流程方面有了一个新的盟友。自然语言处理(Natural language processing)是专注于人机交流的一个人工智能(AI)分支,它正在帮助埃森哲(Accenture)等公司将基于文本的非结构化信息带入机器学习时代,以便呈现高价值的信息,并削减成本。
埃森哲的记录系统中有100多万份合同,每月还会新增数千份合同。由于繁琐而昂贵的流程限制了详细的跨文档的搜索功能,埃森哲这个约有2,800名专业人士的法律机构已经很难在合同中找到所需的具体信息了。
“如果我们遇到了在全球范围内发生的特定事件,例如,我们在钦奈发生的洪灾,又或者是发生了某些超出我们控制范围的事件,我们多年来一直需要通过手工地方式来做这些事情,以了解我们的客户或我们的合同义务是什么。”这家全球专业服务提供商的运营,企业分析和数字化业务转型全球总经理Mike Maresca说。
因此,该公司的内部IT企业洞察团队开始利用NLP和AI来帮助提高其合同记录系统的可搜索性,“以便当我们需要以某种方式做出响应时,例如,在钦奈洪灾的情况下,我们可以查看我们的合同来了解收入将受到多大的影响。”Maresca说。
埃森哲的法律智能合同探索(ALICE)项目启动时考虑到了两方面的需求。首先,团队需要帮助法律组织在公司的MMR系统中执行超过百万份合同的常规文本搜索。其次,它需要被允许搜索合同条款。
“我们有一群数据科学家,他们建立了分析解决方案的模型,这些解决方案可以对大量合同进行索引,并构建特定的分析算法来提取条款和条件。”Maresca说。
自然语言处理的能力
为了解决这个问题,团队转向了“"word embedding”,这是一种基于语义相似性的NLP方法,可以促进词之间的比较。该模型可以从合同中提取出一个关键字列表及其相关性得分,从而允许子句提取解决方案计算一个相似度得分,该得分将指示文档中每个段落与特定子句类型的相关性,Maresca说。
埃森哲的word- embedded模型将逐段检查合同文档,寻找关键字以确定该段落是否与特定的条款相关。例如,“水灾”、“地震”或“灾害”等词通常会与“不可抗力”一词连用。
“这些分析允许我们搜索关键的术语、条件、特定条款、法律条款,并从英语部分开始。”Maresca说。“我们一直在增强我们的翻译能力。”
执行领导层会通过围绕业务连续性的特定用例来将项目提交给IT部门,法律组织则是解决方案的业务所有者。
Maresca的团队用了六个月的时间,将其从概念性的想法变成了一系列sprint的试点项目。该团队与不同的埃森哲法律用户组测试了该试点项目,并利用测试结果构建了一个最低可行的项目,然后将该项目交给一个解决方案交付团队进行企业规模的全面生产。8个月后,它投入了使用。
启动法律分析
Maresca指出,内部的IT Enterprise Insight Studio、法律组织和IT开发团队之间的强大协作是将项目从原型开发部署到生产的关键。其中,MMR团队中的数据专家是理解元数据结构以及如何将元数据链接到合同文本的关键。法律专家帮助构建了初始条款提取组件。开发团队则包括了数据科学家、UI/UX工程师、软件工程师和功能架构师。
“然后它也被扩展到了其他的有价值的机会上面,比如类似‘如果……会怎样?’的场景,”Maresca说。“我们会问,我们曾经以这样或那样的方式来构建我们的责任限额吗?因此,随着我们对这一功能的持续使用,并在看到附加价值机会时对其进行了扩展和增强,其用例已经大幅增长了。我们也正在寻找从现有数据中获取价值的新方法。”
该公司将ALICE视为了其法律分析能力更广泛的数字化转型的一部分。在这一愿景之下,ALICE将成为各种法律分析服务的核心。