如今自然语言技术越来越多地在企业中得到应用。很多公司推出了大量文本分析解决方案、语音识别系统、聊天机器人以及所有可以令人想象的语言处理用例。
在过去的三年中,自然语言处理(NLP)已经成为数据科学中最主要的领域之一。而自然语言处理(NLP)是自然语言理解(NLU)、自然语言生成(NLG)和自然语言交互(NLI)等子领域的总称。
随着谷歌和微软等科技公司的不断发展和创新,自然语言处理(NLP)在准确性、速度和方法方面取得了飞跃性发展,可以帮助计算机科学家解决更复杂的问题。自然语言处理(NLP)如今成为人工智能领域进行研究最多的领域之一。
人工智能开发商Paperspace公司联合创始人兼首席执行官Dillon Erb对五个重要的自然语言处理发展趋势进行了分析和阐述,这些趋势将在2021年影响企业的发展,并有助于区分合理发展和过度夸大的宣传。
趋势1:真正的自然语言处理(NLP)还有很长的路要走
人类的语言很复杂,因为语言代表着人类的思想。这使自然语言理解(NLU)成为所谓的“难以解决的人工智能”问题之一,这是因为自然语言理解(NLU)面临的问题就是广义人工智能的问题。
但是作为人工智能的子主题,自然语言理解(NLU)得到了更多关注,因为其应用前景令人兴奋,并且很多自然语言理解(NLU)解决方案在其应用中显示出了真正的价值。
因此,尽管自然语言理解(NLU)技术尚不成熟,但自然语言理解(NLU)的普及程度已经在企业的应用中得到证明。
自然语言理解(NLU)用于对客户实施情感分析,并理解对Siri和Alexa等数字助理提出的问题。它还可以通过神经机器翻译服务(例如谷歌翻译)进行多语种的文本翻译。
人们需要知道的是,在全面的广义人工智能出现之前,自然语言处理(NLP)需要不断发展,因此还有很长的路要走。
趋势2:模型正在迅速改进,企业需要为此做好准备
可以说,当今最著名的人工智能模型是OpenAI的GPT。其最新版本的GPT-3已于今年早些时候发布。
就GPT的进展而言,GPT-2在2019年2月推出并带来了重大影响,这是由于它接受了15亿个参数的训练。GPT-3在18个月之后推出,并接受了1750亿个参数的预训练,其训练量得到两个数量级的时长。GPT的推出立即引起了全球媒体的关注,因为这意味着将会产生虚假新闻、生成艺术、编写代码库等等。
诸如GPT之类的语言模型的发展正在激励企业开发机器智能的许多方法和应用程序,这些应用程序从能够用语言描述网络应用程序到模仿公众人物的语言模式,再到通过医学文献进行训练以提供诊断。
趋势3:狭义用例获得成功
根据调查,全球有数十万人从事GPU计算、机器学习和深度学习的工作,尤其是在企业层面。而重要的一件事是,为了取得成功并推动业务价值,人工智能项目的范围可能很窄。
像OpenAI的GPT-3这样的人工智能项目之所以引起广泛关注,是因为这些技术为人们的未来发展提供了令人鼓舞的愿景。但是,当今推动真正价值的企业项目和部署范围很狭窄,并且可以带来具体的业务价值。
例如,当Adobe Photoshop提供了从背景中自动选择图像主题的功能时,这是计算机视觉的一种狭义用途,可以为最终用户提供真正的价值。Photoshop用户无需花费数小时就可以每个像素的精度剔除背景。这是狭义应用获得成功的一个示例。
趋势4:机器学习模型需要维护
与传统软件不同,应用在生产中的机器学习模型需要维护,因为它们会随着时间的推移而降低性能。这一事实与生产机器学习模型(模型由代码、数据、计算和性能指标组成)的复杂组合相结合,导致了持续集成(CI)/持续交付(CD)和MLOps工具以及基础设施虚拟化产品的快速发展。
有关自然语言理解(NLU)或自然语言处理(NLP)最令人兴奋的事情之一就是可以随着时间的推移改进模型。在许多应用中,模型的精确度只要提高几个百分点,就可以为企业基础业务带来数百万美元的价值。其具体示例包括推荐引擎、金融建模应用程序等应用程序。
因此,重要的是要有一个可预测的部署系统,以随着时间的推移继续交付价值。
趋势5:将机器学习视为一种软件学科
企业准备从机器学习提升业务价值的最有价值的方法之一就是将机器学习确立为一种软件学科。由于绝大多数机器学习项目在开发人员或数据科学家的笔记本电脑上运行的研究实验过程中陷入困境,因此确定帮助企业将模型部署到生产和交付价值的系统的优先级是很重要的。
将机器学习视为一种软件学科意味着拥有已经建立的管道,可以将项目从研究转到生产。这意味着机器学习与其余软件堆栈可以得到更多的关注和资源,还意味着代码、数据和机器学习模型本身将会进行版本控制。简化基础设施配置也很重要,这样企业可以大规模部署机器学习模型。
最终目标是使人工智能成为企业的业务驱动力。在机器学习领域,适当的流程很重要,这样就可以尽快创造价值。随着时间的推移,更加有利可图的模型将获得更多利润,因此现在是开始采用的时候了。