业界最有名的应用莫过于Excel的FlashFill功能。程序合成(Program synthesis)一直是学术界热门的研究方向,但它在业界的应用却不像意图识别那样普遍。这一方面是由于程序合成比较复杂,另一方面也由于它的标注和解析方面有额外的困难。
业界最有名的应用莫过于Excel的FlashFill功能。程序合成(Program synthesis)一直是学术界热门的研究方向,但它在业界的应用却不像意图识别那样普遍。这一方面是由于程序合成比较复杂,另一方面也由于它的标注和解析方面有额外的困难。在深入探究这些困难前,让我们先通过一个具体的例子来理解程序合成:
程序合成的优势:它善于对碎片化的函数和API进行组合,完成任意复杂的操作,从而大大提升了语义理解能力的上限。面对长尾需求,开发者不需编写新代码,只需有针对性地收集数据,训练语义理解模型,使它能合成出正确的程序即可。
既然程序合成法如此优越,为什么业界仍然普遍采用意图识别和槽填充的方法?别急,任何事情有得必有失。程序合成法在表示能力方面向前走了一大步,但也带来了其他的问题。下面我们就看一看它的难点。
在过去的几十年中,诞生了很多具备普适性、易用性、可扩展性的编程语言,它们的使用者都是人类。对话系统的语言多了两种使用者:标注人员和语义解析模型。因此它必须在以上特性的基础上兼顾易标注、易合成的优点。这一节,我们探讨如何通过对机器语言本身的改进,克服程序合成的局限性。
和任何其他编程语言一样,对话系统的语言必须支持基本的数据类型,如字符串、数字、数组、字典,以及对它们的基本操作,如加减乘除、对数组和字典的增删查改等。我们把这些内容叫做标准库。在标准库之外,开发者可以自由添加新的数据类型、函数和API。紧
延伸阅读:
什么是Python?
Python由荷兰数学和计算机科学研究学会的吉多·范罗苏姆于1990年代初设计,作为一门叫做ABC语言的替代品。Python提供了高效的高级数据结构,还能简单有效地面向对象编程。Python语法和动态类型,以及解释型语言的本质,使它成为多数平台上写脚本和快速开发应用的编程语言,随着版本的不断更新和语言新功能的添加,逐渐被用于独立的、大型项目的开发。
Python解释器易于扩展,可以使用C语言或C++(或者其他可以通过C调用的语言)扩展新的功能和数据类型。Python也可用于可定制化软件中的扩展程序语言。Python丰富的标准库,提供了适用于各个主要系统平台的源码或机器码。
文章标题:现在Program Synthesis业界都在做什么,发布者:小编,转载请注明出处:https://worktile.com/kb/p/40928