Augmented Large Language Models with Parametric Knowledge Guiding

2023-09-11 17:24:09

本文是LLM系列文章,针对《Augmented Large Language Models with Parametric Knowledge Guiding》的翻译。

参数知识引导下的增强大型语言模型

摘要

大型语言模型(LLM)凭借其令人印象深刻的语言理解和生成能力,显著提高了自然语言处理(NLP)。然而,由于对相关数据的了解有限,对于需要专业知识的特定领域任务,它们的性能可能不太理想。此外,大多数最先进的LLM(只能通过API访问)缺乏透明度,阻碍了对域自定义数据的进一步微调。此外,向LLM所有者提供私人数据会导致数据隐私问题。为了应对这些挑战,我们提出了一种新的参数化知识引导(PKG)框架,该框架为LLM配备了一个知识引导模块,以便在不改变LLM参数的情况下访问相关知识。我们的PKG基于开源的“白盒”语言模型,允许LLM所需的任何知识的离线存储。我们证明,我们的PKG框架可以提高“黑匣子”LLM在一系列领域知识密集型任务中的性能,这些任务需要事实(+7.9%)、表格(+111.9%)、医学(+3.0%)和多模态(+8.1%)知识。

1 引言

2 相关工作

3 LLM的参数化知识引导

4 实验

5 结论

在这项工作中,我们提出了一种新的参数化知识引导(PKG)框架,通过为“黑匣子”LLM配备知识引导模块来提高它们在特定领域任务中的性能。我们的方法允许在运行时访问相关知识,而无需更改LLM的参数。实验证明了我们的PKG框架对各种领域知识密集型任务的有效性。
限制和未来工作。尽管我们的PKG在所提供的数据集上表现出了强大的性能,但它们仍然可能存在幻觉错误,导致提供不正确的背景知识。我们在附录E中提供了此类错误的例子。将我们的方法与检索方法相结合,以提高生成忠实度是未来研究的一个有希望的方向。

更多推荐

MFC-GetAdaptersAddresses获取网卡信息

需要:#pragmacomment(lib,"IPHLPAPI.lib")GetAdaptersAddresses函数参数说明ULONGbufferSize=0;ULONGresult=::GetAdaptersAddresses(AF_UNSPEC,GAA_FLAG_INCLUDE_PREFIX,nullptr,nu

以php为后端,vue为前端的租房微信小程序

租房微信小程序是一个非常有用的应用,它不仅可以帮助人们快速找到心仪的房屋,还可以提供便捷的房屋租赁服务。本文将介绍如何使用PHP作为后端语言和Vue作为前端框架来开发一个租房微信小程序。环境搭建首先,需要在本地或云上安装并配置PHP和Vue环境。可以使用XAMPP、WAMP、MAMP等集成的开发环境,也可以手动安装和配

stm32学习笔记:GPIO输入

1、寄存器输入输出函数//读取输入数据寄存器某一个端口的输入值,参数用来指定某一个端口,返回值是uint8_t类型,用来代表高低电平(读取按键的值)uint8_tGPIO_ReadInputDataBit(GPIO_TypeDef*GPIOx,uint16_tGPIO_Pin);//读取整个输入数据寄存器,参数用来指定

在使用SpringBoot时遇到的异常总结(持续更新...)

文章目录异常MyBatisjava.sql.SQLIntegrityConstraintViolationException:Cannotaddorupdateachildrow:aforeignkeyconstraintfailsMybatis-Plus查询语句无故自动加条件参考文献因为平时在写SpringBoot项

Centos7安装mysql详细过程

官网https://dev.mysql.com/downloads/repo/yum/1、下载安装包cd/optwgethttp://dev.mysql.com/get/mysql57-community-release-el7-11.noarch.rpm2、安装MYSQL源yum-yinstallmysql57-co

若依DataScopeAspect数据权限解析和ew.customSqlSegment源码解析

目录一、DataScopeAspect使用场景二、ew.customSqlSegment${ew.customSqlSegment}build:this.normal:queryWrapperwhere条件不为空的时候,才有normalget第二次进来add(),已经拼接完ew.customSqlSegment了,因为

人工智能术语翻译(四)

文章目录摘要MNOP摘要人工智能术语翻译第四部分,包括M、N、O、P开头的词汇!M英文术语中文翻译常用缩写备注MachineLearningModel机器学习模型MachineLearning机器学习ML机器学习MachineTranslation机器翻译MTMacroAverage宏平均Macro-F1宏F1Macr

FFmpeg入门及编译

文章目录前言一、FFmpeg简介二、基本组成1、封装模块-AVFormat2、编解码模块-AVCodec3、滤镜模块-AVFilter4、视频图像转换计算模块-swscale5、音频转换计算模块-swresample6、AVUtil-核心工具库7、AVDevice-硬件采集,加速,显示三、命令行工具四、FFmpeg环境

jvm深入研究文档--java中的堆--详解!--jvm底层探索(1)

阿丹:JVM的内存分区包括以下几个部分:堆区(Heap)-这是JVM的主要部分,用于存储实例对象和大多数Java对象,如数组和用户定义的类。方法区(MethodArea)-这是线程私有的,用于存放类对象(加载好的类)。栈区(Stack)-这是线程私有的,包括虚拟机栈和本地方法栈。虚拟机栈用于保存调用关系的内存空间,而本

Linux学习之Redis使用

搭建Redis服务器在主机redis64运行redis服务#安装redis服务[root@redis64~]#yuminstall-yredis#启动redis服务并开机启动[root@redis64~]#systemctlenableredis--now#查看redis端口[root@redis64~]#ss-tnl

redis 常用数据结构2

目录listLPUSHLRANGELPUSHXRPUSHRPUSHXLPOPRPOPLINDEXLINSERTLLENLREMLTRIMLSETBLPOP/BRPOP编码方式setSADDSMEMBERSSISMEMBERSPOPSCARDSRANDMEMBERSMOVESREMSINTERSINTERSTORESUN

热文推荐