站长之家用户 - 传媒 2024-10-14 11:34

卓世科技提示词压缩专利技术揭秘

提示工程是一种在机器学习模型，尤其是预训练语言模型中，通过精心设计输入提示（prompt）来引导模型输出期望结果的技术。在大语言模型的使用中，提示词通常是一段文本，用来引导模型生成特定的输出或完成特定的任务。

在多文档搜索、问答系统、文档自动摘要生成以及阅读理解等多样化且复杂的应用场景中，往往会面临输入提示（prompt）长度显著增加的挑战。这种超长prompt不仅加大了大型语言模型（LLM）的推理成本，还显著延长了推理时间，从而严重限制了其在需要即时响应的实时应用场景中的适用性。为了克服这一难题，优化prompt设计，如通过压缩技术精简关键信息、采用更有效的prompt格式或结构，变得尤为关键。这样的策略旨在平衡模型性能与实时性需求，确保LLM能够在复杂多变的场景下依然保持有效、准确的响应能力。

基于以上背景，卓世科技创新的中文提示词压缩技术应运而生。

卓世科技对提示词进行压缩的技术旨在保证推理效果的前提下降低推理成本，提升推理速度。其主要的思路如下：

（1）定义长prompt的结构：

Prompt=instruction+documents/demonstrations+question。

（2）小语言模型和大语言模型的分布对齐

使用小语言模型（small LLM）估计长prompt的各个部分的重要程度，为了缩小大语言模型（LLM）和小语言模型之间的概率分布差距，通过在LLM生成的数据上进行指令微调来有效小语言模型，使得小语言模型更好地模拟LLM的分布。

（3）对documents/demonstrations部分进行两个层次的压缩。

3.1、示例层次的压缩

documents/demonstrations部分中通常包含多个文档/示例，而每个文档/示例包含有多个段落。针对每个文档/示例的每个段落，计算出段落与question的相关性，保留得分前 3 的段落作为该文档/示例的代表上下文x_doc。同时，可计算出该文档/示例中所有段落的平均相关性s_k。

然后根据question部分和文档/示例的代表上下文x_doc计算文档/示例级别的困惑度r_k。最终文档/示例的评分为s1=s_k*r_k。

此时，每个文档/示例计算出三个分数，评分s1、平均相关性s_k以及困惑度r_k。利用这三个分数从长prompt的documents/demonstrations部分中删除部分文档/示例。

3. 2 重排序

由于模型对prompt的不同位置处的信息的敏感度不同，通常模型对prompt首尾位置处的信息敏感度较好，中间位置的敏感度较差。为了确保prompt的效果，可依据评分对保留的文档进行重排序处理，使得评分较高的文档排列在首位，评分较低排列在中间位置。

3. 3 文档/示例压缩率计算

针对重排序后的prompt，用户可自定义在词语层次上的压缩率。按照上述文档/示例的排序，使用[1， 2*Kc]的均匀离散分布，来初始化每个文档/示例的压缩率。

3. 4 词语层次的压缩

在删减文档/示例后的documents/demonstrations部分，可计算每个token的条件困惑度差异。

为了确保压缩后的语义完整，可使用双向比较大匹配分词法，以获取到最长的分词词语。同时，为了适应垂直领域，可结合垂直领域内的专业词汇表进行分词，尽量保留垂直领域内的专业词汇。

然后可基于前述计算出的token的条件困惑度差异以及分词的结果，对每个词语进行打分。假设一个中文词语word_i有k个token组成，按照该中文词语word_i是否属于垂直领域的词汇，使用不同的计算方式对其评分。

最后针对每个文档/示例，利用文档/示例中每个词汇的评分，按照得分高低顺序压缩文档/示例，使得其满足文档/示例的压缩率。

（4）压缩后的prompt可输入至大语言模型中，得到响应。

至此，整个提示词压缩的方案介绍完毕，该技术方案相比于其他压缩方案，更加适配中文的词语粒度，尤其在垂直领域可避免丢失专业词汇，在保证语义完整的情况下删减了冗余信息，可有效降低提升推理效率，节约计算成本。

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴U盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙CPU排名高通骁龙888排名领先
35420次阅读

查看更多内容

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

卓世科技提示词压缩专利技术揭秘

推荐关键词

24小时热搜

大家正在看

亚马逊联合英伟达举办AI路演大赛，AI新星PromptBio入围6强

OpenAI世界最贵大模型上热搜：每月200美元 ChatGPT Pro拥有无限使用权

AI日报：王炸！Anthropic开源模型上下文协议MCP；阿里通义App上线局部风格化功能； Kimi 数学版上线

微软发布Phi-4，最强小模型！参数极小、超GPT-4o

ChatGPT终于也推出Projects功能，却故意露出一个“AGI”的项目

mpv排行榜前十名上汽大通maxus G10 MAX脱颖而出，成MPV市场焦点

全球最贵iPhone16ProMax登场：起价219万 18K纯金皇冠背壳

ChatGPT两周年，国产o1大模型们紧追不舍

米家立式学习灯Pro发布打造舒适智能学习照明体验

OpenAI正式推出AI视频生成模型Sora：ChatGPT订阅用户免费用

OpenAI发布强化微调API，能深度定制超复杂大模型了

谷歌“狙击”OpenAI，发布新一代大模型，主打Agent+多模态

Andrej Karpathy：神奇大模型不存在的，只是对人类标注的拙劣模仿

7座MPV哪个好？上汽大通MAXUS G50 PLUS以实力说话

AI日报：OpenAI全量上线视频聊天功能；Anthropic最快模型Claude 3.5 Haiku全面开放；巨人网络推游戏大模型千影 QianYing

AI日报：阶跃星辰内测视频大模型Step-Video；即梦AI图片2.1模型支持生成文字；腾讯发布混元视频生成大模型

成本暴降60% OpenAI宣布开放满血o1模型API

游戏与硬件的碰撞 AMD&微星B站头号玩家A计划启动

重磅！OpenAI开放满血o1模型API，成本暴降60%

比5.5G还快！华为Mate 70 Pro+网速实测：比Mate 60 Pro快一倍

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

卓世科技提示词压缩专利技术揭秘

推荐关键词

24小时热搜

大家正在看

亚马逊联合英伟达举办AI路演大赛，AI新星PromptBio入围6强

OpenAI世界最贵大模型上热搜：每月200美元 ChatGPT Pro拥有无限使用权

AI日报：王炸！Anthropic开源模型上下文协议MCP；阿里​通义App上线局部风格化功能； Kimi 数学版上线

微软发布Phi-4，最强小模型！参数极小、超GPT-4o

ChatGPT终于也推出Projects功能，却故意露出一个“AGI”的项目

mpv排行榜前十名上汽大通maxus G10 MAX脱颖而出，成MPV市场焦点

全球最贵iPhone16ProMax登场：起价219万 18K纯金皇冠背壳

ChatGPT两周年，国产o1大模型们紧追不舍

米家立式学习灯Pro发布 打造舒适智能学习照明体验

OpenAI正式推出AI视频生成模型Sora：ChatGPT订阅用户免费用

OpenAI发布强化微调API，能深度定制超复杂大模型了

谷歌“狙击”OpenAI，发布新一代大模型，主打Agent+多模态

Andrej Karpathy：神奇大模型不存在的，只是对人类标注的拙劣模仿

7座MPV哪个好？上汽大通MAXUS G50 PLUS以实力说话

AI日报：OpenAI全量上线视频聊天功能；Anthropic最快模型Claude 3.5 Haiku全面开放；巨人网络推游戏大模型千影 QianYing

AI日报：阶跃星辰内测视频大模型Step-Video；即梦AI图片2.1模型支持生成文字；腾讯发布混元视频生成大模型

成本暴降60% OpenAI宣布开放满血o1模型API

游戏与硬件的碰撞 AMD&amp;微星B站头号玩家A计划启动

重磅！OpenAI开放满血o1模型API，成本暴降60%

比5.5G还快！华为Mate 70 Pro+网速实测：比Mate 60 Pro快一倍

AI日报：王炸！Anthropic开源模型上下文协议MCP；阿里通义App上线局部风格化功能； Kimi 数学版上线

米家立式学习灯Pro发布打造舒适智能学习照明体验

游戏与硬件的碰撞 AMD&微星B站头号玩家A计划启动