Claude旧模型优化与迁移
虽然我们强烈建议升级到 Claude 3 系列模型以获得更优越的性能、视觉能力和整体智能,但我们理解过渡需要时间,一些用户可能需要继续使用我们的旧模型一段时间。本指南旨在为我们的旧模型提供使用技巧,并提供将提示从其他模型(如 OpenAI 的 GPT)迁移到我们的旧模型的策略。
Anthropic 的旧模型
我们的旧模型包括 Claude Instant 1.2、Claude 2.0 和 Claude 2.1。在这些旧模型中,只有 Claude 2.1 支持系统提示(所有 Claude 3 模型都完全支持系统提示)。这些模型没有 Claude 3 系列的视觉能力,总体上性能和智能水平较低。但是,它们仍然可以用于不需要 Claude 3 模型高级功能的某些应用程序。
请注意,旧模型可能会随着时间的推移而被弃用,并且与新模型相比支持较少,因此我们建议尽可能计划迁移到 Claude 3 系列。
将提示从 OpenAI/ChatGPT 迁移到旧版 Claude 模型
如果您正在从 OpenAI 的 GPT 模型或 ChatGPT 过渡到 Claude 2 系列模型或更旧的模型,您可能需要对提示进行一些调整,以确保获得最佳性能。
以下是一些帮助您转换 GPT 提示以获得更好的旧版 Claude 模型结果的技巧:
1. 添加 XML 标签 XML 标签可用于划分提示的不同子部分,允许 Claude 将提示划分为不同的部分。例如,要将文档中的文本添加到提示中,请将文档包装在 <doc></doc>
标签中:
<doc> 一些文本... </doc>
Claude 还可以识别其他结构化格式,如 JSON 和 Markdown,但由于训练期间的接触,XML 在大多数情况下往往会带来最佳性能。
2. 提供清晰明确的指示 Claude 对清晰直接的指示反应良好。与其留出隐含假设的空间,不如在提示中尽可能详细地明确指示 Claude 以确保其完全执行任务。例如,不要这样:
用户:使用上下文和问题来创建答案。
尝试这样:
用户:请阅读 <question>
标签内提供的用户问题。然后,仅使用上面 <context>
标签内提供的上下文信息,生成问题的答案并将其输出在 <answer>
标签内。
3. 预填充 Claude 的响应 您可以扩展 Claude 的提示以预填充 Assistant 轮次。Claude 将从 Assistant 消息中的最后一个标记继续对话。这有助于避免 Claude 的啰嗦倾向,并确保它提供所需的输出格式。例如:
| 角色 | 内容 |
| ------------------ | ------------------------------------------------------------ |
| 用户 | 我希望你使用以下说明重写以下段落:” {{INSTRUCTIONS}}“.
这是段落:
请在
| Assistant (预填充) |
如果您使用此方法,请确保在 API 调用中将 </rewrite>
作为停止序列传递。
4. 保持 Claude 的角色 确保 Claude 在角色扮演场景中保持角色。对于 Claude 2.1(以及所有 Claude 3 模型),您可以使用系统提示来帮助 Claude 更好地保持角色。
5. 将文档放在指令之前 Claude 的长上下文窗口(根据模型的不同为 100K-200K)使其非常擅长解析和分析长文档和文本字符串。最好在指令或用户输入之前提供长文档和文本,因为 Claude 会特别注意提示底部附近的文本。请确保在提示末尾强调重要的指令。
6. 添加多个示例(至少 3 个) Claude 通过如何响应以及以何种格式响应的示例来很好地学习。我们建议在提示中添加至少三个示例,但越多越好!统一的示例将教会 Claude 每次都以相同的方式响应。
旧模型功能
Claude 输出星号动作 当给出角色扮演提示或系统提示时,旧版 Claude 模型有时喜欢通过编写舞台指示(如 微笑 或 挥手)来创造性地说明他们的响应。如果不需要这样做,您可以对输出进行后处理以删除星号之间的单词。
以下是在 Python 中执行此操作的示例:
python
import re
text = "你好。*我的名字是 Claude。*我是一个 AI 助手。"
cleaned = re.sub(r'\*.*?\*', '', text)
print(cleaned)
> 你好。我是一个 AI 助手。
通过这些提示和技巧,您可以在旧版 Claude 模型上获得更好的性能和结果。尽管我们强烈建议升级到 Claude 3 系列,但这些方法可以帮助您在过渡期间充分利用现有模型的功能。