概览
OpenAI API 由具有不同功能和价位的多种模型提供支持。 您还可以使用 微调 针对您的特定用例对我们的原始基础模型进行有限的自定义。
模型 | 描述 |
---|---|
GPT-4 Limited beta | 一组在 GPT-3.5 上改进的模型,可以理解并生成自然语言或代码 |
GPT-3.5 | 一组在 GPT-3 上改进的模型,可以理解并生成自然语言或代码 |
DALL·E Beta | 可以在给定自然语言提示的情况下生成和编辑图像的模型 |
Whisper Beta | 一种可以将音频转换为文本的模型 |
Embeddings | 一组可以将文本转换为数字形式的模型 |
Moderation | 可以检测文本是否敏感或不安全的微调模型 |
GPT-3 | 一组可以理解和生成自然语言的模型 |
Codex Deprecated | 一组可以理解和生成代码的模型,包括将自然语言翻译成代码 |
我们还发布了开源模型,包括Point-E、Whisper、Jukebox 和 CLIP。
访问我们的研究人员模型索引,详细了解我们的研究论文中介绍了哪些模型以及 InstructGPT 和 GPT-3.5 等模型系列之间的差异。
GPT-4
是一个大型多模态模型(今天接受文本输入并发出文本输出,将来会出现图像输入),由于其更广泛的常识和高级推理,它可以比我们以前的任何模型更准确地解决难题 能力。 与 gpt-3.5-turbo
一样,GPT-4 针对聊天进行了优化,但也适用于传统的补全任务。 在我们的聊天指南 中了解如何使用 GPT-4。
GPT-4 is currently in a limited beta and only accessible to those who have been granted access. Please join the waitlist to get access when capacity is available.
最新型号 | 说明 | 最大代币 | 训练数据 |
---|---|---|---|
gpt-4 | 比任何 GPT-3.5 模型都更强大,能够执行更复杂的任务,并针对聊天进行了优化。 将使用我们最新的模型迭代进行更新。 | 8,192 个代币 | 截至 2021 年 9 月 |
gpt-4-0314 | 2023 年 3 月 14 日的 gpt-4 快照。与 gpt-4 不同,此模型不会收到更新,并且仅在 2023 年 6 月 14 日结束的三个月内提供支持。 8,192 个代币 | 截至 2021 年 9 月 | |
gpt-4-32k | 与基本“gpt-4”模式相同的功能,但上下文长度是其 4 倍。 将使用我们最新的模型迭代进行更新。 | 32,768 个代币 | 截至 2021 年 9 月 |
gpt-4-32k-0314 | 2023 年 3 月 14 日的 gpt-4-32 快照。与 gpt-4-32k 不同,该模型不会收到更新,并且仅在 2023 年 6 月 14 日结束的三个月内提供支持。 32,768 个代币 | 截至 2021 年 9 月 |
对于许多基本任务,GPT-4 和 GPT-3.5 模型之间的差异并不显着。 然而,在更复杂的推理情况下,GPT-4 比我们之前的任何模型都更有能力。
GPT-3.5
GPT-3.5 模型可以理解并生成自然语言或代码。 我们在 GPT-3.5 系列中功能最强大且最具成本效益的模型是“gpt-3.5-turbo”,它已针对聊天进行了优化,但也适用于传统的完成任务。
最新型号 | 说明 | 最大代币 | 训练数据 |
---|---|---|---|
gpt-3.5-turbo | 功能最强大的 GPT-3.5 模型并针对聊天进行了优化,成本仅为“text-davinci-003”的 1/10。 将使用我们最新的模型迭代进行更新。 | 4,096 个代币 | 截至 2021 年 9 月 |
gpt-3.5-turbo-0301 | 2023 年 3 月 1 日的 gpt-3.5-turbo 快照。与 gpt-3.5-turbo 不同,此模型不会收到更新,并且仅在 2023 年 6 月 1 日结束的三个月内提供支持。 4,096 个代币 | 截至 2021 年 9 月 | |
text-davinci-003 | 可以以比居里、巴贝奇或 ada 模型更好的质量、更长的输出和一致的指令遵循来完成任何语言任务。 还支持文本中的 inserting 补全。 | 4,097 个代币 | 截至 2021 年 6 月 |
text-davinci-002 | 与“text-davinci-003”类似的功能,但使用有监督的微调而不是强化学习进行训练 | 4,097 个代币 | 截至 2021 年 6 月 |
code-davinci-002 | 针对代码完成任务进行了优化 | 8,001 个代币 | 截至 2021 年 6 月 |
我们建议使用 gpt-3.5-turbo
而不是其他 GPT-3.5 模型,因为它的成本较低。
OpenAI 模型是不确定的,这意味着相同的输入可以产生不同的输出。 将 temperature 设置为 0 将使输出大部分具有确定性,但可能会保留少量可变性。
特定功能模型
虽然新的 gpt-3.5-turbo
模型针对聊天进行了优化,但它非常适合传统的完成任务。 原始 GPT-3.5 模型针对 文本补全 进行了优化。
我们用于创建嵌入 和编辑文本 的端点使用它们自己的一组专用模型。
找到合适的模型
试用 gpt-3.5-turbo
是了解 API 功能的好方法。 在您了解要完成的任务后,您可以继续使用“gpt-3.5-turbo”或其他模型,并尝试围绕其功能进行优化。
您可以使用 GPT 比较工具 并排运行不同的模型来比较输出、设置和响应时间,然后将数据下载到 Excel 电子表格中。
DALL·E 是一个人工智能系统,可以根据自然语言的描述创建逼真的图像和艺术作品。 我们目前支持在提示的情况下创建具有特定大小的新图像、编辑现有图像或创建用户提供的图像的变体的能力。
通过我们的 API 提供的当前 DALL·E 模型是 DALL·E 的第 2 次迭代,具有比原始模型更逼真、更准确且分辨率高 4 倍的图像。 您可以通过我们的 Labs 界面 或 通过 API 进行尝试。
Whisper 是一种通用的语音识别模型。 它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。 Whisper v2-large 模型目前可通过我们的 API 使用模型名称“whisper-1”获得。
目前,Whisper 的开源版本 与通过我们的 API 提供的版本没有区别。 然而,通过我们的 API,我们提供了一个优化的推理过程,这使得通过我们的 API 运行 Whisper 比通过其他方式运行要快得多。 有关 Whisper 的更多技术细节,您可以阅读论文。
Embeddings
嵌入是文本的数字表示,可用于衡量两段文本之间的相关性。 我们的第二代嵌入模型“text-embedding-ada-002”旨在以一小部分成本取代之前的 16 种第一代嵌入模型。 嵌入可用于搜索、聚类、推荐、异常检测和分类任务。 您可以在公告博文 中阅读有关我们最新嵌入模型的更多信息。
Moderation
审核模型旨在检查内容是否符合 OpenAI 的使用政策。 这些模型提供了查找以下类别内容的分类功能:仇恨、仇恨/威胁、自残、性、性/未成年人、暴力和暴力/图片。 您可以在我们的审核指南 中找到更多信息。
审核模型接受任意大小的输入,该输入会自动分解以修复模型特定的上下文窗口。
型号 | 说明 |
---|---|
文本审核最新 | 最有能力的审核模型。 精度会比稳定模型略高 |
文本审核稳定 | 几乎与最新型号一样强大,但稍旧一些。 |
GPT-3
GPT-3 模型可以理解和生成自然语言。 这些模型被更强大的 GPT-3.5 代模型所取代。 然而,最初的 GPT-3 基础模型(davinci
、curie
、ada
和 babbage
)是目前唯一可用于微调的模型。
最新型号 | 说明 | 最大代币 | 训练数据 |
---|---|---|---|
文本-居里-001 | 非常有能力,比达芬奇更快,成本更低。 | 2,049 个代币 | 截至 2019 年 10 月 |
文本-babbage-001 | 能够执行简单的任务,速度非常快,成本更低。 | 2,049 个代币 | 截至 2019 年 10 月 |
文本-ada-001 | 能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,而且成本最低。 | 2,049 个代币 | 截至 2019 年 10 月 |
达芬奇 | 功能最强大的 GPT-3 模型。 可以完成其他模型可以完成的任何任务,而且通常质量更高。 | 2,049 个代币 | 截至 2019 年 10 月 |
居里 | 非常有能力,但比达芬奇更快,成本更低。 | 2,049 个代币 | 截至 2019 年 10 月 |
白菜 | 能够执行简单的任务,速度非常快,成本更低。 | 2,049 个代币 | 截至 2019 年 10 月 |
阿达 | 能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,而且成本最低。 | 2,049 个代币 | 截至 2019 年 10 月 |
Codex 模型现已弃用。 他们是我们 GPT-3 模型的后代,可以理解和生成代码。 他们的训练数据包含自然语言和来自 GitHub 的数十亿行公共代码。 了解更多。
他们最擅长 Python,精通 JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL,甚至 Shell 等十几种语言。
以下 Codex 模型现已弃用:
最新型号 | 说明 | 最大代币 | 训练数据 |
---|---|---|---|
代码-davinci-002 | 功能最强大的 Codex 型号。 特别擅长将自然语言翻译成代码。 除了补全代码,还支持代码内的inserting补全。 | 8,001 个代币 | 截至 2021 年 6 月 |
代码-davinci-001 | code-davinci-002 的早期版本 | 8,001 个代币 | 截至 2021 年 6 月 |
代码-cushman-002 | 几乎与 Davinci Codex 一样强大,但速度稍快。 这种速度优势可能使其成为实时应用程序的首选。 | 最多 2,048 个代币 | |
代码-cushman-001 | code-cushman-002 的早期版本 | 最多 2,048 个代币 |
有关更多信息,请访问我们的 使用 Codex 指南。
模型端点兼容性
Endpoint | Model name | |
---|---|---|
/v1/chat/completions | gpt-4, gpt-4-0314, gpt-4-32k, gpt-4-32k-0314, gpt-3.5-turbo, gpt-3.5-turbo-0301 | |
/v1/completions | text-davinci-003, text-davinci-002, text-curie-001, text-babbage-001, text-ada-001, davinci, curie, babbage, ada | |
/v1/edits | text-davinci-edit-001, code-davinci-edit-001 | |
/v1/audio/transcriptions | whisper-1 | |
/v1/audio/translations | whisper-1 | |
/v1/fine-tunes | davinci, curie, babbage, ada | |
/v1/embeddings | text-embedding-ada-002, text-search-ada-doc-001 | |
/v1/moderations | text-moderation-stable, text-moderation-latest |
此列表不包括我们的第一代嵌入模型 和我们的DALL·E 模型.
持续的模型升级
随着 gpt-3.5-turbo
的发布,我们的一些模型现在正在不断更新。 为了减少模型更改以意外方式影响我们用户的可能性,我们还提供将在 3 个月内保持静态的模型版本。 随着模型更新的新节奏,我们还让人们能够贡献评估,以帮助我们针对不同的用例改进模型。 如果您有兴趣,请查看 OpenAI Evals 存储库。
以下模型是将在指定日期弃用的临时快照。 如果您想使用最新的模型版本,请使用标准模型名称,如GPT-4
或GPT-3.5-Turbo
。
Model name | Deprecation date | |
---|---|---|
gpt-3.5-turbo-0301 | June 1st, 2023 | |
gpt-4-0314 | June 14th, 2023 | |
gpt-4-32k-0314 | June 14th, 2023 |