Skip to content

Commit

Permalink
Add new openai post
Browse files Browse the repository at this point in the history
  • Loading branch information
chenditc committed Nov 7, 2023
1 parent dcea2e0 commit 23d663e
Show file tree
Hide file tree
Showing 9 changed files with 103 additions and 0 deletions.
103 changes: 103 additions & 0 deletions _posts/2023-11-06-gpt4-turbo.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,103 @@
---
layout: post
title: "OpenAI开发者日,15个哇哦时刻"
subtitle: "One more thing"
date: 2023-11-06 10:00:00
author: "Di Chen"
catalog: true
header-img: "img/in-post/cover/openaidevday.jpeg"
tags:
- AI
- OpenAI
- Technology
---

- 为什么我觉得 OpenAI 的开发者日可以比肩苹果的发布会?
- OpenAI 的野心在哪?
- 假如 AI 是10年前的电商,那什么产业会对标10年前的物流?
- 普通人有什么可以抓住的机会呢?

## OpenAI 的开发者日

[![openaidevday.jpeg](/img/in-post/cover/openaidevday.jpeg)](/img/in-post/cover/openaidevday.jpeg)

我看完 OpenAI DevDay 的录播之后的第一反应就是,很干,非常干。

换做其他厂商可能要吹10分钟的点,Sam 一句话就讲完了,
- GPT4 支持 128k 上下文。
- 新 GPT 只需要 1/3 的价格。
- GPT4 打通联网模式、插件模式、代码执行模式、Dall-E模型。
- GPT 新增 log probability 输出。
- 新增 json 格式支持

这一串大招放完,相信 LLM 的从业者有不少看完都汗流浃背了。但从开发者看来,这个体验类似乔布斯时代的 “One more thing" 了。

### OpenAI DevDay的技术透视
#### GPT-4的128K上下文输入

GPT-4引入了长达128k词汇的上下文输入,这让许多以往难以处理的任务变得可能了。举例来说,在处理一篇长博客、论文时,以往我们很难使用 one shot 或 few shot 给 GPT 提供例子,毕竟一个全文的 example 可能就把 token 用完了。如今,借助128K的上下文,我们可以重新尝试这个在长文本上使用 N shot example 的技巧了。

#### 输出Log Prob的影响

[![model_distillation.png](/img/in-post/ai/model_distillation.png)](/img/in-post/cover/model_distillation.png)

GPT-4现在能够输出log probabilities(下一个词对应出现不同词汇的概率),而不仅限于单个 token(单个词)。这对于领域特定模型的蒸馏和微调来说是一个巨大的帮助。

以往,researcher 通常使用GPT-4生成的数据作为标注数据集,用于微调或蒸馏特定领域的小型模型。有了log prob作为输出,这个过程的收敛会变得更加容易。因为只有一个 token 作为输出的时候,只能根据这个 token 来计算损失函数的梯度,但是有了 log prob 就相当于连续采样了 N 次的结果,可以极大加快模型收敛的速度。

#### GPT-4价格下降

[![gpt4-pricing.png](/img/in-post/ai/gpt4-pricing.png)](/img/in-post/cover/gpt4-pricing.png)
[![gpt4-turbo-pricing.png](/img/in-post/ai/gpt4-turbo-pricing.png)](/img/in-post/cover/gpt4-turbo-pricing.png)

GPT-4的价格下降,意味着之前成本考虑过高而无法实现的任务现在成为可能。

比如日志分析、电商回复、电话接线员这类工作,工作难度不大,但是需要处理的语言、文本量极大。

目前主要的难点就集中在,GPT3.5 的能力不足,GPT4 又太贵。但是目前 GPT4 直接打3折的情况下,很多为了克服 GPT3.5 能力不足而做的奇技淫巧就不必要了,或者由于 GPT4 价格太高而被砍的项目也可以重新立项了。

#### 无需编程调教一个GPT Agent

[![GPT_Builder.jpeg](/img/in-post/ai/GPT_Builder.jpeg)](/img/in-post/cover/GPT_Builder.jpeg)

GPT Builder的推出显著降低了使用GPT的技术门槛。在此之前,进行有效的prompt engineering需要了解一系列技巧,如角色扮演或通过示例逆向工程最佳的提示。

GPT Builder似乎内置了这些技巧,使得用户仅需通过清晰表达需求就能完成prompt engineer的过程。然而这些自动 prompt engineer 的结果似乎也对用户不可见,从而实现商业上的护城河,在 OpenAI 上调试好的 Agent,只能在 OpenAI 上使用。

目前 GPT 落地各行业的一个难点在于难以把领域知识加入到 GPT 模型中,而 GPT Builder 的这个流程可以让你像教实习生一样教 GPT 知识,就可以更大规模地让 GPT 在更多行业落地了。

#### OpenAI 的野心

从这一系列举动可以看到,OpenAI 并不甘心仅仅做一个大模型的厂商,而是花了很大力气集成所有 AI 工具,TTS (文本语音转换)、图像生成、图像识别、语言大模型。同时也实现了很强的生态工程,例如 GPT builder,Assistants API。

[![openai_ambitious.jpg](/img/in-post/ai/openai_ambitious.jpg)](/img/in-post/ai/openai_ambitious.jpg)

看起来 OpenAI 还想要做一个流量入口,类似于钢铁侠中的 Jarvis,把所有 AI 相关的复杂度全部藏在自己的服务背后。这也是为什么我觉得很多 LLM 从业者看了会很紧张,假如创业的方向是做企业定制化 GPT、GPT集成做智能助手、GPT的 prompt 商店,这些方向可能最后都会和 OpenAI 有直接的竞争。如果没有特殊的护城河,大概率会被 OpenAI 的新 feature 给取代。

就比如我之前为了解决大模型输出不是稳定 json 格式而做的一些工作,在 GPT 新增了 json_mode 之后就没有意义了。还有 ChatPDf,在 GPT4 集成了所有高阶功能之后,意义也不大了。

但从另一个侧面,我发现类似10年前物流行业的机会。10年前电商行业快速发展的时候,同样带动了物流行业的发展,巨大的物流需求让顺丰迅速崛起。

#### AI与RPA和机器人行业的共同成长

随着大型语言模型(LLM)的发展,RPA(Robotic Process Automation)和机器人技术正成为其重要的延伸。这些技术可以视为AI的“触手”,将智能扩展到实际的物理操作中。

[![gpt-rpa.jpg](/img/in-post/ai/gpt-rpa.jpg)](/img/in-post/ai/gpt-rpa.jeg)

例如,AI的广泛应用可能会遇到的“最后一公里”问题,如自动化流程中的文件上传,假如个人所得税 APP 不支持 API 调用,那自动化报税就可能卡在如何接入的问题上。这时候 RPA 软件就很关键了,如果能把这些应用通过 RPA 封装成 API,就能让很多原本手动做的操作完全自动化了。

另一个角度来说,但如果软件 A 不支持 API 调用,而软件 B 支持,那 GPT 作为入口的流量可能就会选择软件 B,从而慢慢蚕食软件 A 的市场份额。工具类的软件更需要慢慢支持更多大模型所需的 API。

## 普通人的机会

这里似乎应该插入一个卖 AI 课程的广告,可惜并没有。

就像工业革命前的纺织女工一样,缝纫机的出现虽然淘汰了一批技能,但也诞生了新的需求。

GPT 选择了降低进入门槛,让更多人可以通过 GPT builder 把自己的领域知识上传、调教成一个 GPT agent。顺着这个产品路径,前期必然会有很多补贴、鼓励措施让大家能尝到甜头,一如早期的 App Store。

GPT builder 所需要输入的领域知识可以来源于各行各业,例如导游可以上传自己选酒店、选路线的经验,XX游戏玩家可以上传自己的对战经验,恋爱大师可以上传自己的聊天心得和例子。这也是我觉得每个普通人都可以把握的机会,每个人的经历不同,必然有自己擅长和熟悉的领域,小到挑选好的水果,大到职业规划,都是值得尝试去调教的领域。

[![gpt-builder-everyone.jpg](/img/in-post/ai/gpt-builder-everyone.jpg)](/img/in-post/ai/gpt-builder-everyone.jpg)

同样的,比起上一门 Python 爬虫课或者 Python 数据处理课,不如好好玩玩 GPT。
Binary file added img/in-post/ai/GPT_Builder.jpeg
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added img/in-post/ai/gpt-builder-everyone.jpg
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added img/in-post/ai/gpt-rpa.jpg
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added img/in-post/ai/gpt4-pricing.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added img/in-post/ai/gpt4-turbo-pricing.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added img/in-post/ai/model_distillation.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added img/in-post/ai/openai_ambitious.jpg
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added img/in-post/cover/openaidevday.jpeg
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.

0 comments on commit 23d663e

Please sign in to comment.