diff --git a/_posts/2023-11-06-gpt4-turbo.md b/_posts/2023-11-06-gpt4-turbo.md new file mode 100644 index 0000000..db99aed --- /dev/null +++ b/_posts/2023-11-06-gpt4-turbo.md @@ -0,0 +1,103 @@ +--- +layout: post +title: "OpenAI开发者日,15个哇哦时刻" +subtitle: "One more thing" +date: 2023-11-06 10:00:00 +author: "Di Chen" +catalog: true +header-img: "img/in-post/cover/openaidevday.jpeg" +tags: + - AI + - OpenAI + - Technology +--- + + - 为什么我觉得 OpenAI 的开发者日可以比肩苹果的发布会? + - OpenAI 的野心在哪? + - 假如 AI 是10年前的电商,那什么产业会对标10年前的物流? + - 普通人有什么可以抓住的机会呢? + +## OpenAI 的开发者日 + +[![openaidevday.jpeg](/img/in-post/cover/openaidevday.jpeg)](/img/in-post/cover/openaidevday.jpeg) + +我看完 OpenAI DevDay 的录播之后的第一反应就是,很干,非常干。 + +换做其他厂商可能要吹10分钟的点,Sam 一句话就讲完了, + - GPT4 支持 128k 上下文。 + - 新 GPT 只需要 1/3 的价格。 + - GPT4 打通联网模式、插件模式、代码执行模式、Dall-E模型。 + - GPT 新增 log probability 输出。 + - 新增 json 格式支持 + +这一串大招放完,相信 LLM 的从业者有不少看完都汗流浃背了。但从开发者看来,这个体验类似乔布斯时代的 “One more thing" 了。 + +### OpenAI DevDay的技术透视 +#### GPT-4的128K上下文输入 + +GPT-4引入了长达128k词汇的上下文输入,这让许多以往难以处理的任务变得可能了。举例来说,在处理一篇长博客、论文时,以往我们很难使用 one shot 或 few shot 给 GPT 提供例子,毕竟一个全文的 example 可能就把 token 用完了。如今,借助128K的上下文,我们可以重新尝试这个在长文本上使用 N shot example 的技巧了。 + +#### 输出Log Prob的影响 + +[![model_distillation.png](/img/in-post/ai/model_distillation.png)](/img/in-post/cover/model_distillation.png) + +GPT-4现在能够输出log probabilities(下一个词对应出现不同词汇的概率),而不仅限于单个 token(单个词)。这对于领域特定模型的蒸馏和微调来说是一个巨大的帮助。 + +以往,researcher 通常使用GPT-4生成的数据作为标注数据集,用于微调或蒸馏特定领域的小型模型。有了log prob作为输出,这个过程的收敛会变得更加容易。因为只有一个 token 作为输出的时候,只能根据这个 token 来计算损失函数的梯度,但是有了 log prob 就相当于连续采样了 N 次的结果,可以极大加快模型收敛的速度。 + +#### GPT-4价格下降 + +[![gpt4-pricing.png](/img/in-post/ai/gpt4-pricing.png)](/img/in-post/cover/gpt4-pricing.png) +[![gpt4-turbo-pricing.png](/img/in-post/ai/gpt4-turbo-pricing.png)](/img/in-post/cover/gpt4-turbo-pricing.png) + +GPT-4的价格下降,意味着之前成本考虑过高而无法实现的任务现在成为可能。 + +比如日志分析、电商回复、电话接线员这类工作,工作难度不大,但是需要处理的语言、文本量极大。 + +目前主要的难点就集中在,GPT3.5 的能力不足,GPT4 又太贵。但是目前 GPT4 直接打3折的情况下,很多为了克服 GPT3.5 能力不足而做的奇技淫巧就不必要了,或者由于 GPT4 价格太高而被砍的项目也可以重新立项了。 + +#### 无需编程调教一个GPT Agent + +[![GPT_Builder.jpeg](/img/in-post/ai/GPT_Builder.jpeg)](/img/in-post/cover/GPT_Builder.jpeg) + +GPT Builder的推出显著降低了使用GPT的技术门槛。在此之前,进行有效的prompt engineering需要了解一系列技巧,如角色扮演或通过示例逆向工程最佳的提示。 + +GPT Builder似乎内置了这些技巧,使得用户仅需通过清晰表达需求就能完成prompt engineer的过程。然而这些自动 prompt engineer 的结果似乎也对用户不可见,从而实现商业上的护城河,在 OpenAI 上调试好的 Agent,只能在 OpenAI 上使用。 + +目前 GPT 落地各行业的一个难点在于难以把领域知识加入到 GPT 模型中,而 GPT Builder 的这个流程可以让你像教实习生一样教 GPT 知识,就可以更大规模地让 GPT 在更多行业落地了。 + +#### OpenAI 的野心 + +从这一系列举动可以看到,OpenAI 并不甘心仅仅做一个大模型的厂商,而是花了很大力气集成所有 AI 工具,TTS (文本语音转换)、图像生成、图像识别、语言大模型。同时也实现了很强的生态工程,例如 GPT builder,Assistants API。 + +[![openai_ambitious.jpg](/img/in-post/ai/openai_ambitious.jpg)](/img/in-post/ai/openai_ambitious.jpg) + +看起来 OpenAI 还想要做一个流量入口,类似于钢铁侠中的 Jarvis,把所有 AI 相关的复杂度全部藏在自己的服务背后。这也是为什么我觉得很多 LLM 从业者看了会很紧张,假如创业的方向是做企业定制化 GPT、GPT集成做智能助手、GPT的 prompt 商店,这些方向可能最后都会和 OpenAI 有直接的竞争。如果没有特殊的护城河,大概率会被 OpenAI 的新 feature 给取代。 + +就比如我之前为了解决大模型输出不是稳定 json 格式而做的一些工作,在 GPT 新增了 json_mode 之后就没有意义了。还有 ChatPDf,在 GPT4 集成了所有高阶功能之后,意义也不大了。 + +但从另一个侧面,我发现类似10年前物流行业的机会。10年前电商行业快速发展的时候,同样带动了物流行业的发展,巨大的物流需求让顺丰迅速崛起。 + +#### AI与RPA和机器人行业的共同成长 + +随着大型语言模型(LLM)的发展,RPA(Robotic Process Automation)和机器人技术正成为其重要的延伸。这些技术可以视为AI的“触手”,将智能扩展到实际的物理操作中。 + +[![gpt-rpa.jpg](/img/in-post/ai/gpt-rpa.jpg)](/img/in-post/ai/gpt-rpa.jeg) + +例如,AI的广泛应用可能会遇到的“最后一公里”问题,如自动化流程中的文件上传,假如个人所得税 APP 不支持 API 调用,那自动化报税就可能卡在如何接入的问题上。这时候 RPA 软件就很关键了,如果能把这些应用通过 RPA 封装成 API,就能让很多原本手动做的操作完全自动化了。 + +另一个角度来说,但如果软件 A 不支持 API 调用,而软件 B 支持,那 GPT 作为入口的流量可能就会选择软件 B,从而慢慢蚕食软件 A 的市场份额。工具类的软件更需要慢慢支持更多大模型所需的 API。 + +## 普通人的机会 + +这里似乎应该插入一个卖 AI 课程的广告,可惜并没有。 + +就像工业革命前的纺织女工一样,缝纫机的出现虽然淘汰了一批技能,但也诞生了新的需求。 + +GPT 选择了降低进入门槛,让更多人可以通过 GPT builder 把自己的领域知识上传、调教成一个 GPT agent。顺着这个产品路径,前期必然会有很多补贴、鼓励措施让大家能尝到甜头,一如早期的 App Store。 + +GPT builder 所需要输入的领域知识可以来源于各行各业,例如导游可以上传自己选酒店、选路线的经验,XX游戏玩家可以上传自己的对战经验,恋爱大师可以上传自己的聊天心得和例子。这也是我觉得每个普通人都可以把握的机会,每个人的经历不同,必然有自己擅长和熟悉的领域,小到挑选好的水果,大到职业规划,都是值得尝试去调教的领域。 + +[![gpt-builder-everyone.jpg](/img/in-post/ai/gpt-builder-everyone.jpg)](/img/in-post/ai/gpt-builder-everyone.jpg) + +同样的,比起上一门 Python 爬虫课或者 Python 数据处理课,不如好好玩玩 GPT。 diff --git a/img/in-post/ai/GPT_Builder.jpeg b/img/in-post/ai/GPT_Builder.jpeg new file mode 100644 index 0000000..db1e9c8 Binary files /dev/null and b/img/in-post/ai/GPT_Builder.jpeg differ diff --git a/img/in-post/ai/gpt-builder-everyone.jpg b/img/in-post/ai/gpt-builder-everyone.jpg new file mode 100644 index 0000000..7b65a6f Binary files /dev/null and b/img/in-post/ai/gpt-builder-everyone.jpg differ diff --git a/img/in-post/ai/gpt-rpa.jpg b/img/in-post/ai/gpt-rpa.jpg new file mode 100644 index 0000000..1c1536c Binary files /dev/null and b/img/in-post/ai/gpt-rpa.jpg differ diff --git a/img/in-post/ai/gpt4-pricing.png b/img/in-post/ai/gpt4-pricing.png new file mode 100644 index 0000000..392cead Binary files /dev/null and b/img/in-post/ai/gpt4-pricing.png differ diff --git a/img/in-post/ai/gpt4-turbo-pricing.png b/img/in-post/ai/gpt4-turbo-pricing.png new file mode 100644 index 0000000..e9073eb Binary files /dev/null and b/img/in-post/ai/gpt4-turbo-pricing.png differ diff --git a/img/in-post/ai/model_distillation.png b/img/in-post/ai/model_distillation.png new file mode 100644 index 0000000..f3ff994 Binary files /dev/null and b/img/in-post/ai/model_distillation.png differ diff --git a/img/in-post/ai/openai_ambitious.jpg b/img/in-post/ai/openai_ambitious.jpg new file mode 100644 index 0000000..2210872 Binary files /dev/null and b/img/in-post/ai/openai_ambitious.jpg differ diff --git a/img/in-post/cover/openaidevday.jpeg b/img/in-post/cover/openaidevday.jpeg new file mode 100644 index 0000000..ce5f19d Binary files /dev/null and b/img/in-post/cover/openaidevday.jpeg differ