Add new openai post

chenditc · Nov 7, 2023 · 23d663e · 23d663e
1 parent dcea2e0
commit 23d663e
Show file tree

Hide file tree

Showing 9 changed files with 103 additions and 0 deletions.
diff --git a/_posts/2023-11-06-gpt4-turbo.md b/_posts/2023-11-06-gpt4-turbo.md
@@ -0,0 +1,103 @@
+---
+layout:     post
+title:      "OpenAI开发者日，15个哇哦时刻"
+subtitle:   "One more thing"
+date:       2023-11-06 10:00:00
+author:     "Di Chen"
+catalog:    true
+header-img: "img/in-post/cover/openaidevday.jpeg"
+tags:
+    - AI
+    - OpenAI
+    - Technology
+---
+
+ - 为什么我觉得 OpenAI 的开发者日可以比肩苹果的发布会？
+ - OpenAI 的野心在哪？
+ - 假如 AI 是10年前的电商，那什么产业会对标10年前的物流？
+ - 普通人有什么可以抓住的机会呢？
+
+## OpenAI 的开发者日
+
+[![openaidevday.jpeg](/img/in-post/cover/openaidevday.jpeg)](/img/in-post/cover/openaidevday.jpeg)
+
+我看完 OpenAI DevDay 的录播之后的第一反应就是，很干，非常干。
+
+换做其他厂商可能要吹10分钟的点，Sam 一句话就讲完了，
+ - GPT4 支持 128k 上下文。
+ - 新 GPT 只需要 1/3 的价格。
+ - GPT4 打通联网模式、插件模式、代码执行模式、Dall-E模型。
+ - GPT 新增 log probability 输出。
+ - 新增 json 格式支持
+
+这一串大招放完，相信 LLM 的从业者有不少看完都汗流浃背了。但从开发者看来，这个体验类似乔布斯时代的 “One more thing" 了。
+
+### OpenAI DevDay的技术透视
+#### GPT-4的128K上下文输入
+
+GPT-4引入了长达128k词汇的上下文输入，这让许多以往难以处理的任务变得可能了。举例来说，在处理一篇长博客、论文时，以往我们很难使用 one shot 或 few shot 给 GPT 提供例子，毕竟一个全文的 example 可能就把 token 用完了。如今，借助128K的上下文，我们可以重新尝试这个在长文本上使用 N shot example 的技巧了。
+
+#### 输出Log Prob的影响
+
+[![model_distillation.png](/img/in-post/ai/model_distillation.png)](/img/in-post/cover/model_distillation.png)
+
+GPT-4现在能够输出log probabilities（下一个词对应出现不同词汇的概率），而不仅限于单个 token（单个词）。这对于领域特定模型的蒸馏和微调来说是一个巨大的帮助。
+
+以往，researcher 通常使用GPT-4生成的数据作为标注数据集，用于微调或蒸馏特定领域的小型模型。有了log prob作为输出，这个过程的收敛会变得更加容易。因为只有一个 token 作为输出的时候，只能根据这个 token 来计算损失函数的梯度，但是有了 log prob 就相当于连续采样了 N 次的结果，可以极大加快模型收敛的速度。
+
+#### GPT-4价格下降
+
+[![gpt4-pricing.png](/img/in-post/ai/gpt4-pricing.png)](/img/in-post/cover/gpt4-pricing.png)
+[![gpt4-turbo-pricing.png](/img/in-post/ai/gpt4-turbo-pricing.png)](/img/in-post/cover/gpt4-turbo-pricing.png)
+
+GPT-4的价格下降，意味着之前成本考虑过高而无法实现的任务现在成为可能。
+
+比如日志分析、电商回复、电话接线员这类工作，工作难度不大，但是需要处理的语言、文本量极大。
+
+目前主要的难点就集中在，GPT3.5 的能力不足，GPT4 又太贵。但是目前 GPT4 直接打3折的情况下，很多为了克服 GPT3.5 能力不足而做的奇技淫巧就不必要了，或者由于 GPT4 价格太高而被砍的项目也可以重新立项了。
+
+#### 无需编程调教一个GPT Agent
+
+[![GPT_Builder.jpeg](/img/in-post/ai/GPT_Builder.jpeg)](/img/in-post/cover/GPT_Builder.jpeg)
+
+GPT Builder的推出显著降低了使用GPT的技术门槛。在此之前，进行有效的prompt engineering需要了解一系列技巧，如角色扮演或通过示例逆向工程最佳的提示。
+
+GPT Builder似乎内置了这些技巧，使得用户仅需通过清晰表达需求就能完成prompt engineer的过程。然而这些自动 prompt engineer 的结果似乎也对用户不可见，从而实现商业上的护城河，在 OpenAI 上调试好的 Agent，只能在 OpenAI 上使用。
+
+目前 GPT 落地各行业的一个难点在于难以把领域知识加入到 GPT 模型中，而 GPT Builder 的这个流程可以让你像教实习生一样教 GPT 知识，就可以更大规模地让 GPT 在更多行业落地了。
+
+#### OpenAI 的野心
+
+从这一系列举动可以看到，OpenAI 并不甘心仅仅做一个大模型的厂商，而是花了很大力气集成所有 AI 工具，TTS （文本语音转换）、图像生成、图像识别、语言大模型。同时也实现了很强的生态工程，例如 GPT builder，Assistants API。
+
+[![openai_ambitious.jpg](/img/in-post/ai/openai_ambitious.jpg)](/img/in-post/ai/openai_ambitious.jpg)
+
+看起来 OpenAI 还想要做一个流量入口，类似于钢铁侠中的 Jarvis，把所有 AI 相关的复杂度全部藏在自己的服务背后。这也是为什么我觉得很多 LLM 从业者看了会很紧张，假如创业的方向是做企业定制化 GPT、GPT集成做智能助手、GPT的 prompt 商店，这些方向可能最后都会和 OpenAI 有直接的竞争。如果没有特殊的护城河，大概率会被 OpenAI 的新 feature 给取代。
+
+就比如我之前为了解决大模型输出不是稳定 json 格式而做的一些工作，在 GPT 新增了 json_mode 之后就没有意义了。还有 ChatPDf，在 GPT4 集成了所有高阶功能之后，意义也不大了。
+
+但从另一个侧面，我发现类似10年前物流行业的机会。10年前电商行业快速发展的时候，同样带动了物流行业的发展，巨大的物流需求让顺丰迅速崛起。
+
+#### AI与RPA和机器人行业的共同成长
+
+随着大型语言模型（LLM）的发展，RPA（Robotic Process Automation）和机器人技术正成为其重要的延伸。这些技术可以视为AI的“触手”，将智能扩展到实际的物理操作中。
+
+[![gpt-rpa.jpg](/img/in-post/ai/gpt-rpa.jpg)](/img/in-post/ai/gpt-rpa.jeg)
+
+例如，AI的广泛应用可能会遇到的“最后一公里”问题，如自动化流程中的文件上传，假如个人所得税 APP 不支持 API 调用，那自动化报税就可能卡在如何接入的问题上。这时候 RPA 软件就很关键了，如果能把这些应用通过 RPA 封装成 API，就能让很多原本手动做的操作完全自动化了。
+
+另一个角度来说，但如果软件 A 不支持 API 调用，而软件 B 支持，那 GPT 作为入口的流量可能就会选择软件 B，从而慢慢蚕食软件 A 的市场份额。工具类的软件更需要慢慢支持更多大模型所需的 API。
+
+## 普通人的机会
+
+这里似乎应该插入一个卖 AI 课程的广告，可惜并没有。
+
+就像工业革命前的纺织女工一样，缝纫机的出现虽然淘汰了一批技能，但也诞生了新的需求。
+
+GPT 选择了降低进入门槛，让更多人可以通过 GPT builder 把自己的领域知识上传、调教成一个 GPT agent。顺着这个产品路径，前期必然会有很多补贴、鼓励措施让大家能尝到甜头，一如早期的 App Store。
+
+GPT builder 所需要输入的领域知识可以来源于各行各业，例如导游可以上传自己选酒店、选路线的经验，XX游戏玩家可以上传自己的对战经验，恋爱大师可以上传自己的聊天心得和例子。这也是我觉得每个普通人都可以把握的机会，每个人的经历不同，必然有自己擅长和熟悉的领域，小到挑选好的水果，大到职业规划，都是值得尝试去调教的领域。
+
+[![gpt-builder-everyone.jpg](/img/in-post/ai/gpt-builder-everyone.jpg)](/img/in-post/ai/gpt-builder-everyone.jpg)
+
+同样的，比起上一门 Python 爬虫课或者 Python 数据处理课，不如好好玩玩 GPT。
diff --git a/img/in-post/ai/GPT_Builder.jpeg b/img/in-post/ai/GPT_Builder.jpeg
diff --git a/img/in-post/ai/gpt-builder-everyone.jpg b/img/in-post/ai/gpt-builder-everyone.jpg
diff --git a/img/in-post/ai/gpt-rpa.jpg b/img/in-post/ai/gpt-rpa.jpg
diff --git a/img/in-post/ai/gpt4-pricing.png b/img/in-post/ai/gpt4-pricing.png
diff --git a/img/in-post/ai/gpt4-turbo-pricing.png b/img/in-post/ai/gpt4-turbo-pricing.png
diff --git a/img/in-post/ai/model_distillation.png b/img/in-post/ai/model_distillation.png
diff --git a/img/in-post/ai/openai_ambitious.jpg b/img/in-post/ai/openai_ambitious.jpg
diff --git a/img/in-post/cover/openaidevday.jpeg b/img/in-post/cover/openaidevday.jpeg