diff --git a/00-course-setup/translations/cn/README.md b/00-course-setup/translations/cn/README.md index a43090667..f7a0ff563 100644 --- a/00-course-setup/translations/cn/README.md +++ b/00-course-setup/translations/cn/README.md @@ -10,7 +10,7 @@ ### 1. Fork this Repo -[Fork 这个完整的 repo](https://github.com/microsoft/generative-ai-for-beginners/fork) 到你自己的 GitHub 账号下以便您能完成代码的修改和完成相关的挑战. 您也可以 [给该 repo star (🌟)](https://docs.github.com/en/get-started/exploring-projects-on-github/saving-repositories-with-stars) 让您更容易找到它和相关的 Repo. +[Fork 这个完整的 repo](https://github.com/microsoft/generative-ai-for-beginners/fork) 到你自己的 GitHub 账号下以便您能完成代码的修改和完成相关的挑战. 您也可以 [给该 repo star (🌟)](https://docs.github.com/en/get-started/exploring-projects-on-github/saving-repositories-with-stars?WT.mc_id=academic-105485-koreyst) 让您更容易找到它和相关的 Repo. ### 2. 创建 GitHub Codespaces @@ -22,11 +22,11 @@ 在构建任何类型的应用程序时,确保 API Keys 的安全非常重要。 我们建议您不要将任何 API 密钥直接存储在您正在使用的代码中,因为将这些详细信息提交到公共存储库可能会导致不必要的费用成本和问题。 -![Dialog showing buttons to create a codespace](../../images/who-will-pay.webp) +![Dialog showing buttons to create a codespace](../../images/who-will-pay.webp?WT.mc_id=academic-105485-koreyst) ## 在您的设备上本地运行 -要在本地运行代码,您需要安装某个版本的 Python。 个人建议安装 **[miniconda](https://conda.io/en/latest/miniconda.html)** - 这是相当轻量级的安装,支持不同 Python **虚拟环境** 的 `conda` 包管理器 。 +要在本地运行代码,您需要安装某个版本的 Python。 个人建议安装 **[miniconda](https://conda.io/en/latest/miniconda.html?WT.mc_id=academic-105485-koreyst)** - 这是相当轻量级的安装,支持不同 Python **虚拟环境** 的 `conda` 包管理器 。 安装 miniconda 后,您需要克隆存储库并创建一个用于本课程的 Python 虚拟环境: @@ -64,13 +64,13 @@ jupyterhub 我们也可以在容器中运行代码。 由于我们的 Repo 包含特殊的 “.devcontainer” 文件夹,该文件夹指示如何为此 Repo 创建容器,因此 VS Code 将允许您重新打开容器中的代码。 这需要安装 Docker,而且会比较复杂,所以我们推荐给更有经验的用户。 -使用 GitHub Codespaces 时确保 API Secrets 安全的最佳方法之一是使用 Codespace Secrets。 请按照本指南了解如何[管理 Codespace Secrets ](https://docs.github.com/en/codespaces/managing-your-codespaces/managing-secrets-for-your-codespaces)。 +使用 GitHub Codespaces 时确保 API Secrets 安全的最佳方法之一是使用 Codespace Secrets。 请按照本指南了解如何[管理 Codespace Secrets ](https://docs.github.com/en/codespaces/managing-your-codespaces/managing-secrets-for-your-codespaces?WT.mc_id=academic-105485-koreyst)。 ## 相关课程和技术要求 该课程有 6 节基础课和 6 节相关的编程课。 -对于编程课,我们使用 Azure OpenAI Service 。 您将需要访问 Azure OpenAI 服务和 API Key 才能运行此代码。 您可以通过这里 [完成此申请](https://customervoice.microsoft.com/Pages/ResponsePage.aspx?id=v4j5cvGGr0GRqy180BHbR7en2Ais5pxKtso_Pz4b1_xUOFA5Qk1UWDRBMjg0WFhPMkIzTzhKQ1dWNyQlQCN0PWcu&culture=en-us&country=us) 来申请访问权限。 +对于编程课,我们使用 Azure OpenAI Service 。 您将需要访问 Azure OpenAI 服务和 API Key 才能运行此代码。 您可以通过这里 [完成此申请](https://customervoice.microsoft.com/Pages/ResponsePage.aspx?id=v4j5cvGGr0GRqy180BHbR7en2Ais5pxKtso_Pz4b1_xUOFA5Qk1UWDRBMjg0WFhPMkIzTzhKQ1dWNyQlQCN0PWcu&culture=en-us&country=us?WT.mc_id=academic-105485-koreyst) 来申请访问权限。 当您等待审核时,每个编码课程还包含一个“README.md”文件,您可以在里面查看代码和相关内容 @@ -80,19 +80,19 @@ jupyterhub ## 找到志同道合的人 -我们在官方 [AI Community Discord server](https://aka.ms/genai-discord) 中创建了学习频道,用于结识其他学习者。 这是与其他志同道合的企业家、学生以及任何希望在生成式人工智能领域提升水平的人建立联系的方式。 +我们在官方 [AI Community Discord server](https://aka.ms/genai-discord?WT.mc_id=academic-105485-koreyst) 中创建了学习频道,用于结识其他学习者。 这是与其他志同道合的企业家、学生以及任何希望在生成式人工智能领域提升水平的人建立联系的方式。 -[![加入 Discord 频道](https://dcbadge.vercel.app/api/server/ByRwuEEgH4)](https://aka.ms/genai-discord) +[![加入 Discord 频道](https://dcbadge.vercel.app/api/server/ByRwuEEgH4?WT.mc_id=academic-105485-koreyst)](https://aka.ms/genai-discord?WT.mc_id=academic-105485-koreyst) 项目团队也将在这个 Discord server 上为任何学习者提供帮助。 ## 贡献该内容 -本课程是一项开源计划。 如果您发现需要改进的地方或问题,请创建 [Pull Request](https://github.com/microsoft/generative-ai-for-beginners/pulls) 或记录 [Github 问题](https://github.com/microsoft/generative-ai-for-beginners/issues)。 +本课程是一项开源计划。 如果您发现需要改进的地方或问题,请创建 [Pull Request](https://github.com/microsoft/generative-ai-for-beginners/pulls) 或记录 [Github 问题](https://github.com/microsoft/generative-ai-for-beginners/issues?WT.mc_id=academic-105485-koreyst)。 课程项目团队将跟踪所有贡献,为开源做出贡献是在生成人工智能领域建立职业生涯的绝佳方式。 -大多数贡献都要求您遵循贡献者许可协议 (CLA),声明您有权并且实际上授予我们使用您的贡献的权利。 有关详细信息,请访问[CLA,贡献者许可协议网站](https://cla.microsoft.com)。 +大多数贡献都要求您遵循贡献者许可协议 (CLA),声明您有权并且实际上授予我们使用您的贡献的权利。 有关详细信息,请访问[CLA,贡献者许可协议网站](https://cla.microsoft.com?WT.mc_id=academic-105485-koreyst)。 重要提示:翻译此存储库中的文本时,请确保不使用机器翻译。 我们将通过社区验证翻译,因此请用您熟悉的语言进行翻译。 @@ -102,4 +102,4 @@ jupyterhub ## 我们一起开始进入学习 -现在您已经完成了完成本课程所需的设置步骤,让我们开始进入[生成式人工智能和 LLMs 简介](../../../01-introduction-to-genai/translations/cn/README.md)。 +现在您已经完成了完成本课程所需的设置步骤,让我们开始进入[生成式人工智能和 LLMs 简介](../../../01-introduction-to-genai/translations/cn/README.md?WT.mc_id=academic-105485-koreyst)。 diff --git a/01-introduction-to-genai/translations/cn/README.md b/01-introduction-to-genai/translations/cn/README.md index a14f29a76..e4605cb6a 100644 --- a/01-introduction-to-genai/translations/cn/README.md +++ b/01-introduction-to-genai/translations/cn/README.md @@ -1,6 +1,6 @@ # 第一章 : 生成式人工智能和 LLMs 介绍 -[![Introduction to Generative AI and Large Language Models](../../images/01-lesson-banner.png)](https://youtu.be/vf_mZrn8ibc) +[![Introduction to Generative AI and Large Language Models](../../images/01-lesson-banner.png?WT.mc_id=academic-105485-koreyst)](https://youtu.be/vf_mZrn8ibc?WT.mc_id=academic-105485-koreyst) *(点击该图片看本章导学视频)* @@ -34,13 +34,13 @@ 生成式人工智能有望彻底改变我们今天的学习和教学方式,学生可以每天 24 小时使用虚拟教师,虚拟教室不仅能提供大量信息和示例,也能够利用创新的工具来评估学生并提供反馈。 -![Five young students looking at a monitor - image by DALLE2](../../images/students-by-DALLE2.png) +![Five young students looking at a monitor - image by DALLE2](../../images/students-by-DALLE2.png?WT.mc_id=academic-105485-koreyst) 首先,让我们来学习一些将在整个课程系列中使用的基本概念和术语。 ## 我们是如何获得生成式人工智能的? -尽管最近因生成人工智能模型的发布而引起了对人工智能技术的“炒作”,但人工智能已经有数十年的历史,最早的研究工作可以追溯到上世纪 60 年代。 我们现在正处于 AI 具有人类认知能力的阶段,例如 [OpenAI ChatGPT](https://openai.com/chatgpt) 或 [Bing Chat](https://www.microsoft.com/en-us/edge/features/bing-chat?WT.mc_id=academic-105485-koreyst)也在用 GPT 模型进行对话。 +尽管最近因生成人工智能模型的发布而引起了对人工智能技术的“炒作”,但人工智能已经有数十年的历史,最早的研究工作可以追溯到上世纪 60 年代。 我们现在正处于 AI 具有人类认知能力的阶段,例如 [OpenAI ChatGPT](https://openai.com/chatgpt?WT.mc_id=academic-105485-koreyst) 或 [Bing Chat](https://www.microsoft.com/en-us/edge/features/bing-chat?WT.mc_id=academic-105485-koreyst)也在用 GPT 模型进行对话。 稍微回顾一下,人工智能的第一个原型是打字的聊天机器人,依赖于从一组专家系统中提取到计算机中的知识库。 知识库中的答案是由输入文本中出现的关键字触发的。 然而,很快大家就发现,这种使用打字聊天机器人的方法并不能很好地扩展。 @@ -61,7 +61,7 @@ 这就是我们今天提出生成式人工智能的原因,它可以被视为深度学习的一个子集。 -![AI、ML、DL 和生成式 AI](../../images/AI-diagram.png) +![AI、ML、DL 和生成式 AI](../../images/AI-diagram.png?WT.mc_id=academic-105485-koreyst) 经过人工智能领域数十年的研究,一种名为 *Transformer* 的新模型架构克服了 RNN 的限制,能够获得更长的文本序列作为输入。 Transformer 基于注意力机制,使模型能够为其接收到的输入赋予不同的权重,“更加专注于”关联信息集中的地方,不管它们在文本序列中的顺序如何。 @@ -73,7 +73,7 @@ * **分词器,文本到数字**:大型语言模型接收文本作为输入并生成文本作为输出。 然而,作为统计模型,它们对数字的处理效果对比起文本序列的处理效果要好得多。 这就是为什么模型的每个输入在被核心模型使用之前都由分词器处理。 标记是一段文本——由可变数量的字符组成,因此标记器的主要任务是将输入分割成标记数组。 然后,每个令牌都映射有一个令牌索引,该索引是原始文本块的整数编码。 -![Example of tokenization](../../images/tokenizer-example.png) +![Example of tokenization](../../images/tokenizer-example.png?WT.mc_id=academic-105485-koreyst) * **预测输出标记**:给定 n 个标记作为输入(最大 n 因模型而异),模型能够预测一个标记作为输出。 然后,该标记会以扩展窗口模式合并到下一次迭代的输入中,从而获得一个(或多个)句子作为答案,生成结果有更好的用户体验。 这解释了为什么如果您曾经使用过 ChatGPT,您可能会注意到有时它在生成结果时在句子中间出现停顿。 @@ -91,24 +91,24 @@ 1. 文章、书籍、产品评论等的总结,以及从非结构化数据中提取见解。 - ![摘要示例](../../images/summarization-example.png) + ![摘要示例](../../images/summarization-example.png?WT.mc_id=academic-105485-koreyst) 2. 文章、论文、作业等的创意构思和设计。 - ![创意写作示例](../../images/creative-writing-example.png) + ![创意写作示例](../../images/creative-writing-example.png?WT.mc_id=academic-105485-koreyst) * **问题**,以与代理对话的形式提出。 - ![对话示例](../../images/conversation-example.png) + ![对话示例](../../images/conversation-example.png?WT.mc_id=academic-105485-koreyst) * **文本补全**,这隐含着对写作帮助的请求。 - ![文本完成示例](../../images/text-completion-example.png) + ![文本完成示例](../../images/text-completion-example.png?WT.mc_id=academic-105485-koreyst) * **代码**解释和记录需求,或者要求生成执行特定任务的一段代码的注释。 - ![编码示例](../../images/coding-example.png) + ![编码示例](../../images/coding-example.png?WT.mc_id=academic-105485-koreyst) 以上的例子非常简单,并不是对生成式人工智能功能的详尽演示。 只是想展示使用生成式人工智能的潜力,并不局限于教育领域。 @@ -119,7 +119,7 @@ 你的任务是阅读更多关于生成式人工智能(https://en.wikipedia.org/wiki/Generative_artificial_intelligence)的内容,并尝试找出一个你现在可以添加生成式人工智能但目前还没有的领域。 与用“旧式方法”做有什么不同,你能做一些你以前做不到的事情吗,或者生成的时候速度更快吗? 写一篇 300 字的摘要,描述您梦想的人工智能初创公司的样子,包括“问题”、“我将如何使用人工智能”、“影响”等标题,还可以选择做一份商业计划。 -如果您完成了此任务,您甚至可以准备好申请 Microsoft 的创业孵化器[Microsoft for Startups Founders Hub](https://www.microsoft.com/en-gb/startups),我们为您提供 Azure 和 OpenAIc redits 以及相关指导等等 +如果您完成了此任务,您甚至可以准备好申请 Microsoft 的创业孵化器[Microsoft for Startups Founders Hub](https://www.microsoft.com/startups?WT.mc_id=academic-105485-koreyst),我们为您提供 Azure 和 OpenAIc redits 以及相关指导等等 ## 知识检查 @@ -133,6 +133,6 @@ ## 继续您的学习旅程 -想要了解更多关于不同的生成人工智能概念吗? 请到[进阶学习的页面](../../../13-continued-learning/translations/cn/README.md) 查找有关此主题的其他学习资源。 +想要了解更多关于不同的生成人工智能概念吗? 请到[进阶学习的页面](../../../13-continued-learning/translations/cn/README.md?WT.mc_id=academic-105485-koreyst) 查找有关此主题的其他学习资源。 -前往第二章,我们将了解如何[探索和比较不同的 LLM 类型](../../../02-exploring-and-comparing-different-llms/translations/cn/README.md)! \ No newline at end of file +前往第二章,我们将了解如何[探索和比较不同的 LLM 类型](../../../02-exploring-and-comparing-different-llms/translations/cn/README.md?WT.mc_id=academic-105485-koreyst)! \ No newline at end of file diff --git a/02-exploring-and-comparing-different-llms/translations/cn/README.md b/02-exploring-and-comparing-different-llms/translations/cn/README.md index 576c8fbd2..3af4371e8 100644 --- a/02-exploring-and-comparing-different-llms/translations/cn/README.md +++ b/02-exploring-and-comparing-different-llms/translations/cn/README.md @@ -1,6 +1,6 @@ # 第二章 : 探索和比较不同的 LLMs -[![Exploring and comparing different LLMs](../../images/02-lesson-banner.png)](https://youtu.be/J1mWzw0P74c) +[![Exploring and comparing different LLMs](../../images/02-lesson-banner.png?WT.mc_id=academic-105485-koreyst)](https://youtu.be/J1mWzw0P74c?WT.mc_id=academic-105485-koreyst) > *点击该图片看本章导学视频* @@ -32,56 +32,56 @@ LLM 模型有许多不同类型,您选择的模型取决于您的用途、您 根据您是否打算使用模型进行文本、音频、视频、图像生成等,您可能会选择不同类型的模型。 -- **音频和语音识别**。 为此,Whisper 模型是一个不错的选择,因为它们是通常用于语音识别。 它经过不同音频数据的训练,可以执行多语言语音识别。 例如,您可以使用所有的模型,从价格便宜但功能强大的模型(如 Curry)到更昂贵拥有高性能的达芬奇(Davinci)模型。 详细了解 [ Whisper 类型模型](https://platform.openai.com/docs/models/whisper)。 +- **音频和语音识别**。 为此,Whisper 模型是一个不错的选择,因为它们是通常用于语音识别。 它经过不同音频数据的训练,可以执行多语言语音识别。 例如,您可以使用所有的模型,从价格便宜但功能强大的模型(如 Curry)到更昂贵拥有高性能的达芬奇(Davinci)模型。 详细了解 [ Whisper 类型模型](https://platform.openai.com/docs/models/whisper?WT.mc_id=academic-105485-koreyst)。 -- **图像生成**。 对于图像生成,DALL-E 和 Midjourney 是两个最佳的选择。 DALL-E 由 Azure OpenAI 提供。 [在此处阅读有关 DALL-E 的更多信息](https://platform.openai.com/docs/models/dall-e) 以及本课程的第九章。 +- **图像生成**。 对于图像生成,DALL-E 和 Midjourney 是两个最佳的选择。 DALL-E 由 Azure OpenAI 提供。 [在此处阅读有关 DALL-E 的更多信息](https://platform.openai.com/docs/models/dall-e?WT.mc_id=academic-105485-koreyst) 以及本课程的第九章。 -- **文本生成**。 大多数模型都经过文本生成训练,您有从 GPT-3.5 到 GPT-4 的多种选择。 它们的成本各不同,其中 GPT-4 是最昂贵的。 值得研究一下 [Azure OpenAI Playground](https://oai.azure.com/portal/playground),以评估哪些模型在功能和成本方面适合你的实际需求。 +- **文本生成**。 大多数模型都经过文本生成训练,您有从 GPT-3.5 到 GPT-4 的多种选择。 它们的成本各不同,其中 GPT-4 是最昂贵的。 值得研究一下 [Azure OpenAI Playground](https://oai.azure.com/portal/playground?WT.mc_id=academic-105485-koreyst),以评估哪些模型在功能和成本方面适合你的实际需求。 选择模型意味着您能获得一些基本功能,但这可能还不够。 通常,您有公司特定的数据,您需要以某种方式告诉 LLMs。 关于如何解决这个问题,有几种不同的选择,接下来的部分将详细介绍。 ### 认识基础模型与 LLMs -“基础模型”是[由斯坦福大学研究人员创造](https://arxiv.org/abs/2108.07258),定义为遵循某些标准的人工智能模型,例如: +“基础模型”是[由斯坦福大学研究人员创造](https://arxiv.org/abs/2108.07258?WT.mc_id=academic-105485-koreyst),定义为遵循某些标准的人工智能模型,例如: - **他们使用无监督学习或自监督学习进行训练**,这意味着他们接受未标记的多模式数据的训练,并且他们的训练过程不需要人工注释或数据标记。 - **它们是非常大的模型**,基于经过数十亿参数训练的深度神经网络。 - **它们通常旨在作为其他模型的“基础”**,这意味着它们可以用作构建其他模型的起点,可以通过微调方式来完成。 -![基础模型与 LLMs](../../images/FoundationModel.png) +![基础模型与 LLMs](../../images/FoundationModel.png?WT.mc_id=academic-105485-koreyst) 图片来源:【基础模型和大语言模型基本指南| 巴巴尔·M·巴蒂 (Babar M Bhatti) | Medium ](https://thebabar.medium.com/essential-guide-to-foundation-models-and-large-language-models-27dab58f7404) 为了进一步阐明这种区别,我们以 ChatGPT 为例。 为了构建 ChatGPT 的第一个版本,名为 GPT-3.5 的模型作为基础模型。 这意味着 OpenAI 使用一些特定于聊天的数据来创建 GPT-3.5 的调整版本,专门用于在对话场景(例如聊天机器人)中让其有更好的表现。 -![基础模型](../../images/Multimodal.png) +![基础模型](../../images/Multimodal.png?WT.mc_id=academic-105485-koreyst) -图片来源:[2108.07258.pdf (arxiv.org)](https://arxiv.org/pdf/2108.07258.pdf) +图片来源:[2108.07258.pdf (arxiv.org)](https://arxiv.org/pdf/2108.07258.pdf?WT.mc_id=academic-105485-koreyst) ### 认识开源模型与专有模型 对 LLM 进行分类的另一种方法是它们是开源的还是专有的。 -开源模型是向公众开放并且任何人都可以使用的模型。 它们通常由创建它们的公司或研究团体提供。 这些模型可以针对 LLMs 的各种用例进行检查、修改和定制。 然而,它们并不总是针对生产用途进行优化,并且可能不如专有模型具备高性能。 此外,开源模型的资金可能有限,并且它们可能无法长期维护或可能无法根据最新研究进行更新。 流行的开源模型的例子包括 [Alpaca](https://crfm.stanford.edu/2023/03/13/alpaca.html)、[Bloom](https://sapling.ai/llm/bloom) 和 [ LLaMA](https://sapling.ai/llm/llama)。 +开源模型是向公众开放并且任何人都可以使用的模型。 它们通常由创建它们的公司或研究团体提供。 这些模型可以针对 LLMs 的各种用例进行检查、修改和定制。 然而,它们并不总是针对生产用途进行优化,并且可能不如专有模型具备高性能。 此外,开源模型的资金可能有限,并且它们可能无法长期维护或可能无法根据最新研究进行更新。 流行的开源模型的例子包括 [Alpaca](https://crfm.stanford.edu/2023/03/13/alpaca.html)、[Bloom](https://sapling.ai/llm/bloom) 和 [ LLaMA](https://sapling.ai/llm/llama?WT.mc_id=academic-105485-koreyst)。 -专有模型是公司拥有的模型,不向公众提供。 这些模型通常针对生产用途进行了优化。 但是,不允许针对特定的使用场景进行检查、修改或定制它们。 另外,它们并不总是免费提供,可能需要订阅或付费才能使用。 此外,用户无法控制用于训练模型的数据,这意味着他们应该委托模型所有者确保对数据隐私和负责任地使用人工智能的承诺。 流行的专有模型的例子包括 [OpenAI 模型](https://platform.openai.com/docs/models/overview)、[Google Bard](https://sapling.ai/llm/bard) 或 [Claude 2] (https://www.anthropic.com/index/claude-2)。 +专有模型是公司拥有的模型,不向公众提供。 这些模型通常针对生产用途进行了优化。 但是,不允许针对特定的使用场景进行检查、修改或定制它们。 另外,它们并不总是免费提供,可能需要订阅或付费才能使用。 此外,用户无法控制用于训练模型的数据,这意味着他们应该委托模型所有者确保对数据隐私和负责任地使用人工智能的承诺。 流行的专有模型的例子包括 [OpenAI 模型](https://platform.openai.com/docs/models/overview)、[Google Bard](https://sapling.ai/llm/bard?WT.mc_id=academic-105485-koreyst) 或 [Claude 2] (https://www.anthropic.com/index/claude-2)。 ### 认识嵌入式,图像生成,文本或代码生成 LLMs 还可以根据其产生的输出进行分类。 -嵌入是一组可以将文本转换为数字形式的模型,称为嵌入,它是输入文本的数字表示。 嵌入使机器更容易理解单词或句子之间的关系,并且可以用作其他模型的输入,例如分类模型或对数值数据具有更好性能的聚类模型。 嵌入模型通常用于迁移学习,其中为有大量数据的代理任务构建模型,然后将模型权重(嵌入)重新用于其他下游任务。 此类别的一个示例是 [OpenAI 嵌入](https://platform.openai.com/docs/models/embeddings)。 +嵌入是一组可以将文本转换为数字形式的模型,称为嵌入,它是输入文本的数字表示。 嵌入使机器更容易理解单词或句子之间的关系,并且可以用作其他模型的输入,例如分类模型或对数值数据具有更好性能的聚类模型。 嵌入模型通常用于迁移学习,其中为有大量数据的代理任务构建模型,然后将模型权重(嵌入)重新用于其他下游任务。 此类别的一个示例是 [OpenAI 嵌入](https://platform.openai.com/docs/models/embeddings?WT.mc_id=academic-105485-koreyst)。 -![嵌入](../../images/Embedding.png) +![嵌入](../../images/Embedding.png?WT.mc_id=academic-105485-koreyst) -图像生成模型主要是用来生成图像。 这些模型通常用于图像编辑、图像合成和图像翻译。 图像生成模型通常在大型图像数据集上进行训练,例如 [LAION-5B](https://laion.ai/blog/laion-5b/),并且可用于生成新图像或编辑现有图像 修复、超分辨率和着色技术。 如 [DALL-E-3](https://openai.com/dall-e-3) 和 [StableDiffusion](https://github.com/Stability-AI/StableDiffusion)。 +图像生成模型主要是用来生成图像。 这些模型通常用于图像编辑、图像合成和图像翻译。 图像生成模型通常在大型图像数据集上进行训练,例如 [LAION-5B](https://laion.ai/blog/laion-5b/?WT.mc_id=academic-105485-koreyst),并且可用于生成新图像或编辑现有图像 修复、超分辨率和着色技术。 如 [DALL-E-3](https://openai.com/dall-e-3) 和 [StableDiffusion](https://github.com/Stability-AI/StableDiffusion?WT.mc_id=academic-105485-koreyst)。 -![Image generation](../../images/Image.png) +![Image generation](../../images/Image.png?WT.mc_id=academic-105485-koreyst) -文本或代码生成模型主要是生成文本或代码。 这些模型通常用于文本摘要、翻译和问答。 文本生成模型通常在大型文本数据集上进行训练,例如 [BookCorpus](https://www.cv-foundation.org/openaccess/content_iccv_2015/html/Zhu_Aligning_Books_and_ICCV_2015_paper.html),并且可用于生成新文本或回答问题。 代码生成模型,例如 [CodeParrot](https://huggingface.co/codeparrot),通常在大型代码数据集(如 GitHub)上进行训练,可用于生成新代码或修复现有代码中的错误。 +文本或代码生成模型主要是生成文本或代码。 这些模型通常用于文本摘要、翻译和问答。 文本生成模型通常在大型文本数据集上进行训练,例如 [BookCorpus](https://www.cv-foundation.org/openaccess/content_iccv_2015/html/Zhu_Aligning_Books_and_ICCV_2015_paper.html),并且可用于生成新文本或回答问题。 代码生成模型,例如 [CodeParrot](https://huggingface.co/codeparrot?WT.mc_id=academic-105485-koreyst),通常在大型代码数据集(如 GitHub)上进行训练,可用于生成新代码或修复现有代码中的错误。 - ![Text and code generation](../../images/Text.png) + ![Text and code generation](../../images/Text.png?WT.mc_id=academic-105485-koreyst) ### 了解编码-解码器与独立解码器 @@ -106,26 +106,26 @@ LLMs 还可以根据其产生的输出进行分类。 ## 如何使用不同的模型进行测试和迭代从而了解 Azure 上的运行性能 一旦我们的团队探索了当前的 LLMs 前景并为他们的场景确定了一些好的候选模型后,下一步就是根据他们的数据和工作负载行测试。 这是一个迭代过程,通过实验和量化来完成。 -我们在前面的段落中提到的大多数模型(OpenAI 模型、Llama2 等开源模型和 Hugging Face transformers)都可以在 [Azure 机器学习工作室](https://ml.azure.com/) 中的目录中找到 [基础模型](https://learn.microsoft.com/azure/machine-learning/concept-foundation-models?WT.mc_id=academic-105485-koreyst) 。 +我们在前面的段落中提到的大多数模型(OpenAI 模型、Llama2 等开源模型和 Hugging Face transformers)都可以在 [Azure 机器学习工作室](https://ml.azure.com/?WT.mc_id=academic-105485-koreyst) 中的目录中找到 [基础模型](https://learn.microsoft.com/azure/machine-learning/concept-foundation-models?WT.mc_id=academic-105485-koreyst) 。 -[Azure 机器学习](https://azure.microsoft.com/products/machine-learning/) 是一项云服务,专为数据科学家和机器学习工程师设计,用于管理整个机器学习生命周期(训练、测试、部署和 MLOps 相关的工作) 在一个平台上。 机器学习工作室为此服务提供图形用户界面,使用户能够: +[Azure 机器学习](https://azure.microsoft.com/products/machine-learning/?WT.mc_id=academic-105485-koreyst) 是一项云服务,专为数据科学家和机器学习工程师设计,用于管理整个机器学习生命周期(训练、测试、部署和 MLOps 相关的工作) 在一个平台上。 机器学习工作室为此服务提供图形用户界面,使用户能够: - 在目录中查找感兴趣的基础模型,按任务、许可证或名称进行过滤。 还可以导入尚未包含在目录中的新模型。 - 查看模型名片(包括详细描述和代码示例,并通过提供示例提示来测试结果),使用示例推理小部件对其进行测试。 -![Model card](../../images/Llama1.png) +![Model card](../../images/Llama1.png?WT.mc_id=academic-105485-koreyst) - 使用特定工作负载和输入中提供的特定数据集的评估指标来评估模型性能。 -![Model evaluation](../../images/Llama2.png) +![Model evaluation](../../images/Llama2.png?WT.mc_id=academic-105485-koreyst) - 利用 Azure 机器学习的实验和跟踪功能,根据自定义训练数据微调模型,以提高特定工作负载中的模型性能。 -![Model fine-tuning](../../images/Llama3.png) +![Model fine-tuning](../../images/Llama3.png?WT.mc_id=academic-105485-koreyst) - 将原始预训练模型或微调版本模型部署到远程实时推理或批处理端点,以使应用程序能够直接使用。 -![Model deployment](../../images/Llama4.png) +![Model deployment](../../images/Llama4.png?WT.mc_id=academic-105485-koreyst) ## 提升 LLM 的输出结果准确度 @@ -143,9 +143,9 @@ LLMs 还可以根据其产生的输出进行分类。 - **微调模型**。 在这里,您根据自己的数据进一步训练模型,这使得模型更加准确并且能够响应您的需求,但可能成本高昂。 -![LLMs deployment](../../images/Deploy.png) +![LLMs deployment](../../images/Deploy.png?WT.mc_id=academic-105485-koreyst) -图片来源: [企业部署LLM的四种方式| Fiddler AI 博客](https://www.fiddler.ai/blog/four-ways-that-enterprises-deploy-llms) +图片来源: [企业部署LLM的四种方式| Fiddler AI 博客](https://www.fiddler.ai/blog/four-ways-that-enterprises-deploy-llms?WT.mc_id=academic-105485-koreyst) ### 通过上下文的提示工程 @@ -196,6 +196,6 @@ A:3,如果您有时间和资源以及高质量的数据,微调是保持最 ## 继续您的学习旅程 -想要了解更多关于不同的生成人工智能概念吗? 转至[进阶学习的页面](../../../13-continued-learning/translations/cn/README.md) 查找有关本章的其他重要资源。 +想要了解更多关于不同的生成人工智能概念吗? 转至[进阶学习的页面](../../../13-continued-learning/translations/cn/README.md?WT.mc_id=academic-105485-koreyst) 查找有关本章的其他重要资源。 -前往第三章,我们将了解如何[负责任地使用生成式 AI 进行应用构建](../../../03-using-generative-ai-responsibly/translations/cn/README.md)! +前往第三章,我们将了解如何[负责任地使用生成式 AI 进行应用构建](../../../03-using-generative-ai-responsibly/translations/cn/README.md?WT.mc_id=academic-105485-koreyst)! diff --git a/03-using-generative-ai-responsibly/translations/cn/README.md b/03-using-generative-ai-responsibly/translations/cn/README.md index 4254b5841..d27df06b2 100644 --- a/03-using-generative-ai-responsibly/translations/cn/README.md +++ b/03-using-generative-ai-responsibly/translations/cn/README.md @@ -1,6 +1,6 @@ # 第三章 : 负责任地使用生成式人工智能 -[![Using Generative AI Responsibly](../../images/genai_course_3[77].png)]() +[![Using Generative AI Responsibly](../../images/genai_course_3[77].png?WT.mc_id=academic-105485-koreyst)]() > **导学视频即将上架,敬请期待** @@ -46,7 +46,7 @@ ![提示说“谁是泰坦尼克号的唯一幸存者”](../../../03-using-generative-ai-responsibly/images/2135-ChatGPT(1)_11zon.webp) -> *(来源:[飞翔的野牛](https://flyingbisons.com))* +> *(来源:[飞翔的野牛](https://flyingbisons.com?WT.mc_id=academic-105485-koreyst))* 给出了一个非常确切的答案。 不幸的是,这是不正确的。 即使极少了解,人们也会发现泰坦尼克号幸存者不止一名。 但对于刚开始研究这个领域的学生来说,这个答案足以有说服力,不会被质疑并被视为事实。 这样做的后果可能会导致人工智能系统不可靠,并对我们初创公司的声誉产生负面影响。 @@ -76,7 +76,7 @@ 现在我们已经确定了负责任的生成式人工智能的重要性,让我们看看我们可以采取的 4 个步骤来负责任地构建我们的人工智能解决方案: -![缓解循环](../../images/mitigate-cycle.png) +![缓解循环](../../images/mitigate-cycle.png?WT.mc_id=academic-105485-koreyst) ### 衡量潜在危害 @@ -88,7 +88,7 @@ 现在是时候寻找方法来预防或限制模型及其响应造成的潜在危害了。 我们可以从 4 个不同的层面来看待这个问题: -![缓解层](../../images/mitigation-layers.png) +![缓解层](../../images/mitigation-layers.png?WT.mc_id=academic-105485-koreyst) - **模型**。 为正确的用例选择正确的模型。 当应用于更小、更具体的用例时,更大、更复杂的模型(例如 GPT-4)可能会导致更大的有害内容风险。 使用训练数据进行微调还可以降低有害内容的风险。 @@ -96,11 +96,11 @@ - **元提示**。 元提示和基础是我们可以根据某些行为和信息指导或限制模型的方法。 这可以使用系统输入来定义模型的某些限制。 此外,提供与系统范围或领域更相关的输出。 - 它还可以使用检索增强生成 (RAG) 等技术,让模型仅从选定的可信来源中提取信息。 本课程后面有一章关于[构建搜索应用程序](../08-building-search-applications/README.md)的内容 + 它还可以使用检索增强生成 (RAG) 等技术,让模型仅从选定的可信来源中提取信息。 本课程后面有一章关于[构建搜索应用程序](../../../08-building-search-applications/translations/cn/README.md?WT.mc_id=academic-105485-koreyst)的内容 - **用户体验**。 最后一层是用户通过应用程序界面以某种方式直接与模型交互的地方。 通过这种方式,我们可以设计 UI/UX 来限制用户可以发送到模型的输入类型以及向用户显示的文本或图像。 在部署人工智能应用程序时,我们还必须透明地了解我们的生成式人工智能应用程序可以做什么和不能做什么。 -我们有一章内容致力于[为人工智能应用程序设计用户体验](../12-designing-ux-for-ai-applications/README.md) +我们有一章内容致力于[为人工智能应用程序设计用户体验](../../../12-designing-ux-for-ai-applications/translations/cn/README.md?WT.mc_id=academic-105485-koreyst) - **评估模型**。 与 LLMs 合作可能具有挑战性,因为我们并不总是能够控制模型训练的数据。 无论如何,我们应该始终评估模型的性能和输出。 衡量模型的准确性、相似性、基础性和输出的相关性仍然很重要。 这有助于为应用相关人员和用户提供透明度和信任。 @@ -128,7 +128,7 @@ ## 继续学习 -想要了解更多有关如何负责任地使用生成式 AI 进行构建的信息? 转至[进阶学习的页面](../../../13-continued-learning/translations/cn/README.md) 查找有关本章的其他重要资源。 +想要了解更多有关如何负责任地使用生成式 AI 进行构建的信息? 转至[进阶学习的页面](../../../13-continued-learning/translations/cn/README.md?WT.mc_id=academic-105485-koreyst) 查找有关本章的其他重要资源。 -前往第四章,我们将了解 [提示工程基础](../../../04-prompt-engineering-fundamentals/translations/cn/README.md)! +前往第四章,我们将了解 [提示工程基础](../../../04-prompt-engineering-fundamentals/translations/cn/README.md?WT.mc_id=academic-105485-koreyst)! diff --git a/04-prompt-engineering-fundamentals/translations/cn/README.md b/04-prompt-engineering-fundamentals/translations/cn/README.md index e92bbdcd1..e0902c3c9 100644 --- a/04-prompt-engineering-fundamentals/translations/cn/README.md +++ b/04-prompt-engineering-fundamentals/translations/cn/README.md @@ -1,6 +1,6 @@ # 第四章:提示工程基础 -[![Prompt Engineering Fundamentals](../../img/04-lesson-banner.png)](https://youtu.be/r2ItK3UMVTk) +[![Prompt Engineering Fundamentals](../../img/04-lesson-banner.png?WT.mc_id=academic-105485-koreyst)](https://youtu.be/r2ItK3UMVTk?WT.mc_id=academic-105485-koreyst) 如何撰写 LLM 的提示很重要,精心设计的提示可以比不精心设计的提示取得更好的结果。 但这些概念到底是什么,提示、提示工程以及我如何改进我发送给 LLMs 的内容? 诸如此类的问题正是本章和下一章想要解答的。 @@ -48,7 +48,7 @@ _生成式人工智能_能够根据用户请求创建新内容(例如文本、 - **教育者**可能会要求人工智能为目标受众和主题生成教学计划。 AI可以按照指定的格式构建个性化计划。 - **学生**可能会要求人工智能辅导他们学习困难的科目。 人工智能现在可以通过适合学生水平的课程、结合提示和示例来指导学生。 -这只是冰山一角。 查看 [教育中的提示工程](https://github.com/microsoft/prompts-for-edu/tree/main) - 一个由教育专家设计的开源提示库 ! 尝试在沙箱中运行其中一些提示或使用 OpenAI Playground 看看会产生什么结果! +这只是冰山一角。 查看 [教育中的提示工程](https://github.com/microsoft/prompts-for-edu/tree/main?WT.mc_id=academic-105485-koreyst) - 一个由教育专家设计的开源提示库 ! 尝试在沙箱中运行其中一些提示或使用 OpenAI Playground 看看会产生什么结果!