diff --git "a/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/CSS\344\270\216XPath\346\257\224\350\276\203.png" "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/CSS\344\270\216XPath\346\257\224\350\276\203.png"
new file mode 100644
index 0000000..30d4653
Binary files /dev/null and "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/CSS\344\270\216XPath\346\257\224\350\276\203.png" differ
diff --git "a/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/CSS\345\270\270\347\224\250\351\200\211\346\213\251\345\231\250.png" "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/CSS\345\270\270\347\224\250\351\200\211\346\213\251\345\231\250.png"
new file mode 100644
index 0000000..395f98e
Binary files /dev/null and "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/CSS\345\270\270\347\224\250\351\200\211\346\213\251\345\231\250.png" differ
diff --git "a/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/Chrome\345\256\232\344\275\215\345\205\203\347\264\240.png" "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/Chrome\345\256\232\344\275\215\345\205\203\347\264\240.png"
new file mode 100644
index 0000000..4a526c5
Binary files /dev/null and "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/Chrome\345\256\232\344\275\215\345\205\203\347\264\240.png" differ
diff --git "a/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/Chrome\345\274\200\345\217\221\350\200\205\345\267\245\345\205\267.png" "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/Chrome\345\274\200\345\217\221\350\200\205\345\267\245\345\205\267.png"
new file mode 100644
index 0000000..de9c0f3
Binary files /dev/null and "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/Chrome\345\274\200\345\217\221\350\200\205\345\267\245\345\205\267.png" differ
diff --git "a/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/Chrome\346\265\213\350\257\225\351\200\211\346\213\251\345\231\250.png" "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/Chrome\346\265\213\350\257\225\351\200\211\346\213\251\345\231\250.png"
new file mode 100644
index 0000000..99e1e39
Binary files /dev/null and "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/Chrome\346\265\213\350\257\225\351\200\211\346\213\251\345\231\250.png" differ
diff --git "a/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/GET\345\222\214POST\345\257\271\346\257\224.png" "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/GET\345\222\214POST\345\257\271\346\257\224.png"
new file mode 100644
index 0000000..7b38e25
Binary files /dev/null and "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/GET\345\222\214POST\345\257\271\346\257\224.png" differ
diff --git "a/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/HTML\345\270\270\350\247\201\346\240\207\347\255\276.png" "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/HTML\345\270\270\350\247\201\346\240\207\347\255\276.png"
new file mode 100644
index 0000000..fdbd4e9
Binary files /dev/null and "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/HTML\345\270\270\350\247\201\346\240\207\347\255\276.png" differ
diff --git "a/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/HTML\351\200\232\347\224\250\345\261\236\346\200\247.png" "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/HTML\351\200\232\347\224\250\345\261\236\346\200\247.png"
new file mode 100644
index 0000000..a88f1aa
Binary files /dev/null and "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/HTML\351\200\232\347\224\250\345\261\236\346\200\247.png" differ
diff --git "a/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/HTTP\345\237\272\346\234\254\345\216\237\347\220\206.png" "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/HTTP\345\237\272\346\234\254\345\216\237\347\220\206.png"
new file mode 100644
index 0000000..2faebdf
Binary files /dev/null and "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/HTTP\345\237\272\346\234\254\345\216\237\347\220\206.png" differ
diff --git "a/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/XPath\345\270\270\347\224\250\350\267\257\345\276\204.png" "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/XPath\345\270\270\347\224\250\350\267\257\345\276\204.png"
new file mode 100644
index 0000000..635989e
Binary files /dev/null and "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/XPath\345\270\270\347\224\250\350\267\257\345\276\204.png" differ
diff --git "a/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/index.html" "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/index.html"
new file mode 100644
index 0000000..080fd91
--- /dev/null
+++ "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/index.html"
@@ -0,0 +1,649 @@
+
+<!DOCTYPE html>
+<html lang="zh-cn">
+    
+<head>
+    <meta charset="UTF-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="千里之行，始于足下">
+    <title>零基础爬虫入门 - 千里之行，始于足下</title>
+    <meta name="author" content="一瓢清浅">
+    
+        <meta name="keywords" content="python,AI,安全,算法,编程,">
+    
+    
+    
+    <script type="application/ld+json">{"@context":"http://schema.org","@type":"BlogPosting","author":{"@type":"Person","name":"一瓢清浅","sameAs":["#about","https://github.com/"],"image":"photo.jpg"},"articleBody":"\n\n一、原理介绍  网络爬虫，是一种自动浏览网络的计算机程序，即通过指定 URL，直接返回对应网页的数据，而不需要人工点击浏览器链接来获取。不论是机器还是人工，从提交 URL 到看到网页，通常都包含以下步骤：\n\n查找域名对应的服务器地址，向服务器发送请求\n\n服务器响应请求，返回对应网页\n\n解析网页，存储或展示网页内容\n\n\n因此，一个爬虫应该具有抓取、解析、存储三大基本功能：\n\n抓取  是指爬虫需要模拟浏览器，向服务器发起访问请求，并获取服务器返回的响应。\n\n解析  是指爬虫对抓取到的响应体进行解析，从中提取出需要的数据。\n\n存储  是指爬虫将解析出来的数据保存到磁盘或数据库中。\n\n\n\n\nPython 是一种强大而易学的高级编程语言，因为其广泛的通用性，又被称为“万能的胶水语言”。在爬虫方面，Python 提供了丰富的工具库，利用这些工具库，我们可以快速地实现一些爬虫小程序。\n以下列举一些爬虫常用的 Python 库，后续爬虫实践中会用这些库中的部分功能，若要精通这些库的使用，请自行阅读相关文档 ^-^\n1. 请求库\n\nurllib（https://docs.python.org/3/library/urllib.html）\n\nrequests（http://docs.python-requests.org/en/master/）\n\n\n2. 解析库\n\nlxml（https://lxml.de/）\n\nBeautiful Soup（https://www.crummy.com/software/BeautifulSoup/bs4/doc/）\n\n\n3. 存储库\n\nPyMySQL（https://pymysql.readthedocs.io/en/latest/）\n\nPyMongo（https://api.mongodb.com/python/current/）\n\n\n4. 全栈框架\n\nScrapy（https://docs.scrapy.org/en/latest/）\n\n二、相关知识 1. HTTP 基本原理 在浏览器地址栏输入网址，按一下回车键，就可以跳转到我们想要浏览的页面。这是我们日常上网时最常见的操作，这一项看似简单的操作背后蕴含了 HTTP 的基本原理：\n\n\n任何网页在互联网上都有唯一的资源定位，即统一资源定位符（URL）。URL 与网页一一对应，也是访问网页的唯一方式。因此，当我们想在 PC 上浏览一个网页时，我们需要告诉浏览器目标网页的 URL。浏览器在根据我们提供的 URL 找出网页所在的服务器，并向服务器发起访问请求 Request。服务器在接收到请求后，对请求作出响应 Response，返回网页的 HTML 源代码。客户端浏览器接收到 HTML 源代码后，通过对代码进行解析得到我们在浏览器中看到的网页。\nChrome 浏览器提供了一套 Web 开发和调试的工具，通常称为 Chrome 开发者工具，在 Chrome 中打开网页，右键菜单中单击  检查，或者按下 F12 键，都可以进入开发者工具。关于 Chrome 开发者工具的使用见后续章节，这里只介绍利用开发者工具展示访问网页时的请求和响应。\n以 Google 首页为例，按 F12 进入开发者工具，点击 Network 后，在左侧 Name 列表中选取 www.google.com，右侧面板中Headers 栏目下列出了请求 Request 和响应 Response 的头信息。除了头信息，请求 Request 和响应 Response 还包含其他信息。\n\n\n2. 请求 Request请求由客户端发送给服务端，主要包含四部分内容：请求方式（Request Method）、请求链接（Request URL）、请求头（Request Headers）、请求体（Request Body）。\n(1) 请求方式  常见的请求方式有 GET 和 POST 两种：\n\nGET：从指定的资源请求数据\nPOST：向指定的资源提交要被处理的数据\n\n\n\n\nHTTP 方法：GET 对比 POST\n\n(2) 请求链接  请求网页的 URL\n(3) 请求头  请求头是客户端传递给服务器的请求相关的附加信息，常见信息列表如下：\n\n\n(4) 请求体  对于 GET 请求，Request Body 一般为空。对于 POST 请求，Request Body 通常以表单数据 Form Data 的形式提交给服务器。\n3. 响应 Response响应由服务器返回给客户端，主要包含三部分内容：响应状态码（Response Status Code）、响应头（Response Headers）、响应体（Response Body）。\n(1) 响应状态码  响应状态码表示服务器的响应状态。200 表示服务器正常响应，成功返回数据。常见状态码列举如下：\n \n\n(2) 响应头  响应头是服务器传递给客户端的响应相关的附加信息，常见信息列表如下：\n \n\n(3) 响应体  响应体是响应最重要的主体部分，服务器返回的网页数据都包含在响应体中。通过对响应体进行解析，就可以得到我们想要的网页内容。\n三、HTML 语言基础1. HTML 简介HTML（Hyper Text Markup Language）称为超文本标记语言，它使用一套标签来标识网页中文字、按钮、表格、图片、视频等复杂的元素，以及网页中各区块的层次、样式等丰富的格式。\nHTML 标签通常是由尖括号括起来的小写关键词，且成对出现，例如  和，第一个标签是开始标签，第二个标签是结束标签。从开始标签到结束标签构成一个元素，两个标签之间的内容称为元素的内容，HTML 的元素是可以嵌套的。\nHTML 标签定义了元素的类型，常见标签列举如下表：\n\n\n\n为了更丰富地表达元素，HTML 可以为标签设置多种属性。在 HTML 元素的开始标签中，通过 ** 属性名 &#x3D;”属性值”** 这种键值对的方式，为元素定义更多的附加信息。通用属性列举如下：\n\n\n\n注：完整的 HTML 标签和属性参见： HTML 参考手册\n2. HTML 选择器HTML 选择器用来从 HTML 源码中提取目标元素，常用的两种选择器为 CSS 选择器和 XPath 选择器。Chrome 开发者工具提供了定位目标元素以及测试选择器的功能。\n定位目标元素 ：首先点击左上角的小箭头，然后移动鼠标，指向网页上的目标元素，此时Elements 面板中将高亮该目标元素对应的 HTML 源码。\n\n\n\n测试选择器：点击Console，切换到控制台面板，在命令行输入选择器，即可查看提取结果：CSS 格式为 $(‘CSS 选择器’)，XPath 格式为 $x(‘XPath 选择器’)。\n\n\n\n(1) CSS 选择器  常见的 CSS 选择器如下：\n\n\n注：完整的 CSS 选择器参见： CSS 选择器参考手册\n(2) XPath 选择器XML(Extentsible Markup Language)，即可扩展标记语言，也采用一组标签来定义数据，形式与 HTML 非常相似，与 HTML 最大的区别在于 XML 的标签可以自定义。\n注：关于 XML 的更多内容参见：XML 教程\nXPath(XML Path Language)，即 XML 路径语言，最初设计是为了在 XML 文件中查找信息，现在也支持在 HTML 中进行搜索。XPath 定义了 7 种类型的文档节点：元素、属性、文本、命名空间、处理指令、注释以及文档节点，并使用路径表达式在文档中选取节点。\n常见的 Xpath 路径表达式如下：\n\n\n\n注：XPath 教程参见：XPath 教程\n(3) CSS 与 XPath 比较  对比 CSS 选择器与 XPath 选择器，CSS 选择器通常具有更简洁的表达，XPath 选择器则具有更强大的灵活性。\n\n\n\n[译]XPath 和 CSS 选择器 - 紫云飞 - 博客园\n","dateCreated":"2023-01-08T14:05:37+08:00","dateModified":"2024-05-09T13:28:24+08:00","datePublished":"2023-01-08T14:05:37+08:00","description":"从零开始学爬虫","headline":"零基础爬虫入门","image":[],"mainEntityOfPage":{"@type":"WebPage","@id":"https://jiliguluss.github.io/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/"},"publisher":{"@type":"Organization","name":"一瓢清浅","sameAs":["#about","https://github.com/"],"image":"photo.jpg","logo":{"@type":"ImageObject","url":"photo.jpg"}},"url":"https://jiliguluss.github.io/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/","keywords":"Web, 爬虫, python"}</script>
+    <meta name="description" content="从零开始学爬虫">
+<meta property="og:type" content="blog">
+<meta property="og:title" content="零基础爬虫入门">
+<meta property="og:url" content="https://jiliguluss.github.io/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/index.html">
+<meta property="og:site_name" content="千里之行，始于足下">
+<meta property="og:description" content="从零开始学爬虫">
+<meta property="og:locale" content="zh_CN">
+<meta property="og:image" content="https://jiliguluss.github.io/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/%E7%88%AC%E8%99%AB%E5%9F%BA%E6%9C%AC%E5%8E%9F%E7%90%86.png">
+<meta property="og:image" content="https://jiliguluss.github.io/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/HTTP%E5%9F%BA%E6%9C%AC%E5%8E%9F%E7%90%86.png">
+<meta property="og:image" content="https://jiliguluss.github.io/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/Chrome%E5%BC%80%E5%8F%91%E8%80%85%E5%B7%A5%E5%85%B7.png">
+<meta property="og:image" content="https://jiliguluss.github.io/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/GET%E5%92%8CPOST%E5%AF%B9%E6%AF%94.png">
+<meta property="og:image" content="https://jiliguluss.github.io/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/%E8%AF%B7%E6%B1%82%E5%A4%B4.png">
+<meta property="og:image" content="https://jiliguluss.github.io/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/%E5%93%8D%E5%BA%94%E7%8A%B6%E6%80%81%E7%A0%81.png">
+<meta property="og:image" content="https://jiliguluss.github.io/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/%E5%93%8D%E5%BA%94%E5%A4%B4.png">
+<meta property="og:image" content="https://jiliguluss.github.io/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/HTML%E5%B8%B8%E8%A7%81%E6%A0%87%E7%AD%BE.png">
+<meta property="og:image" content="https://jiliguluss.github.io/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/HTML%E9%80%9A%E7%94%A8%E5%B1%9E%E6%80%A7.png">
+<meta property="og:image" content="https://jiliguluss.github.io/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/Chrome%E5%AE%9A%E4%BD%8D%E5%85%83%E7%B4%A0.png">
+<meta property="og:image" content="https://jiliguluss.github.io/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/Chrome%E6%B5%8B%E8%AF%95%E9%80%89%E6%8B%A9%E5%99%A8.png">
+<meta property="og:image" content="https://jiliguluss.github.io/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/CSS%E5%B8%B8%E7%94%A8%E9%80%89%E6%8B%A9%E5%99%A8.png">
+<meta property="og:image" content="https://jiliguluss.github.io/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/XPath%E5%B8%B8%E7%94%A8%E8%B7%AF%E5%BE%84.png">
+<meta property="og:image" content="https://jiliguluss.github.io/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/CSS%E4%B8%8EXPath%E6%AF%94%E8%BE%83.png">
+<meta property="article:published_time" content="2023-01-08T06:05:37.000Z">
+<meta property="article:modified_time" content="2024-05-09T05:28:24.488Z">
+<meta property="article:author" content="一瓢清浅">
+<meta property="article:tag" content="Web">
+<meta property="article:tag" content="爬虫">
+<meta property="article:tag" content="python">
+<meta name="twitter:card" content="summary">
+<meta name="twitter:image" content="https://jiliguluss.github.io/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/%E7%88%AC%E8%99%AB%E5%9F%BA%E6%9C%AC%E5%8E%9F%E7%90%86.png">
+    
+    
+        
+    
+    
+        <meta property="og:image" content="https://jiliguluss.github.io/assets/images/photo.jpg"/>
+    
+    
+    
+    
+    <!--STYLES-->
+    
+<link rel="stylesheet" href="/assets/css/all.css">
+
+    
+<link rel="stylesheet" href="/assets/css/jquery.fancybox.css">
+
+    
+<link rel="stylesheet" href="/assets/css/thumbs.css">
+
+    
+<link rel="stylesheet" href="/assets/css/tranquilpeak.css">
+
+    <!--STYLES END-->
+    
+
+    
+
+    
+        
+    
+</head>
+
+    <body>
+        <div id="blog">
+            <!-- Define author's picture -->
+
+
+<header id="header" data-behavior="5">
+    <i id="btn-open-sidebar" class="fa fa-lg fa-bars"></i>
+    <div class="header-title">
+        <a
+            class="header-title-link"
+            href="/"
+            aria-label=""
+        >
+            千里之行，始于足下
+        </a>
+    </div>
+    
+        
+            <a
+                class="header-right-icon "
+                href="#about"
+                aria-label="打开链接: /#about"
+            >
+        
+        
+            <i class="fa fa-question fa-lg"></i>
+        
+        </a>
+    
+</header>
+
+            <!-- Define author's picture -->
+
+
+
+        
+    
+
+<nav id="sidebar" data-behavior="5">
+    <div class="sidebar-container">
+        
+            <div class="sidebar-profile">
+                <a
+                    href="/#about"
+                    aria-label="阅读有关作者的更多信息"
+                >
+                    <img class="sidebar-profile-picture" src="/assets/images/photo.jpg" alt="作者的图片"/>
+                </a>
+                <h4 class="sidebar-profile-name">一瓢清浅</h4>
+                
+                    <h5 class="sidebar-profile-bio"><p>个人技术博客<br />涉猎开发、测试、数据、算法、安全等领域</p>
+</h5>
+                
+            </div>
+        
+        
+            <ul class="sidebar-buttons">
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/"
+                            
+                            rel="noopener"
+                            title="首页"
+                        >
+                        <i class="sidebar-button-icon fa fa-home" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">首页</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-categories"
+                            
+                            rel="noopener"
+                            title="分类"
+                        >
+                        <i class="sidebar-button-icon fa fa-bookmark" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">分类</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-tags"
+                            
+                            rel="noopener"
+                            title="标签"
+                        >
+                        <i class="sidebar-button-icon fa fa-tags" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">标签</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-archives"
+                            
+                            rel="noopener"
+                            title="归档"
+                        >
+                        <i class="sidebar-button-icon fa fa-archive" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">归档</span>
+                    </a>
+            </li>
+            
+        </ul>
+        
+            <ul class="sidebar-buttons">
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="#about"
+                            
+                            rel="noopener"
+                            title="关于"
+                        >
+                        <i class="sidebar-button-icon fa fa-question" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">关于</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="https://github.com/"
+                            
+                                target="_blank"
+                            
+                            rel="noopener"
+                            title="GitHub"
+                        >
+                        <i class="sidebar-button-icon fab fa-github" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">GitHub</span>
+                    </a>
+            </li>
+            
+        </ul>
+        
+    </div>
+</nav>
+
+            
+            <div id="main" data-behavior="5"
+                 class="
+                        hasCoverMetaIn
+                        ">
+                
+    <link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/tocbot/4.25.0/tocbot.css">
+    <style>
+        #post-toc {
+            position: fixed !important;
+            top: 80px;
+            padding: 10px;
+            z-index: 100;
+            background-color: rgba(255,255,255,0);
+            transform: translateX(0);
+            right: 4%;
+            width: 240px;
+            height: auto;
+            padding-top: 10px;
+            padding-bottom: 10px;
+        }
+    </style>
+    <div id="post-toc" class="toc"></div>
+
+                
+<article class="post">
+    
+    
+        <div class="post-header main-content-wrap text-left">
+    
+        <h1 class="post-title">
+            零基础爬虫入门
+        </h1>
+    
+    
+        <div class="post-meta">
+    <time datetime="2023-01-08T14:05:37+08:00">
+	
+		    2023 年 1 月 8 日
+    	
+    </time>
+    
+        <span>发布在 </span>
+        
+    <a class="category-link" href="/categories/%E5%BC%80%E5%8F%91/">开发</a>, <a class="category-link" href="/categories/%E5%BC%80%E5%8F%91/%E7%88%AC%E8%99%AB/">爬虫</a>
+
+
+    
+</div>
+
+    
+</div>
+
+    
+    <div class="post-content markdown">
+        <div class="main-content-wrap">
+            <!--excerpt-->
+
+<h2 id="一、原理介绍"><a href="# 一、原理介绍" class="headerlink" title="一、原理介绍"></a>一、原理介绍 </h2><p> 网络爬虫，是一种自动浏览网络的计算机程序，即通过指定 URL，直接返回对应网页的数据，而不需要人工点击浏览器链接来获取。不论是机器还是人工，从提交 URL 到看到网页，通常都包含以下步骤：</p>
+<ol>
+<li><p>查找域名对应的服务器地址，向服务器发送请求</p>
+</li>
+<li><p>服务器响应请求，返回对应网页</p>
+</li>
+<li><p>解析网页，存储或展示网页内容</p>
+</li>
+</ol>
+<p>因此，一个爬虫应该具有抓取、解析、存储三大基本功能：</p>
+<ul>
+<li><p><strong>抓取 </strong> 是指爬虫需要模拟浏览器，向服务器发起访问请求，并获取服务器返回的响应。</p>
+</li>
+<li><p><strong>解析 </strong> 是指爬虫对抓取到的响应体进行解析，从中提取出需要的数据。</p>
+</li>
+<li><p><strong>存储 </strong> 是指爬虫将解析出来的数据保存到磁盘或数据库中。</p>
+</li>
+</ul>
+<img src="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/%E7%88%AC%E8%99%AB%E5%9F%BA%E6%9C%AC%E5%8E%9F%E7%90%86.png" class=""title=" 爬虫基本原理 ">
+
+<p>Python 是一种强大而易学的高级编程语言，因为其广泛的通用性，又被称为“万能的胶水语言”。在爬虫方面，Python 提供了丰富的工具库，利用这些工具库，我们可以快速地实现一些爬虫小程序。</p>
+<p>以下列举一些爬虫常用的 Python 库，后续爬虫实践中会用这些库中的部分功能，若要精通这些库的使用，请自行阅读相关文档 ^-^</p>
+<p><strong>1. 请求库</strong></p>
+<ul>
+<li><p>urllib（<a target="_blank" rel="noopener" href="https://docs.python.org/3/library/urllib.html">https://docs.python.org/3/library/urllib.html</a>）</p>
+</li>
+<li><p>requests（<a target="_blank" rel="noopener" href="http://docs.python-requests.org/en/master/">http://docs.python-requests.org/en/master/</a>）</p>
+</li>
+</ul>
+<p><strong>2. 解析库</strong></p>
+<ul>
+<li><p>lxml（<a target="_blank" rel="noopener" href="https://lxml.de/">https://lxml.de/</a>）</p>
+</li>
+<li><p>Beautiful Soup（<a target="_blank" rel="noopener" href="https://www.crummy.com/software/BeautifulSoup/bs4/doc/">https://www.crummy.com/software/BeautifulSoup/bs4/doc/</a>）</p>
+</li>
+</ul>
+<p><strong>3. 存储库</strong></p>
+<ul>
+<li><p>PyMySQL（<a target="_blank" rel="noopener" href="https://pymysql.readthedocs.io/en/latest/">https://pymysql.readthedocs.io/en/latest/</a>）</p>
+</li>
+<li><p>PyMongo（<a target="_blank" rel="noopener" href="https://api.mongodb.com/python/current/">https://api.mongodb.com/python/current/</a>）</p>
+</li>
+</ul>
+<p><strong>4. 全栈框架</strong></p>
+<ul>
+<li>Scrapy（<a target="_blank" rel="noopener" href="https://docs.scrapy.org/en/latest/">https://docs.scrapy.org/en/latest/</a>）</li>
+</ul>
+<h2 id="二、相关知识"><a href="# 二、相关知识" class="headerlink" title="二、相关知识"></a>二、相关知识 </h2><h3 id="1-HTTP 基本原理"><a href="#1-HTTP 基本原理" class="headerlink" title="1. HTTP 基本原理"></a>1. HTTP 基本原理</h3><p> 在浏览器地址栏输入网址，按一下回车键，就可以跳转到我们想要浏览的页面。这是我们日常上网时最常见的操作，这一项看似简单的操作背后蕴含了 HTTP 的基本原理：</p>
+<img src="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/HTTP%E5%9F%BA%E6%9C%AC%E5%8E%9F%E7%90%86.png" class=""title="HTTP 基本原理 ">
+
+<p>任何网页在互联网上都有唯一的资源定位，即统一资源定位符（URL）。URL 与网页一一对应，也是访问网页的唯一方式。因此，当我们想在 PC 上浏览一个网页时，我们需要告诉浏览器目标网页的 URL。浏览器在根据我们提供的 URL 找出网页所在的服务器，并向服务器发起访问请求 Request。服务器在接收到请求后，对请求作出响应 Response，返回网页的 HTML 源代码。客户端浏览器接收到 HTML 源代码后，通过对代码进行解析得到我们在浏览器中看到的网页。</p>
+<p>Chrome 浏览器提供了一套 Web 开发和调试的工具，通常称为 Chrome 开发者工具，在 Chrome 中打开网页，右键菜单中单击 <code> 检查</code>，或者按下 F12 键，都可以进入开发者工具。关于 Chrome 开发者工具的使用见后续章节，这里只介绍利用开发者工具展示访问网页时的请求和响应。</p>
+<p>以 Google 首页为例，按 F12 进入开发者工具，点击 <code>Network</code> 后，在左侧 <code>Name</code> 列表中选取 <code>www.google.com</code>，右侧面板中<code>Headers</code> 栏目下列出了请求 Request 和响应 Response 的头信息。除了头信息，请求 Request 和响应 Response 还包含其他信息。</p>
+<img src="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/Chrome%E5%BC%80%E5%8F%91%E8%80%85%E5%B7%A5%E5%85%B7.png" class=""title="Chrome 开发者工具 ">
+
+<h3 id="2- 请求 -Request"><a href="#2- 请求 -Request" class="headerlink" title="2. 请求 Request"></a>2. 请求 Request</h3><p>请求由客户端发送给服务端，主要包含四部分内容：请求方式（Request Method）、请求链接（Request URL）、请求头（Request Headers）、请求体（Request Body）。</p>
+<h4 id="1- 请求方式"><a href="#1- 请求方式" class="headerlink" title="(1) 请求方式"></a>(1) 请求方式 </h4><p> 常见的请求方式有 GET 和 POST 两种：</p>
+<ul>
+<li>GET：从指定的资源请求数据</li>
+<li>POST：向指定的资源提交要被处理的数据</li>
+</ul>
+<img src="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/GET%E5%92%8CPOST%E5%AF%B9%E6%AF%94.png" class=""title="GET 和 POST 对比 ">
+
+<blockquote>
+<p><a target="_blank" rel="noopener" href="http://www.w3school.com.cn/tags/html_ref_httpmethods.asp">HTTP 方法：GET 对比 POST</a></p>
+</blockquote>
+<h4 id="2- 请求链接"><a href="#2- 请求链接" class="headerlink" title="(2) 请求链接"></a>(2) 请求链接 </h4><p> 请求网页的 URL</p>
+<h4 id="3- 请求头"><a href="#3- 请求头" class="headerlink" title="(3) 请求头"></a>(3) 请求头 </h4><p> 请求头是客户端传递给服务器的请求相关的附加信息，常见信息列表如下：</p>
+<img src="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/%E8%AF%B7%E6%B1%82%E5%A4%B4.png" class=""title=" 请求头 ">
+
+<h4 id="4- 请求体"><a href="#4- 请求体" class="headerlink" title="(4) 请求体"></a>(4) 请求体 </h4><p> 对于 GET 请求，Request Body 一般为空。对于 POST 请求，Request Body 通常以表单数据 Form Data 的形式提交给服务器。</p>
+<h3 id="3- 响应 -Response"><a href="#3- 响应 -Response" class="headerlink" title="3. 响应 Response"></a>3. 响应 Response</h3><p>响应由服务器返回给客户端，主要包含三部分内容：响应状态码（Response Status Code）、响应头（Response Headers）、响应体（Response Body）。</p>
+<h4 id="1- 响应状态码"><a href="#1- 响应状态码" class="headerlink" title="(1) 响应状态码"></a>(1) 响应状态码 </h4><p> 响应状态码表示服务器的响应状态。200 表示服务器正常响应，成功返回数据。常见状态码列举如下：</p>
+<img src="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/%E5%93%8D%E5%BA%94%E7%8A%B6%E6%80%81%E7%A0%81.png" class=""title=" 响应状态码 "> 
+
+<h4 id="2- 响应头"><a href="#2- 响应头" class="headerlink" title="(2) 响应头"></a>(2) 响应头 </h4><p> 响应头是服务器传递给客户端的响应相关的附加信息，常见信息列表如下：</p>
+<img src="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/%E5%93%8D%E5%BA%94%E5%A4%B4.png" class=""title=" 响应头 "> 
+
+<h4 id="3- 响应体"><a href="#3- 响应体" class="headerlink" title="(3) 响应体"></a>(3) 响应体 </h4><p> 响应体是响应最重要的主体部分，服务器返回的网页数据都包含在响应体中。通过对响应体进行解析，就可以得到我们想要的网页内容。</p>
+<h2 id="三、HTML 语言基础"><a href="# 三、HTML 语言基础" class="headerlink" title="三、HTML 语言基础"></a>三、HTML 语言基础</h2><h3 id="1-HTML 简介"><a href="#1-HTML 简介" class="headerlink" title="1. HTML 简介"></a>1. HTML 简介</h3><p>HTML（Hyper Text Markup Language）称为超文本标记语言，它使用一套标签来标识网页中文字、按钮、表格、图片、视频等复杂的元素，以及网页中各区块的层次、样式等丰富的格式。</p>
+<p>HTML 标签通常是由尖括号括起来的小写关键词，且成对出现，例如 <html> 和</html>，第一个标签是开始标签，第二个标签是结束标签。从开始标签到结束标签构成一个元素，两个标签之间的内容称为元素的内容，HTML 的元素是可以嵌套的。</p>
+<p>HTML 标签定义了元素的类型，常见标签列举如下表：</p>
+<img src="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/HTML%E5%B8%B8%E8%A7%81%E6%A0%87%E7%AD%BE.png" class=""title="HTML 常见标签 ">
+
+
+<p>为了更丰富地表达元素，HTML 可以为标签设置多种属性。在 HTML 元素的开始标签中，通过 ** 属性名 &#x3D;”属性值”** 这种键值对的方式，为元素定义更多的附加信息。通用属性列举如下：</p>
+<img src="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/HTML%E9%80%9A%E7%94%A8%E5%B1%9E%E6%80%A7.png" class=""title="HTML 通用属性 ">
+
+
+<p>注：完整的 HTML 标签和属性参见： <a target="_blank" rel="noopener" href="http://www.w3school.com.cn/tags/index.asp">HTML 参考手册</a></p>
+<h3 id="2-HTML 选择器"><a href="#2-HTML 选择器" class="headerlink" title="2. HTML 选择器"></a>2. HTML 选择器</h3><p>HTML 选择器用来从 HTML 源码中提取目标元素，常用的两种选择器为 CSS 选择器和 XPath 选择器。Chrome 开发者工具提供了定位目标元素以及测试选择器的功能。</p>
+<p><strong>定位目标元素 </strong>：首先点击左上角的小箭头，然后移动鼠标，指向网页上的目标元素，此时<code>Elements</code> 面板中将高亮该目标元素对应的 HTML 源码。</p>
+<img src="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/Chrome%E5%AE%9A%E4%BD%8D%E5%85%83%E7%B4%A0.png" class=""title="Chrome 定位元素 ">
+
+
+<p><strong>测试选择器</strong>：点击<code>Console</code>，切换到控制台面板，在命令行输入选择器，即可查看提取结果：CSS 格式为 $(‘CSS 选择器’)，XPath 格式为 $x(‘XPath 选择器’)。</p>
+<img src="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/Chrome%E6%B5%8B%E8%AF%95%E9%80%89%E6%8B%A9%E5%99%A8.png" class=""title="Chrome 测试选择器 ">
+
+
+<h4 id="1-CSS 选择器"><a href="#1-CSS 选择器" class="headerlink" title="(1) CSS 选择器"></a>(1) CSS 选择器 </h4><p> 常见的 CSS 选择器如下：</p>
+<img src="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/CSS%E5%B8%B8%E7%94%A8%E9%80%89%E6%8B%A9%E5%99%A8.png" class=""title="CSS 常用选择器 ">
+
+<p>注：完整的 CSS 选择器参见： <a target="_blank" rel="noopener" href="http://www.w3school.com.cn/cssref/css_selectors.asp">CSS 选择器参考手册</a></p>
+<h4 id="2-XPath 选择器"><a href="#2-XPath 选择器" class="headerlink" title="(2) XPath 选择器"></a>(2) XPath 选择器</h4><p>XML(Extentsible Markup Language)，即可扩展标记语言，也采用一组标签来定义数据，形式与 HTML 非常相似，与 HTML 最大的区别在于 XML 的标签可以自定义。</p>
+<p>注：关于 XML 的更多内容参见：<a target="_blank" rel="noopener" href="http://www.w3school.com.cn/xml/index.asp">XML 教程</a></p>
+<p>XPath(XML Path Language)，即 XML 路径语言，最初设计是为了在 XML 文件中查找信息，现在也支持在 HTML 中进行搜索。XPath 定义了 7 种类型的文档节点：元素、属性、文本、命名空间、处理指令、注释以及文档节点，并使用路径表达式在文档中选取节点。</p>
+<p>常见的 Xpath 路径表达式如下：</p>
+<img src="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/XPath%E5%B8%B8%E7%94%A8%E8%B7%AF%E5%BE%84.png" class=""title="XPath 常用路径 ">
+
+
+<p>注：XPath 教程参见：<a target="_blank" rel="noopener" href="http://www.w3school.com.cn/xpath/index.asp">XPath 教程</a></p>
+<h4 id="3-CSS 与 XPath 比较"><a href="#3-CSS 与 XPath 比较" class="headerlink" title="(3) CSS 与 XPath 比较"></a>(3) CSS 与 XPath 比较 </h4><p> 对比 CSS 选择器与 XPath 选择器，CSS 选择器通常具有更简洁的表达，XPath 选择器则具有更强大的灵活性。</p>
+<img src="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/CSS%E4%B8%8EXPath%E6%AF%94%E8%BE%83.png" class=""title="CSS 与 XPath 比较 ">
+
+<blockquote>
+<p><a target="_blank" rel="noopener" href="http://www.cnblogs.com/ziyunfei/archive/2012/10/05/2710631.html">[译]XPath 和 CSS 选择器 - 紫云飞 - 博客园</a></p>
+</blockquote>
+            
+
+
+            
+        </div>
+    </div>
+    <div id="post-footer" class="post-footer main-content-wrap">
+        
+            <div class="post-footer-tags">
+                <span class="text-color-light text-small">标签</span><br/>
+                
+    <a class="tag tag--primary tag--small t-none-link" href="/tags/Web/" rel="tag">Web</a> <a class="tag tag--primary tag--small t-none-link" href="/tags/python/" rel="tag">python</a> <a class="tag tag--primary tag--small t-none-link" href="/tags/%E7%88%AC%E8%99%AB/" rel="tag">爬虫</a>
+
+            </div>
+        
+        
+            <div class="post-actions-wrap">
+    <nav>
+        <ul class="post-actions post-action-nav">
+            <li class="post-action">
+                
+                    
+                <a
+                    class="post-action-btn btn btn--default tooltip--top"
+                    href="/2023/04/23/CPP%E6%99%BA%E8%83%BD%E6%8C%87%E9%92%88/"
+                    data-tooltip="C++ 智能指针：shared_ptr 和 weak_ptr"
+                    aria-label="上一篇: C++ 智能指针：shared_ptr 和 weak_ptr"
+                >
+                    
+                        <i class="fa fa-angle-left" aria-hidden="true"></i>
+                        <span class="hide-xs hide-sm text-small icon-ml">上一篇</span>
+                    </a>
+            </li>
+            <li class="post-action">
+                
+                    <a
+                        class="post-action-btn btn btn--disabled"
+                        aria-hidden="true"
+                    >
+                        
+                        <span class="hide-xs hide-sm text-small icon-mr">下一篇</span>
+                        <i class="fa fa-angle-right" aria-hidden="true"></i>
+                    </a>
+            </li>
+        </ul>
+    </nav>
+    <ul class="post-actions post-action-share">
+        <li class="post-action hide-lg hide-md hide-sm">
+            <a
+                class="post-action-btn btn btn--default btn-open-shareoptions"
+                href="#btn-open-shareoptions"
+                aria-label="Share this post"
+            >
+                <i class="fa fa-share-alt" aria-hidden="true"></i>
+            </a>
+        </li>
+        
+        
+            
+        
+        <li class="post-action">
+            
+                <a class="post-action-btn btn btn--default" href="#" aria-label="Back to top">
+            
+                <i class="fa fa-list" aria-hidden="true"></i>
+            </a>
+        </li>
+    </ul>
+</div>
+
+
+        
+        
+            
+        
+    </div>
+</article>
+
+
+
+                <footer id="footer" class="main-content-wrap">
+    <span class="copyrights">
+        Copyrights &copy; 2024 一瓢清浅. All Rights Reserved.
+    </span>
+</footer>
+
+            </div>
+            
+                <div id="bottom-bar" class="post-bottom-bar" data-behavior="5">
+                    <div class="post-actions-wrap">
+    <nav>
+        <ul class="post-actions post-action-nav">
+            <li class="post-action">
+                
+                    
+                <a
+                    class="post-action-btn btn btn--default tooltip--top"
+                    href="/2023/04/23/CPP%E6%99%BA%E8%83%BD%E6%8C%87%E9%92%88/"
+                    data-tooltip="C++ 智能指针：shared_ptr 和 weak_ptr"
+                    aria-label="上一篇: C++ 智能指针：shared_ptr 和 weak_ptr"
+                >
+                    
+                        <i class="fa fa-angle-left" aria-hidden="true"></i>
+                        <span class="hide-xs hide-sm text-small icon-ml">上一篇</span>
+                    </a>
+            </li>
+            <li class="post-action">
+                
+                    <a
+                        class="post-action-btn btn btn--disabled"
+                        aria-hidden="true"
+                    >
+                        
+                        <span class="hide-xs hide-sm text-small icon-mr">下一篇</span>
+                        <i class="fa fa-angle-right" aria-hidden="true"></i>
+                    </a>
+            </li>
+        </ul>
+    </nav>
+    <ul class="post-actions post-action-share">
+        <li class="post-action hide-lg hide-md hide-sm">
+            <a
+                class="post-action-btn btn btn--default btn-open-shareoptions"
+                href="#btn-open-shareoptions"
+                aria-label="Share this post"
+            >
+                <i class="fa fa-share-alt" aria-hidden="true"></i>
+            </a>
+        </li>
+        
+        
+            
+        
+        <li class="post-action">
+            
+                <a class="post-action-btn btn btn--default" href="#" aria-label="Back to top">
+            
+                <i class="fa fa-list" aria-hidden="true"></i>
+            </a>
+        </li>
+    </ul>
+</div>
+
+
+                </div>
+                
+
+            
+        </div>
+        
+
+
+    
+        
+    
+
+<div id="about">
+    <div id="about-card">
+        <div id="about-btn-close">
+            <i class="fa fa-times"></i>
+        </div>
+        
+            <img id="about-card-picture" src="/assets/images/photo.jpg" alt="作者的图片"/>
+        
+            <h4 id="about-card-name">一瓢清浅</h4>
+        
+            <div id="about-card-bio"><p>个人技术博客<br />涉猎开发、测试、数据、算法、安全等领域</p>
+</div>
+        
+        
+            <div id="about-card-job">
+                <i class="fa fa-briefcase"></i>
+                <br/>
+                <p>IT工程师</p>
+
+            </div>
+        
+        
+            <div id="about-card-location">
+                <i class="fa fa-map-marker-alt"></i>
+                <br/>
+                中国
+            </div>
+        
+    </div>
+</div>
+
+        
+        
+<div id="cover" style="background-image:url('/assets/images/cover.png');"></div>
+        <!--SCRIPTS-->
+
+<script src="/assets/js/jquery.js"></script>
+
+
+<script src="/assets/js/jquery.fancybox.js"></script>
+
+
+<script src="/assets/js/thumbs.js"></script>
+
+
+<script src="/assets/js/tranquilpeak.js"></script>
+
+<!--SCRIPTS END-->
+
+
+    
+      <script src='https://unpkg.com/mermaid@9.0.0/dist/mermaid.min.js'></script> 
+      <script type="text/javascript">
+          $(document).ready(function() {
+              var mermaid_config = {
+                  startOnLoad: true,
+                  theme: 'default',
+                  flowchart:{
+                      useMaxWidth: true,
+                      htmlLabels: true
+                  }                
+              }
+              mermaid.initialize(mermaid_config);
+          });
+      </script> 
+    
+
+
+
+
+
+  <script src="https://cdn.jsdelivr.net/npm/tocbot@4.25.0/dist/tocbot.min.js"></script> 
+  <script type="text/javascript">
+      tocbot.init({
+        tocSelector: '#post-toc', // 目录容器的 ID 或 class
+        contentSelector: '.post-content', // 内容容器的 ID 或 class
+        headingSelector: 'h2,h3', // 你想要包含在目录中的标题级别
+        collapseDepth: 3,
+        scrollSmooth: true, 
+        activeClass: 'active', 
+        orderedList: false
+    });
+  </script> 
+
+
+    </body>
+</html>
diff --git "a/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/scrapy\345\210\235\345\247\213\345\214\226\351\241\271\347\233\256.png" "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/scrapy\345\210\235\345\247\213\345\214\226\351\241\271\347\233\256.png"
new file mode 100644
index 0000000..e392ec0
Binary files /dev/null and "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/scrapy\345\210\235\345\247\213\345\214\226\351\241\271\347\233\256.png" differ
diff --git "a/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/scrapy\351\241\271\347\233\256\346\241\206\346\236\266.png" "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/scrapy\351\241\271\347\233\256\346\241\206\346\236\266.png"
new file mode 100644
index 0000000..56a7f5c
Binary files /dev/null and "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/scrapy\351\241\271\347\233\256\346\241\206\346\236\266.png" differ
diff --git "a/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/\345\223\215\345\272\224\345\244\264.png" "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/\345\223\215\345\272\224\345\244\264.png"
new file mode 100644
index 0000000..8e9d8dd
Binary files /dev/null and "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/\345\223\215\345\272\224\345\244\264.png" differ
diff --git "a/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/\345\223\215\345\272\224\347\212\266\346\200\201\347\240\201.png" "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/\345\223\215\345\272\224\347\212\266\346\200\201\347\240\201.png"
new file mode 100644
index 0000000..75b152f
Binary files /dev/null and "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/\345\223\215\345\272\224\347\212\266\346\200\201\347\240\201.png" differ
diff --git "a/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/\347\210\254\350\231\253\345\237\272\346\234\254\345\216\237\347\220\206.png" "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/\347\210\254\350\231\253\345\237\272\346\234\254\345\216\237\347\220\206.png"
new file mode 100644
index 0000000..5df6463
Binary files /dev/null and "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/\347\210\254\350\231\253\345\237\272\346\234\254\345\216\237\347\220\206.png" differ
diff --git "a/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/\350\257\267\346\261\202\345\244\264.png" "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/\350\257\267\346\261\202\345\244\264.png"
new file mode 100644
index 0000000..791313e
Binary files /dev/null and "b/2023/01/08/\351\233\266\345\237\272\347\241\200\347\210\254\350\231\253\345\205\245\351\227\250/\350\257\267\346\261\202\345\244\264.png" differ
diff --git "a/2023/04/23/CPP\346\231\272\350\203\275\346\214\207\351\222\210/index.html" "b/2023/04/23/CPP\346\231\272\350\203\275\346\214\207\351\222\210/index.html"
index e9813cc..e9ed841 100644
--- "a/2023/04/23/CPP\346\231\272\350\203\275\346\214\207\351\222\210/index.html"
+++ "b/2023/04/23/CPP\346\231\272\350\203\275\346\214\207\351\222\210/index.html"
@@ -377,11 +377,14 @@ <h2 id="总结"><a href="# 总结" class="headerlink" title="总结"></a>总结<
             </li>
             <li class="post-action">
                 
-                    <a
-                        class="post-action-btn btn btn--disabled"
-                        aria-hidden="true"
-                    >
-                        
+                    
+                <a
+                    class="post-action-btn btn btn--default tooltip--top"
+                    href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/"
+                    data-tooltip="零基础爬虫入门"
+                    aria-label="下一篇: 零基础爬虫入门"
+                >
+                    
                         <span class="hide-xs hide-sm text-small icon-mr">下一篇</span>
                         <i class="fa fa-angle-right" aria-hidden="true"></i>
                     </a>
@@ -450,11 +453,14 @@ <h2 id="总结"><a href="# 总结" class="headerlink" title="总结"></a>总结<
             </li>
             <li class="post-action">
                 
-                    <a
-                        class="post-action-btn btn btn--disabled"
-                        aria-hidden="true"
-                    >
-                        
+                    
+                <a
+                    class="post-action-btn btn btn--default tooltip--top"
+                    href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/"
+                    data-tooltip="零基础爬虫入门"
+                    aria-label="下一篇: 零基础爬虫入门"
+                >
+                    
                         <span class="hide-xs hide-sm text-small icon-mr">下一篇</span>
                         <i class="fa fa-angle-right" aria-hidden="true"></i>
                     </a>
diff --git "a/2023/09/17/LibFuzzer\344\275\277\347\224\250\350\257\264\346\230\216/index.html" "b/2023/09/17/LibFuzzer\344\275\277\347\224\250\350\257\264\346\230\216/index.html"
index 6bd96e7..a60d0d7 100644
--- "a/2023/09/17/LibFuzzer\344\275\277\347\224\250\350\257\264\346\230\216/index.html"
+++ "b/2023/09/17/LibFuzzer\344\275\277\347\224\250\350\257\264\346\230\216/index.html"
@@ -13,7 +13,7 @@
     
     
     
-    <script type="application/ld+json">{"@context":"http://schema.org","@type":"BlogPosting","author":{"@type":"Person","name":"一瓢清浅","sameAs":["#about","https://github.com/"],"image":"photo.jpg"},"articleBody":"\n\n按照  官方定义，LibFuzzer 是一个in-process（进程内的），coverage-guided（以覆盖率为引导的），evolutionary（进化的） 的 fuzz 引擎，是 LLVM 项目的一部分，主要用于对 C&#x2F;C++ 程序进行 Fuzz 测试。LibFuzzer 三个特性的具体含义为：\n\nin-process：不会为每个测试用例启动一个进程，而是将所有的测试数据投放在同一个进程的内存空间中\n\ncoverage-guided：对每一个测试输入都进行代码覆盖率计算，不断累积测试用例使得代码覆盖率最大化\n\nevolutionary：结合了变异和生成两种形势的 Fuzz 引擎\n\n变异：基于已有的数据样本，通过一些变异规则，产生新的测试用例\n\n生成：通过对目标协议或接口规范进行建模，从零开始产生测试用例\n\n\n\n\nLibFuzzer 与待测的 library 进行链接，通过向指定的 fuzzing 入口（即target 函数）发送测试数据，并跟踪被触达的代码区域，然后对输入的数据进行变异，以达到代码覆盖率最大的目的，其中代码覆盖率的信息由 LLVM 的 SanitizerCoverage 工具提供。\n一、使用方法 1. 安装环境Clang 是一个类似 GCC 的 C&#x2F;C++ 语言编译工具，此处 简介。LibFuzzer 现在已被集成到 Clang 6.0 之后的版本中，在 Linux 环境下，只需直接安装 Clang 即可：\n1apt install clang\n\n安装完毕之后，可以通过如下命令查看 clang 版本：\n1clang --version\n\n2. 构建 target使用 LibFuzzer 时，第一步就是要实现 target 函数——LLVMFuzzerTestOneInput，该函数以 bytes 数组作为输入，函数体内使用待测 API 对这个 bytes 数组进行处理：\n12345// fuzz_target.ccextern &quot;C&quot; int LLVMFuzzerTestOneInput(const uint8_t *Data, size_t Size) &#123;  DoSomethingInterestingWithMyAPI(Data, Size);  return 0;  // Values other than 0 and -1 are reserved for future use.&#125;\n\ntarget 函数的名称、参数类型、返回值类型都不能改变。此外，官方文档中还有如下说明：\n\ntarget 函数在同一个进程中被多次执行，被不同的输入循环调用；\n\ntarget 函数需要容忍任何形势的输入，比如空数据、很长的数据、格式错误的数据等；\n\ntarget 函数不允许调用 exit 函数，否则将导致 Fuzz 终止执行；\n\ntarget 函数中可以使用线程，但是子线程要在函数体结束前 join，即进入下一次循环前，结束上一次循环的子线程；\n\ntarget 函数的结果必须是确定性的，即两次的 Data 如果一致，两次的执行结果也必须一致；\n\ntarget 函数执行速度必须快，避免三阶及以上的复杂度、日志记录和过多的内存消耗；\n\ntarget 函数应尽量避免修改全局状态，因为在同一个进程中修改全局变量，会导致下一次运行与上一次运行的上下文不同，可能影响程序确定性；\n\ntarget 函数的处理范围越窄越好，如果函数要处理多种数据格式，那最好拆分成多个子函数，每个子函数处理一种格式。\n\n\ntarget 函数编写完成后，通过以下命令编译成可执行文件：\n1234clang -g -O1 -fsanitize=fuzzer                         fuzz_target.cc # Builds the fuzz target w/o sanitizersclang -g -O1 -fsanitize=fuzzer,address                 fuzz_target.cc # Builds the fuzz target with ASANclang -g -O1 -fsanitize=fuzzer,signed-integer-overflow fuzz_target.cc # Builds the fuzz target with a part of UBSANclang -g -O1 -fsanitize=fuzzer,memory                  fuzz_target.cc # Builds the fuzz target with MSAN\n\nClang 支持的编译选项可以  参考文档  或者通过–help 查看，构建 LibFuzzer target 时常用的  编译选项  如下：\n\n-g：生成调试信息\n\n-O：设置编译器优化等级，可以是 1&#x2F;2&#x2F;3，默认为 1，数字越大，优化越多，注意2 和 3 有可能导致 Fuzz 找不到 crash\n\n-o：指定输出文件名\n\n-I：uppercase i，添加头文件搜索路径\n\n-L：添加库文件搜索路径\n\n-l：lowercase L，指定库文件名称，动态库和静态库同时存在时，动态库优先\n\n-fsanitize：启用 LibFuzzer，对源码进行插桩，并添加各种  消毒器 sanitizer，对程序进行运行时检查。\n\n-fsanitize&#x3D;fuzzer  编译时对源码插桩，链接 libFuzzer 库文件（使用 libFuzzer 的 main 函数）\n\n-fsanitize&#x3D;fuzzer-no-link  编译时对源码插桩，不链接 libFuzzer，适用于拥有 main 函数的源码。对大型项目来说，构建效率更高\n\n-fsanitize&#x3D;address  地址消毒器（AddressSanitizer），用于检测缓冲区溢出、UAF、Double Free、内存泄漏等内存问题\n\n-fsanitize&#x3D;memory  内存消毒器（MemorySanitizer），用于检测未初始化的内存访问\n\n-fsanitize&#x3D;undefined  未定义行为消毒器（UndefinedBehaviorSanitizer），用于检测程序运行中未定义行为，如越界访问、整数溢出、空指针解引用等\n\n\n\n-fsanitize-coverage：启用代码覆盖率的统计，包括 function 级别，basic block 级别和 edge 级别，详情可  参考文档 。但需要注意的是， 高版本的 clang 中，已经取消了对 -fsanitize-coverage&#x3D;trace-pc-guard 的支持，建议改用 -fsanitize&#x3D;fuzzer 替代，否则会出现报错，参见第二章节使用示例。\n\n-fsanitize-coverage&#x3D;trace-pc-guard,edge  使用 edge 级别代码覆盖率，edge 为默认级别，可省略\n\n-fsanitize-coverage&#x3D;trace-pc-guard,func  使用 function 级别代码覆盖率\n\n-fsanitize-coverage&#x3D;trace-pc-guard,bb  使用 basic block 级别代码覆盖率\n\n\n\n\n关于添加 LibFuzzer 相关选项后的详细构建过程，有兴趣可以参考libFuzzer 编译链接。\n关于 LibFuzzer 通过插桩统计代码覆盖率的具体实现，有兴趣可以参考Coverage Control in libFuzzer。\n3. 执行 fuzz在 target 函数构建成功后，会生成一个可执行的 fuzz 二进制文件，该文件通过命令行方式执行，可以接受指定的参数选项。执行格式为：\n1./fuzz-target -flag1=val1 -flag2=val2 ... path1 path2 ...\n\n在不限制运行时长的情况下，Fuzz 将会一直执行下去，直到出现 crash（通常是因为触发 sanitizer 异常）才会终止。导致 crash 的输入将会作为能触发 bug 的 testcase 保存到磁盘上，并根据 crash 的类型，用不同的文件名前缀进行区分，比如 crash-XXX，leak-XXX，timeout-XXX 等。\n(1) 参数说明  常见的 flag 选项及作用列举如下，使用 flag 时必须以 -flag&#x3D;val 的格式：\n\n\n\nflag\n默认值\n作用\n\n\n\nverbosity\n1\n运行时输出详细日志\n\n\nseed\n0\n随机种子。如果为 0，则自动生成随机种子\n\n\nruns\n-1\n测试运行的次数（-1 表示无限）\n\n\nmax_len\n0\n测试输入的最大长度。若为 0，libFuzzer 会自行猜测\n\n\nshuffle\n1\n为 1 表示启动时打乱初始语料库\n\n\nprefer_small\n1\n为 1 表示打乱语料库时，较小输入更优先\n\n\ntimeout\n1200\n超时时长，单位为秒。如果单次运行超过时长，Fuzz 将被终止\n\n\nmax_total_time\n0\n最大运行时长，单位为秒。若为正，表示 Fuzz 最长运行时间\n\n\nhelp\n0\n为 1 表示打印帮助信息\n\n\nmerge\n0\n为 1 表示在不损失代码覆盖率的情况下，进行语料库合并\n\n\nmerge_control_file\n0\n指定合并进程的控制文件，用于恢复合并状态\n\n\nminimize_crash\n0\n为 1 表示将提供的崩溃输入进行最小化。与 -runs &#x3D; N 或 -max_total_time &#x3D; N 一起使用以限制尝试次数\n\n\njobs\n0\njob 的数量，多个 job 将被分配到 workers 上执行，每个 job 的 stdout&#x2F;stderr 被重定向到 fuzz-&lt;JOB&gt;.log\n\n\nworkers\n0\nworker 的数量，为 0 将使用 min(jobs, number_of_cpu_cores&#x2F;2)\n\n\nreload\n1\n设置重新加载主语料库的间隔秒数。在并行模式下，在多个 job 中同步语料集。为 0 表示禁止\n\n\nreduce_inputs\n1\n为 1 表示尝试减少输入数据的大小，同时保留其完整的特征集\n\n\nrss_limit_mb\n2048\nRSS 内存用量限制，单位为 Mb。为 0 表示无限制\n\n\npurge_allocator_interval\n1\n清理缓存的建个时长，单位为秒。当指定 rss_limit_mb 且 rss 使用率超过 50% 时，开始清理。为 -1 表示禁止\n\n\nmalloc_limit_mb\n0\n单次 malloc 申请内存的大小限制，单位为 Mb。为 0 则采用 rss_limit_mb 进行限制\n\n\ndetect_leaks\n1\n为 1，且启用 LeakSanitizer 消毒器时，将在 Fuzz 过程中检测内存泄漏，而不仅是在 Fuzz 结束时才检测\n\n\nprint_coverage\n0\n退出时打印覆盖率信息\n\n\nprint_corpus_stats\n0\n退出时打印语料信息\n\n\nprint_final_stats\n0\n退出时打印统计信息\n\n\nonly_ascii\n0\n为 1 表示只生成 ASCII（isprint + isspace）字符作为输入\n\n\nartifact_prefix\n0\n将 fuzzing artifacts（crash、timeout 等 file）保存为文件时所使用的前缀，即文件将保存为 $(artifact_prefix)file\n\n\nexact_artifact_path\n0\n将单个 fuzz artfifact 保存为文件时所使用的前缀。将覆盖 -artifact_prefix，并行任务中不要使用相同取值\n\n\n(2) 语料使用  模糊测试通过随机的方式变异或生成测试用例。提供种子语料库作为随机变异的基础用例，避免从头开始生完全随机地生成用例，在待测函数接受复杂或结构化输入的情况下，能显著提升 Fuzz 测试的效率和覆盖率。\nLibFuzzer 是以覆盖率为引导的，当提供种子语料库时，LibFuzzer 从语料库中读取语料，通过随机变异产生新的测试数据，输入到 Fuzz Target。由于在构建 Fuzz Target 时，通过编译参数进行了代码插桩，因此可以跟踪 Fuzz Target 在接收到输入后，具体执行了哪些代码。如果某个测试输入能执行到之前从未执行的代码，那么这个测试输入就是一个有效变异，将被纳入到语料库，作为后续变异的基础。整体流程大致如下，仅做原理示意，不等于具体实现。\ngraph LR\n    A[从语料库中读取样本] --> B[随机变异生成新样本]\n    B --> C[新样本输入 Fuzz Target]\n    C --> D[跟踪代码执行路径]\n    D --> E{是否覆盖新的代码}\n    E -->| 是 | F[测试数据加入语料库]\n    E -->| 否 | B\n    F --> A\n\n使用 corpus 时，需要提供一个或多个存放种子语料的路径，命令为：\n1./fuzz_target -max_len=1000 -jobs=20 corpus_dir  # 种子语料存放在 corpus_dir 目录下\n\n当语料库很大时，可以在保持代码覆盖率的情况下进行精简操作，这时需要用 -merge 参数，命令为：\n1./fuzz_target -merge=1 mini_corpus_dir corpus_dir  # 原始语料集存放在 corpus_dir 目录下，精简后的语料集存放在 mini_corpus_dir 目录下\n\n利用 -merge 参数，还可以实现有效语料的提取，即从一批候选语料中，找到能够触发新代码路径的语料，命令为：\n1./fuzz_target -merge=1 interesting_corpus_dir candidate_corpus_dir  # 候选语料放在 candidate_corpus_dir，有效语料放在 interesting_corpus_dir\n\n总的来说，语料集的路径可以有一个、两个或更多，当使用 -merge 参数时，这些语料集中发现的有效语料，都会被保存到第一个路径下。需要注意的是，合并语料是一个非常耗时的过程，通过使用 -merge_control_file 参数，可以实现无缝恢复的多阶段合并，即通过 killall -SIGUSR1 /path/to/fuzzer/binary 中断合并操作后，下次还能继续上一次的合并进度，继续开始合并操作。示例如下：\n123456789101112131415% rm -f SomeLocalPath% ./my_fuzzer CORPUS1 CORPUS2 -merge=1 -merge_control_file=SomeLocalPath...MERGE-INNER: using the control file &#x27;SomeLocalPath&#x27;...# While this is running, do `killall -SIGUSR1 my_fuzzer` in another console==9015== INFO: libFuzzer: exiting as requested# This will leave the file SomeLocalPath with the partial state of the merge.# Now, you can continue the merge by executing the same command. The merge will continue from where it has been interrupted.% ./my_fuzzer CORPUS1 CORPUS2 -merge=1 -merge_control_file=SomeLocalPath...MERGE-OUTER: non-empty control file provided: &#x27;SomeLocalPath&#x27;MERGE-OUTER: control file ok, 32 files total, first not processed file 20...\n\n语料库除了用于提高 Fuzz 效率，还可用于回归测试。在回归测试和复现 crash 时，还可以具体指定某一个 testcase，命令为：\n1./fuzz_target testcase_path  # testcase_path 就是 fuzz crash 时保存的 testcase file 的文件路径\n\n4. 输出解读  在 Fuzz 执行过程中，标准错误流 stderr 中，通常会输出以下格式的内容：\n12345678910111213INFO: Seed: 1523017872INFO: Loaded 1 modules (16 guards): [0x744e60, 0x744ea0),INFO: -max_len is not provided, using 64INFO: A corpus is not provided, starting from an empty corpus#0    READ units: 1#1    INITED cov: 3 ft: 2 corp: 1/1b exec/s: 0 rss: 24Mb#3811 NEW    cov: 4 ft: 3 corp: 2/2b exec/s: 0 rss: 25Mb L: 1 MS: 5 ChangeBit-ChangeByte-ChangeBit-ShuffleBytes-ChangeByte-#3827 NEW    cov: 5 ft: 4 corp: 3/4b exec/s: 0 rss: 25Mb L: 2 MS: 1 CopyPart-#3963 NEW    cov: 6 ft: 5 corp: 4/6b exec/s: 0 rss: 25Mb L: 2 MS: 2 ShuffleBytes-ChangeBit-#4167 NEW    cov: 7 ft: 6 corp: 5/9b exec/s: 0 rss: 25Mb L: 3 MS: 1 InsertByte-==31511== ERROR: libFuzzer: deadly signal...artifact_prefix=&#x27;./&#x27;; Test unit written to ./crash-b13e8756b13a00cf168300179061fb4b91fefbed\n\n第一行显示 Fuzz 测试使用的随机种子，可以通过 -seed 参数来设置。\n第二行显示插桩后的 PC guards 数量（PC 指 Program Counter），可理解为 Fuzz 识别出来的 edge 总数，参考  此处脚注说明。\n第三行显示输入数据的长度限制，示例中 -max_len 参数没有设置，Fuzz 程序将 -max_len 定为 64，即最大数据长度不超过 64kb。\n第四行显示语料库信息，示例中没有提供 corpus，Fuzz 程序从头开始生成语料。\n第五行到第十行，每行开头的 #N 表示 Fuzz 已执行了 N 次测试输入，后面的内容为测试过程中的事件代码和统计信息：\n\n\n\n事件代码\n含义\n\n\n\nREAD\nFuzz 已从语料库中读取所有初始输入样本\n\n\nINITED\nFuzz 已完成初始化，包括通过被测代码运行每个初始输入样本\n\n\nNEW\nFuzz 生成了一个测试输入样本，它能触发被测代码的新路径，将被保存到主语料库目录\n\n\nREDUCE\nFuzz 找到了一个更好的输入样本，它能保持原有样本的特征集（参考下表 ft 含义），但是 size 更小\n\n\npulse\nFuzz 已生成 2 的 n 次方个输入（定期生成以使用户确信 Fuzz 仍在工作）\n\n\nDONE\nFuzz 已完成操作，因为它已达到指定的迭代限制（-runs）或时间限制（-max_total_time）\n\n\nRELOAD\nFuzz 正在定期重新加载语料库目录中的输入样本，这使它能够发现其他 Fuzz 进程发现的任何输入\n\n\n\n\n\n统计指标\n含义\n\n\n\ncov\n执行当前语料库所覆盖的 block 或 edge 的总数\n\n\nft\nLibFuzzer 使用不同的信号来评估代码覆盖率：边缘覆盖率、边缘计数器、间接调用者 &#x2F; 被调用者对等。这些信号组合起来称为特征\n\n\ncorp\n当前内存测试语料库中的条目数及其大小（单位为 byte）\n\n\nlim\n当前语料库中新样本的长度限制。 随着时间的推移而增加，直到达到最大长度 (-max_len)\n\n\nexec&#x2F;s\n每秒 Fuzz 执行次数\n\n\nrss\n当前内存消耗（单位为 Mb）\n\n\nL\n新样本的大小（单位为 byte）。只用于 NEW 和 REDUCE 事件\n\n\nMS: &lt;n&gt; &lt;operations&gt;\n生成新样本时的变异次数和变异方法。只用于 NEW 和 REDUCE 事件\n\n\n第十一行开始，显示 Fuzz 遇到 crash 并终止执行，导致 crash 的用例被保存为.&#x2F;crash-&lt;sha1&gt; 文件，保存路径和名称可以通过 -artifact_prefix 参数修改。\n二、使用示例  以CVE-2016-5180为例，演示 LibFuzzer 的使用过程。CVE-2016-5180是在 c-ares 中出现的堆溢出问题，是使得 ChromeOS 被攻击（重启后以访客模式执行代码）的漏洞之一。\n1. 下载源码  最新的 c-ares 代码已修复漏洞，为了复现漏洞，clone 代码后，需要恢复到漏洞修复之前。\n123git clone https://github.com/c-ares/c-ares.gitcd c-ares/git reset --hard 51fbb479f7948fca2ace3ff34a15ff27e796afdd\n\n2. 编写 Fuzz 主函数  实现 LLVMFuzzerTestOneInput 函数，将 LibFuzzer 输入的字节流进行转换，调用 ares_create_query 函数，并将代码保存为 target.cc 文件。\n1234567891011121314151617// Copyright 2016 Google Inc. All Rights Reserved.// Licensed under the Apache License, Version 2.0 (the &quot;License&quot;);#include &lt;stdint.h&gt;#include &lt;stdlib.h&gt;#include &lt;string&gt;#include &lt;arpa/nameser.h&gt;#include &lt;ares.h&gt;extern &quot;C&quot; int LLVMFuzzerTestOneInput(const uint8_t *Data, size_t Size) &#123;  unsigned char *buf;  int buflen;  std::string s(reinterpret_cast&lt;const char *&gt;(Data), Size);  ares_create_query(s.c_str(), ns_c_in, ns_t_a, 0x1234, 0, &amp;buf, &amp;buflen, 0);  free(buf);  return 0;&#125;\n\n3. 编译 Fuzz target使用 fuzzer-test-suite 提供的编译脚本，执行 build.sh 脚本，会自动调用 custom-build.sh 和 common.sh 进行编译。三个 shell 脚本和 Fuzz 函数的存放路径如下，脚本中会自动使用 git 拉取代码，这里将第 1 步手动拉取的代码删掉了：\n123456789sqa@twtpesqa03:~/dss/fuzz$ tree.├── cares│   ├── build.sh│   └── target.cc├── common.sh└── custom-build.sh1 directory, 4 files\n\n注意需要将原始脚本中的 -fsanitize-coverage&#x3D;trace-pc-guard 替换为 -fsanitize&#x3D;fuzzer，否则执行 Fuzz 时会出现错误：-fsanitize-coverage&#x3D;trace-pc-guard is no longer supported by libFuzzer。\n1234sqa@twtpesqa03:~/dss/fuzz$ ./cares-fsanitize_fuzzer-fsanitize-coverage=trace-pc-guard is no longer supported by libFuzzer.Please either migrate to a compiler that supports -fsanitize=fuzzeror use an older version of libFuzzer\n\n执行脚本进行编译（也可以自己编写命令进行编译，编译相关的内容之后会单独写文章进行说明）：\n1sqa@twtpesqa03:~/dss/fuzz$ ./cares/build.sh\n\n编译完后，可以看到目录下多了一个二进制文件 cares-fsanitize_fuzzer，两个目录 BUILD 和 SRC。cares-fsanitize_fuzzer 是可执行的 Fuzz 程序，SRC 目录存放 c-ares 含漏洞的源码，BUILD 目录用于存放编译产生的中间文件和最终文件：\n12345678910sqa@twtpesqa03:~/dss/fuzz$ tree -L 1.├── BUILD├── cares├── cares-fsanitize_fuzzer├── common.sh├── custom-build.sh└── SRC3 directories, 3 files\n\n4. 执行 Fuzz 测试  直接运行编译得到的二进制文件，如需附带参数，可参考第一章节执行 fuzz 的参数说明。\n123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778sqa@twtpesqa03:~/dss/fuzz$ ./cares-fsanitize_fuzzerINFO: Seed: 817252946INFO: Loaded 1 modules   (10 inline 8-bit counters): 10 [0x5a90e0, 0x5a90ea),INFO: Loaded 1 PC tables (10 PCs): 10 [0x56c278,0x56c318),INFO: -max_len is not provided; libFuzzer will not generate inputs larger than 4096 bytesINFO: A corpus is not provided, starting from an empty corpus#2      INITED cov: 3 ft: 3 corp: 1/1b exec/s: 0 rss: 27Mb#3      NEW    cov: 4 ft: 4 corp: 2/5b lim: 4 exec/s: 0 rss: 27Mb L: 4/4 MS: 1 CrossOver-#10     REDUCE cov: 4 ft: 4 corp: 2/4b lim: 4 exec/s: 0 rss: 27Mb L: 3/3 MS: 2 ChangeByte-CrossOver-#11     REDUCE cov: 4 ft: 4 corp: 2/3b lim: 4 exec/s: 0 rss: 27Mb L: 2/2 MS: 1 EraseBytes-#1368   REDUCE cov: 6 ft: 6 corp: 3/20b lim: 17 exec/s: 0 rss: 27Mb L: 17/17 MS: 2 InsertByte-InsertRepeatedBytes-#1524   REDUCE cov: 6 ft: 6 corp: 3/19b lim: 17 exec/s: 0 rss: 27Mb L: 16/16 MS: 1 EraseBytes-===================================================================3049145==ERROR: AddressSanitizer: heap-buffer-overflow on address 0x6030012599c2 at pc 0x000000550e1c bp 0x7fffbad826d0 sp 0x7fffbad826c8WRITE of size 1 at 0x6030012599c2 thread T0    #0 0x550e1b in ares_create_query (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x550e1b)    #1 0x55053c in LLVMFuzzerTestOneInput /home/sqa/dss/fuzz/cares/target.cc:14:3    #2 0x4586a1 in fuzzer::Fuzzer::ExecuteCallback(unsigned char const*, unsigned long) (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x4586a1)    #3 0x457de5 in fuzzer::Fuzzer::RunOne(unsigned char const*, unsigned long, bool, fuzzer::InputInfo*, bool*) (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x457de5)    #4 0x45a087 in fuzzer::Fuzzer::MutateAndTestOne() (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x45a087)    #5 0x45ad85 in fuzzer::Fuzzer::Loop(std::__Fuzzer::vector&lt;fuzzer::SizedFile, fuzzer::fuzzer_allocator&lt;fuzzer::SizedFile&gt; &gt;&amp;) (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x45ad85)    #6 0x44973e in fuzzer::FuzzerDriver(int*, char***, int (*)(unsigned char const*, unsigned long)) (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x44973e)    #7 0x472582 in main (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x472582)    #8 0x7fd31481c082 in __libc_start_main (/lib/x86_64-linux-gnu/libc.so.6+0x24082)    #9 0x41e4dd in _start (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x41e4dd)0x6030012599c2 is located 0 bytes to the right of 18-byte region [0x6030012599b0,0x6030012599c2)allocated by thread T0 here:    #0 0x51e20d in malloc (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x51e20d)    #1 0x5508f6 in ares_create_query (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x5508f6)    #2 0x55053c in LLVMFuzzerTestOneInput /home/sqa/dss/fuzz/cares/target.cc:14:3    #3 0x4586a1 in fuzzer::Fuzzer::ExecuteCallback(unsigned char const*, unsigned long) (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x4586a1)    #4 0x457de5 in fuzzer::Fuzzer::RunOne(unsigned char const*, unsigned long, bool, fuzzer::InputInfo*, bool*) (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x457de5)    #5 0x45a087 in fuzzer::Fuzzer::MutateAndTestOne() (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x45a087)    #6 0x45ad85 in fuzzer::Fuzzer::Loop(std::__Fuzzer::vector&lt;fuzzer::SizedFile, fuzzer::fuzzer_allocator&lt;fuzzer::SizedFile&gt; &gt;&amp;) (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x45ad85)    #7 0x44973e in fuzzer::FuzzerDriver(int*, char***, int (*)(unsigned char const*, unsigned long)) (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x44973e)    #8 0x472582 in main (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x472582)    #9 0x7fd31481c082 in __libc_start_main (/lib/x86_64-linux-gnu/libc.so.6+0x24082)SUMMARY: AddressSanitizer: heap-buffer-overflow (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x550e1b) in ares_create_queryShadow bytes around the buggy address:  0x0c06802432e0: fa fa fa fa fa fa fa fa fa fa fa fa fa fa fa fa  0x0c06802432f0: fa fa fa fa fa fa fa fa fa fa fa fa fa fa fa fa  0x0c0680243300: fa fa fa fa fa fa fa fa fa fa fa fa fa fa fa fa  0x0c0680243310: fa fa fa fa fa fa fa fa fa fa fa fa fa fa fa fa  0x0c0680243320: fa fa fa fa fa fa fa fa fa fa fd fd fd fa fa fa=&gt;0x0c0680243330: fd fd fd fa fa fa 00 00[02]fa fa fa fd fd fd fa  0x0c0680243340: fa fa fd fd fd fa fa fa fd fd fd fa fa fa fd fd  0x0c0680243350: fd fa fa fa fd fd fd fa fa fa fd fd fd fa fa fa  0x0c0680243360: fd fd fd fa fa fa fd fd fd fa fa fa fd fd fd fa  0x0c0680243370: fa fa fd fd fd fa fa fa fd fd fd fa fa fa fd fd  0x0c0680243380: fd fa fa fa fd fd fd fa fa fa fd fd fd fa fa faShadow byte legend (one shadow byte represents 8 application bytes):  Addressable:           00  Partially addressable: 01 02 03 04 05 06 07  Heap left redzone:       fa  Freed heap region:       fd  Stack left redzone:      f1  Stack mid redzone:       f2  Stack right redzone:     f3  Stack after return:      f5  Stack use after scope:   f8  Global redzone:          f9  Global init order:       f6  Poisoned by user:        f7  Container overflow:      fc  Array cookie:            ac  Intra object redzone:    bb  ASan internal:           fe  Left alloca redzone:     ca  Right alloca redzone:    cb  Shadow gap:              cc==3049145==ABORTINGMS: 4 ChangeByte-InsertByte-CopyPart-ChangeByte-; base unit: 00b28ff06b788b9b67c6b259800f404f9f3761fd0x5c,0x2e,0x0,0x6b,0x0,\\\\.\\x00k\\x00artifact_prefix=&#x27;./&#x27;; Test unit written to ./crash-edef708d314ed627eba0ef2b042e47aa96a9b899Base64: XC4AawA=\n\n可以看到，LibFuzzer 发现了 c-ares 中的 heap-buffer-overflow 漏洞，触发 crash 的用例保存为 crash-edef708d314ed627eba0ef2b042e47aa96a9b899 文件，该用例包含 5 个字节，字节码分别为：0x5c,0x2e,0x0,0x6b,0x0，其中 0x0 为空字符 NULL，属于不可见字符。\n5. 提取语料  执行 Fuzz 时，传入一个空文件夹作为 copus 路径，执行完后，可以在文件夹中看到 LibFuzzer 执行过程中，生成的有效语料。\n123456789101112131415161718192021222324252627282930313233343536373839404142sqa@twtpesqa03:~/dss/fuzz/cares$ mkdir corpussqa@twtpesqa03:~/dss/fuzz/cares$ lsBUILD  build.sh  cares_fuzzer  corpus  target.ccsqa@twtpesqa03:~/dss/fuzz/cares$ ./cares_fuzzer corpus/INFO: Seed: 4140748905INFO: Loaded 1 modules   (57 inline 8-bit counters): 57 [0x5a9100, 0x5a9139),INFO: Loaded 1 PC tables (57 PCs): 57 [0x5a9140,0x5a94d0),INFO:        0 files found in corpus/INFO: -max_len is not provided; libFuzzer will not generate inputs larger than 4096 bytesINFO: A corpus is not provided, starting from an empty corpus#2      INITED cov: 13 ft: 14 corp: 1/1b exec/s: 0 rss: 27Mb#4      NEW    cov: 16 ft: 20 corp: 2/3b lim: 4 exec/s: 0 rss: 27Mb L: 2/2 MS: 2 ChangeByte-InsertByte-#9      NEW    cov: 16 ft: 26 corp: 3/6b lim: 4 exec/s: 0 rss: 27Mb L: 3/3 MS: 5 ChangeBit-ChangeByte-ChangeByte-CopyPart-InsertByte-#10     NEW    cov: 16 ft: 32 corp: 4/10b lim: 4 exec/s: 0 rss: 27Mb L: 4/4 MS: 1 CrossOver-#25     NEW    cov: 18 ft: 34 corp: 5/11b lim: 4 exec/s: 0 rss: 27Mb L: 1/4 MS: 5 ChangeBit-ChangeASCIIInt-CMP-CrossOver-EraseBytes- DE: &quot;\\x01\\x00&quot;-#94     NEW    cov: 19 ft: 35 corp: 6/15b lim: 4 exec/s: 0 rss: 27Mb L: 4/4 MS: 4 CrossOver-ShuffleBytes-ChangeByte-ChangeBit-#108    NEW    cov: 21 ft: 37 corp: 7/16b lim: 4 exec/s: 0 rss: 27Mb L: 1/4 MS: 4 ChangeByte-ShuffleBytes-ChangeBit-ChangeByte-#125    NEW    cov: 22 ft: 38 corp: 8/18b lim: 4 exec/s: 0 rss: 27Mb L: 2/4 MS: 2 ShuffleBytes-InsertByte-...==3237059==ABORTINGMS: 2 InsertRepeatedBytes-ChangeByte-; base unit: 1bef8aac927d18852642a96c20e50efba80fdfae0x5c,0x5,0x98,0x98,0x98,0x98,0x98,0x98,0x98,0x98,0x98,0x98,0x98,0x5c,0x2e,\\\\\\x05\\x98\\x98\\x98\\x98\\x98\\x98\\x98\\x98\\x98\\x98\\x98\\\\.artifact_prefix=&#x27;./&#x27;; Test unit written to ./crash-157768d6f06d94325fe0e6bcf66cbd2d27dd8db7Base64: XAWYmJiYmJiYmJiYmFwusqa@twtpesqa03:~/dss/fuzz/cares$ ls -altotal 2244drwxrwxr-x 4 sqa sqa    4096 Sep 26 17:47 .drwxrwxr-x 5 sqa sqa    4096 Sep 26 15:25 ..drwxrwxr-x 9 sqa sqa   20480 Sep 26 17:18 BUILD-rw-rw-r-- 1 sqa sqa     722 Sep 26 17:13 build.sh-rwxrwxr-x 1 sqa sqa 2250720 Sep 26 17:18 cares_fuzzerdrwxrwxr-x 2 sqa sqa    4096 Sep 26 17:47 corpus-rw-rw-r-- 1 sqa sqa      15 Sep 26 17:47 crash-157768d6f06d94325fe0e6bcf66cbd2d27dd8db7-rw-rw-r-- 1 sqa sqa     499 Sep 26 17:14 target.ccsqa@twtpesqa03:~/dss/fuzz/cares$ ls corpus/08534f33c201a45017b502e90a800f1b708ebcb3  5175b74bd75b8d90a01f77709deba3982fbbdcb2  78bdce51613f555049a9937095bf469bcb77e94f  be566cb17d3bce0b2a8e5e710b3779df720db1f50f1c5448bf80343eeac759f8adcbdc2720533d15  5318c4ac20dac95a702bee2e27834d39ea6bc2b6  8e54ed049741d7cf6fb8ef7f4288ef0be3b54f17  be5c29e07560abcf094c3419712a01590bbe85940fe509b10d833be6eb3d5ed4947cbe0fbb64ed84  5ba93c9db0cff93f52b521d7420e43f6eda2784f  8ea51a3719d7cbfc3e2dcd3edf6109918d5aad55  caea31b9ef76b9be352ad1054956efbb86d4451a1bef8aac927d18852642a96c20e50efba80fdfae  60321f72401b49b895535045eb8d3b9ca7db7c7c  91a3f7c503955600f5dac12c1c1a3c5b674a4d98  dea712be0e801f4502a21e04dfbec5bd0cbc677c24792aa3923c4cd185519d3d445ecfd0801db1c1  6380a9a2d2701df0cb53d880842747cbefef8a5d  9f64357cb30f24cf567513e140e9fb0cbf1a2be5  e716589d09e16cf4a48d2c7f1d357bb481aaf3bc3a52ce780950d4d969792a2559cd519d7ee8c727  6414bd7955e39106721edf7cc29efdb82f7007ac  b534844fd943d8b338025ad82d68283f1bcdb5c0\n\n6. 合并语料  当 Fuzz 执行很久之后，会产生大量语料。为了减少语料数量，可以使用 merge 参数进行合并。创建一个 min_corpus 目录，执行 Fuzz 时，启动 merge 参数，传入 min_corpus 目录和 corpus 目录，合并完后，可以在 min_corpus 目录下看到缩减之后的语料。以下示例显示预料数据从 31 个减少到 29 个：\n1234567891011121314151617181920212223sqa@twtpesqa03:~/dss/fuzz/cares$ mkdir min_corpussqa@twtpesqa03:~/dss/fuzz/cares$ ./cares_fuzzer -merge=1 min_corpus/ corpus/INFO: Seed: 1671146211INFO: Loaded 1 modules   (57 inline 8-bit counters): 57 [0x5a9100, 0x5a9139),INFO: Loaded 1 PC tables (57 PCs): 57 [0x5a9140,0x5a94d0),MERGE-OUTER: 31 files, 0 in the initial corpus, 0 processed earlierMERGE-OUTER: attempt 1INFO: Seed: 1671165588INFO: Loaded 1 modules   (57 inline 8-bit counters): 57 [0x5a9100, 0x5a9139),INFO: Loaded 1 PC tables (57 PCs): 57 [0x5a9140,0x5a94d0),INFO: -max_len is not provided; libFuzzer will not generate inputs larger than 1048576 bytesMERGE-INNER: using the control file &#x27;/tmp/libFuzzerTemp.3327149.txt&#x27;MERGE-INNER: 31 total files; 0 processed earlier; will process 31 files now#1      pulse  cov: 9 ft: 10 exec/s: 0 rss: 27Mb#2      pulse  cov: 13 ft: 14 exec/s: 0 rss: 27Mb#4      pulse  cov: 20 ft: 22 exec/s: 0 rss: 27Mb#8      pulse  cov: 28 ft: 38 exec/s: 0 rss: 27Mb#16     pulse  cov: 29 ft: 56 exec/s: 0 rss: 27Mb#31     DONE   cov: 29 ft: 82 exec/s: 0 rss: 28MbMERGE-OUTER: succesfull in 1 attempt(s)MERGE-OUTER: the control file has 2691 bytesMERGE-OUTER: consumed 0Mb (27Mb rss) to parse the control fileMERGE-OUTER: 29 new files with 82 new features added; 29 new coverage edges\n\n三、优化技巧  整体优化思路分两种：\n\n找到 crash 更快 –&gt; 并行化，多个实例一起运行\n覆盖 edge 更多 –&gt; 加强语料，让输入能走到更深的分支\n\n（一）并行化1、LibFuzzer(1) jobs 和 workers\n\njobs：指定 fuzz 实例的数量。在不设置运行时长的情况下，每个 fuzz 实例找到 crash 才会停止。理论上有多少 jobs，最后会产生多少个 crash 文件。但实际上，不同的 job 可能找到同样的 crash，最后 crash 文件个数少于 job 个数。\nworks：执行 fuzz 进程的数量。在多个 jobs 的情况下，平均每个 woker 执行 #jobs&#x2F;#workers 个 job。\n\n简单来说，使用 workers 能提升 fuzz 运行速度，使用 jobs 能增加 crash 数量（仅根据输入去重，没有对调用栈去重）。 只使用 jobs 的情况下，默认开启 min(#jobs, #cores) &#x2F;&#x2F; 2 个 workers。\n(2) fork\n目前 fork 是实验阶段的参数，计划最终使用 fork 代替 jobs 和 workers 来实现 LibFuzzer 的并行化。\n\nfork：父进程不直接执行 fuzz，而是开启 N 个子进程，每个子进程使用语料库的随机子集进行 fuzz，当子进程退出后，该子进程的语料将被合并到主语料库中。子进程可以通过设置参数，来实现对指定错误的容错能力：\n\n-ignore_ooms：默认为 True。子进程发生内存溢出时，保存输入用于重现，但 fuzz 继续执行。\n\n-ignore_timeouts：默认为 True。子进程发生超时时，保留输入用于重现，但 fuzz 继续执行。\n\n-ignore_crashes：默认为 False。子进程发生其他类型 crash 时，保留输入用于重现，但 fuzz 继续执行。\n\n\n2、LibFuzzer 结合 AFLAFL 可以支持 LibFuzzer 的 target，编译方法参考  此处说明。\n12afl-fuzz -i testcase_dir -o findings_dir ./fuzz-target @@ ./fuzz-target testcase_dir findings_dir # Will write new tests to testcase_dir\n\n需要定期重启 AFL 和 LibFuzzer，以完成语料同步。\n（二）加强语料 1、字典 运行时使用 -dict 参数指定字典（Dictionary）文件的路径，字典用于指定和控制模糊测试中输入数据的一部分，从而提高模糊测试的效果。\n字典文件：\n12345678910# Lines starting with &#x27;#&#x27; and empty lines are ignored.# Adds &quot;blah&quot; (w/o quotes) to the dictionary.kw1=&quot;blah&quot;# Use \\\\ for backslash and \\&quot; for quotes.kw2=&quot;\\&quot;ac\\\\dc\\&quot;&quot;# Use \\xAB for hex valueskw3=&quot;\\xF7\\xF8&quot;# the name of the keyword followed by &#x27;=&#x27; may be omitted:&quot;foo\\x0Abar&quot;\n\n使用方法（运行时）：\n1./fuzz-target -dict=dict_file\n\n2、CMP编译时使用 -fsanitize-coverage&#x3D;trace-cmp 参数，让 fuzz 拦截 CMP 指令（例如 if 语句中的 compare 条件）并根据拦截到的 CMP 指令的参数来引导变异。这可能会减慢模糊测试的速度，但很可能会改善测试结果。\n使用方法（编译时）：\n1clang++ buggy.cc -fsanitize=fuzzer,address -fsanitize-coverage=trace-cmp -g -o buggy-fuzzer\n\n3、Value Profile需要与 -fsanitize-coverage=trace-cmp 一起使用，让 fuzz 收集 CMP 指令的参数值进行分析，用于发现更多的有效输入。但是有两个缺点：首先可能会导致速度降低 2 倍。 其次语料库可能增长数倍。\n使用方法（运行时）：\n1./fuzz-target -use_value_profile=1\n\n4、Fuzzer-friendly build mode程序中可能存在某些对 fuzz 不友好的特性，例如：\n\n随机化：同一个输入，可能走不同的路径\n校验和：拦截无效输入\n\n此时可以用构建宏 FUZZING_BUILD_MODE_UNSAFE_FOR_PRODUCTION 来编译一个对 fuzz 友好的版本，使用时需要对源码进行修改。例如：\n12345678void MyInitPRNG() &#123;#ifdef FUZZING_BUILD_MODE_UNSAFE_FOR_PRODUCTION  // In fuzzing mode the behavior of the code should be deterministic.  srand(0);#else  srand(time(0));#endif&#125;\n\n四、 参考资料\nlibFuzzer – a library for coverage-guided fuzz testing\nlibFuzzer 使用总结教程\nEfficient Fuzzing Guide\nThe art of fuzzing-A Step-by-Step Guide to Coverage-Guided Fuzzing with LibFuzzer\nAn introduction to LLVM libFuzzer\nAn informative guide on using AFL and libFuzzer\nlibfuzzer-workshop\nSanitizers\nThe Magic Behind Feedback-Based Fuzzing\n","dateCreated":"2023-09-17T18:30:15+08:00","dateModified":"2024-04-09T16:00:06+08:00","datePublished":"2023-09-17T18:30:15+08:00","description":"模糊测试工具 LibFuzzer 从 0 到 1，原理 + 安装 + 使用 + 优化，一篇讲完","headline":"LibFuzzer 使用说明","image":[],"mainEntityOfPage":{"@type":"WebPage","@id":"https://jiliguluss.github.io/2023/09/17/LibFuzzer%E4%BD%BF%E7%94%A8%E8%AF%B4%E6%98%8E/"},"publisher":{"@type":"Organization","name":"一瓢清浅","sameAs":["#about","https://github.com/"],"image":"photo.jpg","logo":{"@type":"ImageObject","url":"photo.jpg"}},"url":"https://jiliguluss.github.io/2023/09/17/LibFuzzer%E4%BD%BF%E7%94%A8%E8%AF%B4%E6%98%8E/","keywords":"安全, 工具, Fuzz, LibFuzzer"}</script>
+    <script type="application/ld+json">{"@context":"http://schema.org","@type":"BlogPosting","author":{"@type":"Person","name":"一瓢清浅","sameAs":["#about","https://github.com/"],"image":"photo.jpg"},"articleBody":"\n\n按照  官方定义，LibFuzzer 是一个in-process（进程内的），coverage-guided（以覆盖率为引导的），evolutionary（进化的） 的 fuzz 引擎，是 LLVM 项目的一部分，主要用于对 C&#x2F;C++ 程序进行 Fuzz 测试。LibFuzzer 三个特性的具体含义为：\n\nin-process：不会为每个测试用例启动一个进程，而是将所有的测试数据投放在同一个进程的内存空间中\n\ncoverage-guided：对每一个测试输入都进行代码覆盖率计算，不断累积测试用例使得代码覆盖率最大化\n\nevolutionary：结合了变异和生成两种形势的 Fuzz 引擎\n\n变异：基于已有的数据样本，通过一些变异规则，产生新的测试用例\n\n生成：通过对目标协议或接口规范进行建模，从零开始产生测试用例\n\n\n\n\nLibFuzzer 与待测的 library 进行链接，通过向指定的 fuzzing 入口（即target 函数）发送测试数据，并跟踪被触达的代码区域，然后对输入的数据进行变异，以达到代码覆盖率最大的目的，其中代码覆盖率的信息由 LLVM 的 SanitizerCoverage 工具提供。\n一、使用方法 1. 安装环境Clang 是一个类似 GCC 的 C&#x2F;C++ 语言编译工具，此处 简介。LibFuzzer 现在已被集成到 Clang 6.0 之后的版本中，在 Linux 环境下，只需直接安装 Clang 即可：\n1apt install clang\n\n安装完毕之后，可以通过如下命令查看 clang 版本：\n1clang --version\n\n2. 构建 target使用 LibFuzzer 时，第一步就是要实现 target 函数——LLVMFuzzerTestOneInput，该函数以 bytes 数组作为输入，函数体内使用待测 API 对这个 bytes 数组进行处理：\n12345// fuzz_target.ccextern &quot;C&quot; int LLVMFuzzerTestOneInput(const uint8_t *Data, size_t Size) &#123;  DoSomethingInterestingWithMyAPI(Data, Size);  return 0;  // Values other than 0 and -1 are reserved for future use.&#125;\n\ntarget 函数的名称、参数类型、返回值类型都不能改变。此外，官方文档中还有如下说明：\n\ntarget 函数在同一个进程中被多次执行，被不同的输入循环调用；\n\ntarget 函数需要容忍任何形势的输入，比如空数据、很长的数据、格式错误的数据等；\n\ntarget 函数不允许调用 exit 函数，否则将导致 Fuzz 终止执行；\n\ntarget 函数中可以使用线程，但是子线程要在函数体结束前 join，即进入下一次循环前，结束上一次循环的子线程；\n\ntarget 函数的结果必须是确定性的，即两次的 Data 如果一致，两次的执行结果也必须一致；\n\ntarget 函数执行速度必须快，避免三阶及以上的复杂度、日志记录和过多的内存消耗；\n\ntarget 函数应尽量避免修改全局状态，因为在同一个进程中修改全局变量，会导致下一次运行与上一次运行的上下文不同，可能影响程序确定性；\n\ntarget 函数的处理范围越窄越好，如果函数要处理多种数据格式，那最好拆分成多个子函数，每个子函数处理一种格式。\n\n\ntarget 函数编写完成后，通过以下命令编译成可执行文件：\n1234clang -g -O1 -fsanitize=fuzzer                         fuzz_target.cc # Builds the fuzz target w/o sanitizersclang -g -O1 -fsanitize=fuzzer,address                 fuzz_target.cc # Builds the fuzz target with ASANclang -g -O1 -fsanitize=fuzzer,signed-integer-overflow fuzz_target.cc # Builds the fuzz target with a part of UBSANclang -g -O1 -fsanitize=fuzzer,memory                  fuzz_target.cc # Builds the fuzz target with MSAN\n\nClang 支持的编译选项可以  参考文档  或者通过–help 查看，构建 LibFuzzer target 时常用的  编译选项  如下：\n\n-g：生成调试信息\n\n-O：设置编译器优化等级，可以是 1&#x2F;2&#x2F;3，默认为 1，数字越大，优化越多，注意2 和 3 有可能导致 Fuzz 找不到 crash\n\n-o：指定输出文件名\n\n-I：uppercase i，添加头文件搜索路径\n\n-L：添加库文件搜索路径\n\n-l：lowercase L，指定库文件名称，动态库和静态库同时存在时，动态库优先\n\n-fsanitize：启用 LibFuzzer，对源码进行插桩，并添加各种  消毒器 sanitizer，对程序进行运行时检查。\n\n-fsanitize&#x3D;fuzzer  编译时对源码插桩，链接 libFuzzer 库文件（使用 libFuzzer 的 main 函数）\n\n-fsanitize&#x3D;fuzzer-no-link  编译时对源码插桩，不链接 libFuzzer，适用于拥有 main 函数的源码。对大型项目来说，构建效率更高\n\n-fsanitize&#x3D;address  地址消毒器（AddressSanitizer），用于检测缓冲区溢出、UAF、Double Free、内存泄漏等内存问题\n\n-fsanitize&#x3D;memory  内存消毒器（MemorySanitizer），用于检测未初始化的内存访问\n\n-fsanitize&#x3D;undefined  未定义行为消毒器（UndefinedBehaviorSanitizer），用于检测程序运行中未定义行为，如越界访问、整数溢出、空指针解引用等\n\n\n\n-fsanitize-coverage：启用代码覆盖率的统计，包括 function 级别，basic block 级别和 edge 级别，详情可  参考文档 。但需要注意的是， 高版本的 clang 中，已经取消了对 -fsanitize-coverage&#x3D;trace-pc-guard 的支持，建议改用 -fsanitize&#x3D;fuzzer 替代，否则会出现报错，参见第二章节使用示例。\n\n-fsanitize-coverage&#x3D;trace-pc-guard,edge  使用 edge 级别代码覆盖率，edge 为默认级别，可省略\n\n-fsanitize-coverage&#x3D;trace-pc-guard,func  使用 function 级别代码覆盖率\n\n-fsanitize-coverage&#x3D;trace-pc-guard,bb  使用 basic block 级别代码覆盖率\n\n\n\n\n关于添加 LibFuzzer 相关选项后的详细构建过程，有兴趣可以参考libFuzzer 编译链接。\n关于 LibFuzzer 通过插桩统计代码覆盖率的具体实现，有兴趣可以参考Coverage Control in libFuzzer。\n3. 执行 fuzz在 target 函数构建成功后，会生成一个可执行的 fuzz 二进制文件，该文件通过命令行方式执行，可以接受指定的参数选项。执行格式为：\n1./fuzz-target -flag1=val1 -flag2=val2 ... path1 path2 ...\n\n在不限制运行时长的情况下，Fuzz 将会一直执行下去，直到出现 crash（通常是因为触发 sanitizer 异常）才会终止。导致 crash 的输入将会作为能触发 bug 的 testcase 保存到磁盘上，并根据 crash 的类型，用不同的文件名前缀进行区分，比如 crash-XXX，leak-XXX，timeout-XXX 等。\n(1) 参数说明  常见的 flag 选项及作用列举如下，使用 flag 时必须以 -flag&#x3D;val 的格式：\n\n\n\nflag\n默认值\n作用\n\n\n\nverbosity\n1\n运行时输出详细日志\n\n\nseed\n0\n随机种子。如果为 0，则自动生成随机种子\n\n\nruns\n-1\n测试运行的次数（-1 表示无限）\n\n\nmax_len\n0\n测试输入的最大长度。若为 0，libFuzzer 会自行猜测\n\n\nshuffle\n1\n为 1 表示启动时打乱初始语料库\n\n\nprefer_small\n1\n为 1 表示打乱语料库时，较小输入更优先\n\n\ntimeout\n1200\n超时时长，单位为秒。如果单次运行超过时长，Fuzz 将被终止\n\n\nmax_total_time\n0\n最大运行时长，单位为秒。若为正，表示 Fuzz 最长运行时间\n\n\nhelp\n0\n为 1 表示打印帮助信息\n\n\nmerge\n0\n为 1 表示在不损失代码覆盖率的情况下，进行语料库合并\n\n\nmerge_control_file\n0\n指定合并进程的控制文件，用于恢复合并状态\n\n\nminimize_crash\n0\n为 1 表示将提供的崩溃输入进行最小化。与 -runs &#x3D; N 或 -max_total_time &#x3D; N 一起使用以限制尝试次数\n\n\njobs\n0\njob 的数量，多个 job 将被分配到 workers 上执行，每个 job 的 stdout&#x2F;stderr 被重定向到 fuzz-&lt;JOB&gt;.log\n\n\nworkers\n0\nworker 的数量，为 0 将使用 min(jobs, number_of_cpu_cores&#x2F;2)\n\n\nreload\n1\n设置重新加载主语料库的间隔秒数。在并行模式下，在多个 job 中同步语料集。为 0 表示禁止\n\n\nreduce_inputs\n1\n为 1 表示尝试减少输入数据的大小，同时保留其完整的特征集\n\n\nrss_limit_mb\n2048\nRSS 内存用量限制，单位为 Mb。为 0 表示无限制\n\n\npurge_allocator_interval\n1\n清理缓存的建个时长，单位为秒。当指定 rss_limit_mb 且 rss 使用率超过 50% 时，开始清理。为 -1 表示禁止\n\n\nmalloc_limit_mb\n0\n单次 malloc 申请内存的大小限制，单位为 Mb。为 0 则采用 rss_limit_mb 进行限制\n\n\ndetect_leaks\n1\n为 1，且启用 LeakSanitizer 消毒器时，将在 Fuzz 过程中检测内存泄漏，而不仅是在 Fuzz 结束时才检测\n\n\nprint_coverage\n0\n退出时打印覆盖率信息\n\n\nprint_corpus_stats\n0\n退出时打印语料信息\n\n\nprint_final_stats\n0\n退出时打印统计信息\n\n\nonly_ascii\n0\n为 1 表示只生成 ASCII（isprint + isspace）字符作为输入\n\n\nartifact_prefix\n0\n将 fuzzing artifacts（crash、timeout 等 file）保存为文件时所使用的前缀，即文件将保存为 $(artifact_prefix)file\n\n\nexact_artifact_path\n0\n将单个 fuzz artfifact 保存为文件时所使用的前缀。将覆盖 -artifact_prefix，并行任务中不要使用相同取值\n\n\n(2) 语料使用  模糊测试通过随机的方式变异或生成测试用例。提供种子语料库作为随机变异的基础用例，避免从头开始生完全随机地生成用例，在待测函数接受复杂或结构化输入的情况下，能显著提升 Fuzz 测试的效率和覆盖率。\nLibFuzzer 是以覆盖率为引导的，当提供种子语料库时，LibFuzzer 从语料库中读取语料，通过随机变异产生新的测试数据，输入到 Fuzz Target。由于在构建 Fuzz Target 时，通过编译参数进行了代码插桩，因此可以跟踪 Fuzz Target 在接收到输入后，具体执行了哪些代码。如果某个测试输入能执行到之前从未执行的代码，那么这个测试输入就是一个有效变异，将被纳入到语料库，作为后续变异的基础。整体流程大致如下，仅做原理示意，不等于具体实现。\ngraph LR\n    A[从语料库中读取样本] --> B[随机变异生成新样本]\n    B --> C[新样本输入 Fuzz Target]\n    C --> D[跟踪代码执行路径]\n    D --> E{是否覆盖新的代码}\n    E -->| 是 | F[测试数据加入语料库]\n    E -->| 否 | B\n    F --> A\n\n使用 corpus 时，需要提供一个或多个存放种子语料的路径，命令为：\n1./fuzz_target -max_len=1000 -jobs=20 corpus_dir  # 种子语料存放在 corpus_dir 目录下\n\n当语料库很大时，可以在保持代码覆盖率的情况下进行精简操作，这时需要用 -merge 参数，命令为：\n1./fuzz_target -merge=1 mini_corpus_dir corpus_dir  # 原始语料集存放在 corpus_dir 目录下，精简后的语料集存放在 mini_corpus_dir 目录下\n\n利用 -merge 参数，还可以实现有效语料的提取，即从一批候选语料中，找到能够触发新代码路径的语料，命令为：\n1./fuzz_target -merge=1 interesting_corpus_dir candidate_corpus_dir  # 候选语料放在 candidate_corpus_dir，有效语料放在 interesting_corpus_dir\n\n总的来说，语料集的路径可以有一个、两个或更多，当使用 -merge 参数时，这些语料集中发现的有效语料，都会被保存到第一个路径下。需要注意的是，合并语料是一个非常耗时的过程，通过使用 -merge_control_file 参数，可以实现无缝恢复的多阶段合并，即通过 killall -SIGUSR1 /path/to/fuzzer/binary 中断合并操作后，下次还能继续上一次的合并进度，继续开始合并操作。示例如下：\n123456789101112131415% rm -f SomeLocalPath% ./my_fuzzer CORPUS1 CORPUS2 -merge=1 -merge_control_file=SomeLocalPath...MERGE-INNER: using the control file &#x27;SomeLocalPath&#x27;...# While this is running, do `killall -SIGUSR1 my_fuzzer` in another console==9015== INFO: libFuzzer: exiting as requested# This will leave the file SomeLocalPath with the partial state of the merge.# Now, you can continue the merge by executing the same command. The merge will continue from where it has been interrupted.% ./my_fuzzer CORPUS1 CORPUS2 -merge=1 -merge_control_file=SomeLocalPath...MERGE-OUTER: non-empty control file provided: &#x27;SomeLocalPath&#x27;MERGE-OUTER: control file ok, 32 files total, first not processed file 20...\n\n语料库除了用于提高 Fuzz 效率，还可用于回归测试。在回归测试和复现 crash 时，还可以具体指定某一个 testcase，命令为：\n1./fuzz_target testcase_path  # testcase_path 就是 fuzz crash 时保存的 testcase file 的文件路径\n\n4. 输出解读  在 Fuzz 执行过程中，标准错误流 stderr 中，通常会输出以下格式的内容：\n12345678910111213INFO: Seed: 1523017872INFO: Loaded 1 modules (16 guards): [0x744e60, 0x744ea0),INFO: -max_len is not provided, using 64INFO: A corpus is not provided, starting from an empty corpus#0    READ units: 1#1    INITED cov: 3 ft: 2 corp: 1/1b exec/s: 0 rss: 24Mb#3811 NEW    cov: 4 ft: 3 corp: 2/2b exec/s: 0 rss: 25Mb L: 1 MS: 5 ChangeBit-ChangeByte-ChangeBit-ShuffleBytes-ChangeByte-#3827 NEW    cov: 5 ft: 4 corp: 3/4b exec/s: 0 rss: 25Mb L: 2 MS: 1 CopyPart-#3963 NEW    cov: 6 ft: 5 corp: 4/6b exec/s: 0 rss: 25Mb L: 2 MS: 2 ShuffleBytes-ChangeBit-#4167 NEW    cov: 7 ft: 6 corp: 5/9b exec/s: 0 rss: 25Mb L: 3 MS: 1 InsertByte-==31511== ERROR: libFuzzer: deadly signal...artifact_prefix=&#x27;./&#x27;; Test unit written to ./crash-b13e8756b13a00cf168300179061fb4b91fefbed\n\n第一行显示 Fuzz 测试使用的随机种子，可以通过 -seed 参数来设置。\n第二行显示插桩后的 PC guards 数量（PC 指 Program Counter），可理解为 Fuzz 识别出来的 edge 总数，参考  此处脚注说明。\n第三行显示输入数据的长度限制，示例中 -max_len 参数没有设置，Fuzz 程序将 -max_len 定为 64，即最大数据长度不超过 64kb。\n第四行显示语料库信息，示例中没有提供 corpus，Fuzz 程序从头开始生成语料。\n第五行到第十行，每行开头的 #N 表示 Fuzz 已执行了 N 次测试输入，后面的内容为测试过程中的事件代码和统计信息：\n\n\n\n事件代码\n含义\n\n\n\nREAD\nFuzz 已从语料库中读取所有初始输入样本\n\n\nINITED\nFuzz 已完成初始化，包括通过被测代码运行每个初始输入样本\n\n\nNEW\nFuzz 生成了一个测试输入样本，它能触发被测代码的新路径，将被保存到主语料库目录\n\n\nREDUCE\nFuzz 找到了一个更好的输入样本，它能保持原有样本的特征集（参考下表 ft 含义），但是 size 更小\n\n\npulse\nFuzz 已生成 2 的 n 次方个输入（定期生成以使用户确信 Fuzz 仍在工作）\n\n\nDONE\nFuzz 已完成操作，因为它已达到指定的迭代限制（-runs）或时间限制（-max_total_time）\n\n\nRELOAD\nFuzz 正在定期重新加载语料库目录中的输入样本，这使它能够发现其他 Fuzz 进程发现的任何输入\n\n\n\n\n\n统计指标\n含义\n\n\n\ncov\n执行当前语料库所覆盖的 block 或 edge 的总数\n\n\nft\nLibFuzzer 使用不同的信号来评估代码覆盖率：边缘覆盖率、边缘计数器、间接调用者 &#x2F; 被调用者对等。这些信号组合起来称为特征\n\n\ncorp\n当前内存测试语料库中的条目数及其大小（单位为 byte）\n\n\nlim\n当前语料库中新样本的长度限制。 随着时间的推移而增加，直到达到最大长度 (-max_len)\n\n\nexec&#x2F;s\n每秒 Fuzz 执行次数\n\n\nrss\n当前内存消耗（单位为 Mb）\n\n\nL\n新样本的大小（单位为 byte）。只用于 NEW 和 REDUCE 事件\n\n\nMS: &lt;n&gt; &lt;operations&gt;\n生成新样本时的变异次数和变异方法。只用于 NEW 和 REDUCE 事件\n\n\n第十一行开始，显示 Fuzz 遇到 crash 并终止执行，导致 crash 的用例被保存为.&#x2F;crash-&lt;sha1&gt; 文件，保存路径和名称可以通过 -artifact_prefix 参数修改。\n二、使用示例  以CVE-2016-5180为例，演示 LibFuzzer 的使用过程。CVE-2016-5180是在 c-ares 中出现的堆溢出问题，是使得 ChromeOS 被攻击（重启后以访客模式执行代码）的漏洞之一。\n1. 下载源码  最新的 c-ares 代码已修复漏洞，为了复现漏洞，clone 代码后，需要恢复到漏洞修复之前。\n123git clone https://github.com/c-ares/c-ares.gitcd c-ares/git reset --hard 51fbb479f7948fca2ace3ff34a15ff27e796afdd\n\n2. 编写 Fuzz 主函数  实现 LLVMFuzzerTestOneInput 函数，将 LibFuzzer 输入的字节流进行转换，调用 ares_create_query 函数，并将代码保存为 target.cc 文件。\n1234567891011121314151617// Copyright 2016 Google Inc. All Rights Reserved.// Licensed under the Apache License, Version 2.0 (the &quot;License&quot;);#include &lt;stdint.h&gt;#include &lt;stdlib.h&gt;#include &lt;string&gt;#include &lt;arpa/nameser.h&gt;#include &lt;ares.h&gt;extern &quot;C&quot; int LLVMFuzzerTestOneInput(const uint8_t *Data, size_t Size) &#123;  unsigned char *buf;  int buflen;  std::string s(reinterpret_cast&lt;const char *&gt;(Data), Size);  ares_create_query(s.c_str(), ns_c_in, ns_t_a, 0x1234, 0, &amp;buf, &amp;buflen, 0);  free(buf);  return 0;&#125;\n\n3. 编译 Fuzz target使用 fuzzer-test-suite 提供的编译脚本，执行 build.sh 脚本，会自动调用 custom-build.sh 和 common.sh 进行编译。三个 shell 脚本和 Fuzz 函数的存放路径如下，脚本中会自动使用 git 拉取代码，这里将第 1 步手动拉取的代码删掉了：\n123456789sqa@twtpesqa03:~/dss/fuzz$ tree.├── cares│   ├── build.sh│   └── target.cc├── common.sh└── custom-build.sh1 directory, 4 files\n\n注意需要将原始脚本中的 -fsanitize-coverage&#x3D;trace-pc-guard 替换为 -fsanitize&#x3D;fuzzer，否则执行 Fuzz 时会出现错误：-fsanitize-coverage&#x3D;trace-pc-guard is no longer supported by libFuzzer。\n1234sqa@twtpesqa03:~/dss/fuzz$ ./cares-fsanitize_fuzzer-fsanitize-coverage=trace-pc-guard is no longer supported by libFuzzer.Please either migrate to a compiler that supports -fsanitize=fuzzeror use an older version of libFuzzer\n\n执行脚本进行编译（也可以自己编写命令进行编译，编译相关的内容之后会单独写文章进行说明）：\n1sqa@twtpesqa03:~/dss/fuzz$ ./cares/build.sh\n\n编译完后，可以看到目录下多了一个二进制文件 cares-fsanitize_fuzzer，两个目录 BUILD 和 SRC。cares-fsanitize_fuzzer 是可执行的 Fuzz 程序，SRC 目录存放 c-ares 含漏洞的源码，BUILD 目录用于存放编译产生的中间文件和最终文件：\n12345678910sqa@twtpesqa03:~/dss/fuzz$ tree -L 1.├── BUILD├── cares├── cares-fsanitize_fuzzer├── common.sh├── custom-build.sh└── SRC3 directories, 3 files\n\n4. 执行 Fuzz 测试  直接运行编译得到的二进制文件，如需附带参数，可参考第一章节执行 fuzz 的参数说明。\n123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778sqa@twtpesqa03:~/dss/fuzz$ ./cares-fsanitize_fuzzerINFO: Seed: 817252946INFO: Loaded 1 modules   (10 inline 8-bit counters): 10 [0x5a90e0, 0x5a90ea),INFO: Loaded 1 PC tables (10 PCs): 10 [0x56c278,0x56c318),INFO: -max_len is not provided; libFuzzer will not generate inputs larger than 4096 bytesINFO: A corpus is not provided, starting from an empty corpus#2      INITED cov: 3 ft: 3 corp: 1/1b exec/s: 0 rss: 27Mb#3      NEW    cov: 4 ft: 4 corp: 2/5b lim: 4 exec/s: 0 rss: 27Mb L: 4/4 MS: 1 CrossOver-#10     REDUCE cov: 4 ft: 4 corp: 2/4b lim: 4 exec/s: 0 rss: 27Mb L: 3/3 MS: 2 ChangeByte-CrossOver-#11     REDUCE cov: 4 ft: 4 corp: 2/3b lim: 4 exec/s: 0 rss: 27Mb L: 2/2 MS: 1 EraseBytes-#1368   REDUCE cov: 6 ft: 6 corp: 3/20b lim: 17 exec/s: 0 rss: 27Mb L: 17/17 MS: 2 InsertByte-InsertRepeatedBytes-#1524   REDUCE cov: 6 ft: 6 corp: 3/19b lim: 17 exec/s: 0 rss: 27Mb L: 16/16 MS: 1 EraseBytes-===================================================================3049145==ERROR: AddressSanitizer: heap-buffer-overflow on address 0x6030012599c2 at pc 0x000000550e1c bp 0x7fffbad826d0 sp 0x7fffbad826c8WRITE of size 1 at 0x6030012599c2 thread T0    #0 0x550e1b in ares_create_query (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x550e1b)    #1 0x55053c in LLVMFuzzerTestOneInput /home/sqa/dss/fuzz/cares/target.cc:14:3    #2 0x4586a1 in fuzzer::Fuzzer::ExecuteCallback(unsigned char const*, unsigned long) (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x4586a1)    #3 0x457de5 in fuzzer::Fuzzer::RunOne(unsigned char const*, unsigned long, bool, fuzzer::InputInfo*, bool*) (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x457de5)    #4 0x45a087 in fuzzer::Fuzzer::MutateAndTestOne() (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x45a087)    #5 0x45ad85 in fuzzer::Fuzzer::Loop(std::__Fuzzer::vector&lt;fuzzer::SizedFile, fuzzer::fuzzer_allocator&lt;fuzzer::SizedFile&gt; &gt;&amp;) (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x45ad85)    #6 0x44973e in fuzzer::FuzzerDriver(int*, char***, int (*)(unsigned char const*, unsigned long)) (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x44973e)    #7 0x472582 in main (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x472582)    #8 0x7fd31481c082 in __libc_start_main (/lib/x86_64-linux-gnu/libc.so.6+0x24082)    #9 0x41e4dd in _start (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x41e4dd)0x6030012599c2 is located 0 bytes to the right of 18-byte region [0x6030012599b0,0x6030012599c2)allocated by thread T0 here:    #0 0x51e20d in malloc (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x51e20d)    #1 0x5508f6 in ares_create_query (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x5508f6)    #2 0x55053c in LLVMFuzzerTestOneInput /home/sqa/dss/fuzz/cares/target.cc:14:3    #3 0x4586a1 in fuzzer::Fuzzer::ExecuteCallback(unsigned char const*, unsigned long) (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x4586a1)    #4 0x457de5 in fuzzer::Fuzzer::RunOne(unsigned char const*, unsigned long, bool, fuzzer::InputInfo*, bool*) (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x457de5)    #5 0x45a087 in fuzzer::Fuzzer::MutateAndTestOne() (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x45a087)    #6 0x45ad85 in fuzzer::Fuzzer::Loop(std::__Fuzzer::vector&lt;fuzzer::SizedFile, fuzzer::fuzzer_allocator&lt;fuzzer::SizedFile&gt; &gt;&amp;) (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x45ad85)    #7 0x44973e in fuzzer::FuzzerDriver(int*, char***, int (*)(unsigned char const*, unsigned long)) (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x44973e)    #8 0x472582 in main (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x472582)    #9 0x7fd31481c082 in __libc_start_main (/lib/x86_64-linux-gnu/libc.so.6+0x24082)SUMMARY: AddressSanitizer: heap-buffer-overflow (/home/sqa/dss/fuzz/cares-fsanitize_fuzzer+0x550e1b) in ares_create_queryShadow bytes around the buggy address:  0x0c06802432e0: fa fa fa fa fa fa fa fa fa fa fa fa fa fa fa fa  0x0c06802432f0: fa fa fa fa fa fa fa fa fa fa fa fa fa fa fa fa  0x0c0680243300: fa fa fa fa fa fa fa fa fa fa fa fa fa fa fa fa  0x0c0680243310: fa fa fa fa fa fa fa fa fa fa fa fa fa fa fa fa  0x0c0680243320: fa fa fa fa fa fa fa fa fa fa fd fd fd fa fa fa=&gt;0x0c0680243330: fd fd fd fa fa fa 00 00[02]fa fa fa fd fd fd fa  0x0c0680243340: fa fa fd fd fd fa fa fa fd fd fd fa fa fa fd fd  0x0c0680243350: fd fa fa fa fd fd fd fa fa fa fd fd fd fa fa fa  0x0c0680243360: fd fd fd fa fa fa fd fd fd fa fa fa fd fd fd fa  0x0c0680243370: fa fa fd fd fd fa fa fa fd fd fd fa fa fa fd fd  0x0c0680243380: fd fa fa fa fd fd fd fa fa fa fd fd fd fa fa faShadow byte legend (one shadow byte represents 8 application bytes):  Addressable:           00  Partially addressable: 01 02 03 04 05 06 07  Heap left redzone:       fa  Freed heap region:       fd  Stack left redzone:      f1  Stack mid redzone:       f2  Stack right redzone:     f3  Stack after return:      f5  Stack use after scope:   f8  Global redzone:          f9  Global init order:       f6  Poisoned by user:        f7  Container overflow:      fc  Array cookie:            ac  Intra object redzone:    bb  ASan internal:           fe  Left alloca redzone:     ca  Right alloca redzone:    cb  Shadow gap:              cc==3049145==ABORTINGMS: 4 ChangeByte-InsertByte-CopyPart-ChangeByte-; base unit: 00b28ff06b788b9b67c6b259800f404f9f3761fd0x5c,0x2e,0x0,0x6b,0x0,\\\\.\\x00k\\x00artifact_prefix=&#x27;./&#x27;; Test unit written to ./crash-edef708d314ed627eba0ef2b042e47aa96a9b899Base64: XC4AawA=\n\n可以看到，LibFuzzer 发现了 c-ares 中的 heap-buffer-overflow 漏洞，触发 crash 的用例保存为 crash-edef708d314ed627eba0ef2b042e47aa96a9b899 文件，该用例包含 5 个字节，字节码分别为：0x5c,0x2e,0x0,0x6b,0x0，其中 0x0 为空字符 NULL，属于不可见字符。\n5. 提取语料  执行 Fuzz 时，传入一个空文件夹作为 copus 路径，执行完后，可以在文件夹中看到 LibFuzzer 执行过程中，生成的有效语料。\n123456789101112131415161718192021222324252627282930313233343536373839404142sqa@twtpesqa03:~/dss/fuzz/cares$ mkdir corpussqa@twtpesqa03:~/dss/fuzz/cares$ lsBUILD  build.sh  cares_fuzzer  corpus  target.ccsqa@twtpesqa03:~/dss/fuzz/cares$ ./cares_fuzzer corpus/INFO: Seed: 4140748905INFO: Loaded 1 modules   (57 inline 8-bit counters): 57 [0x5a9100, 0x5a9139),INFO: Loaded 1 PC tables (57 PCs): 57 [0x5a9140,0x5a94d0),INFO:        0 files found in corpus/INFO: -max_len is not provided; libFuzzer will not generate inputs larger than 4096 bytesINFO: A corpus is not provided, starting from an empty corpus#2      INITED cov: 13 ft: 14 corp: 1/1b exec/s: 0 rss: 27Mb#4      NEW    cov: 16 ft: 20 corp: 2/3b lim: 4 exec/s: 0 rss: 27Mb L: 2/2 MS: 2 ChangeByte-InsertByte-#9      NEW    cov: 16 ft: 26 corp: 3/6b lim: 4 exec/s: 0 rss: 27Mb L: 3/3 MS: 5 ChangeBit-ChangeByte-ChangeByte-CopyPart-InsertByte-#10     NEW    cov: 16 ft: 32 corp: 4/10b lim: 4 exec/s: 0 rss: 27Mb L: 4/4 MS: 1 CrossOver-#25     NEW    cov: 18 ft: 34 corp: 5/11b lim: 4 exec/s: 0 rss: 27Mb L: 1/4 MS: 5 ChangeBit-ChangeASCIIInt-CMP-CrossOver-EraseBytes- DE: &quot;\\x01\\x00&quot;-#94     NEW    cov: 19 ft: 35 corp: 6/15b lim: 4 exec/s: 0 rss: 27Mb L: 4/4 MS: 4 CrossOver-ShuffleBytes-ChangeByte-ChangeBit-#108    NEW    cov: 21 ft: 37 corp: 7/16b lim: 4 exec/s: 0 rss: 27Mb L: 1/4 MS: 4 ChangeByte-ShuffleBytes-ChangeBit-ChangeByte-#125    NEW    cov: 22 ft: 38 corp: 8/18b lim: 4 exec/s: 0 rss: 27Mb L: 2/4 MS: 2 ShuffleBytes-InsertByte-...==3237059==ABORTINGMS: 2 InsertRepeatedBytes-ChangeByte-; base unit: 1bef8aac927d18852642a96c20e50efba80fdfae0x5c,0x5,0x98,0x98,0x98,0x98,0x98,0x98,0x98,0x98,0x98,0x98,0x98,0x5c,0x2e,\\\\\\x05\\x98\\x98\\x98\\x98\\x98\\x98\\x98\\x98\\x98\\x98\\x98\\\\.artifact_prefix=&#x27;./&#x27;; Test unit written to ./crash-157768d6f06d94325fe0e6bcf66cbd2d27dd8db7Base64: XAWYmJiYmJiYmJiYmFwusqa@twtpesqa03:~/dss/fuzz/cares$ ls -altotal 2244drwxrwxr-x 4 sqa sqa    4096 Sep 26 17:47 .drwxrwxr-x 5 sqa sqa    4096 Sep 26 15:25 ..drwxrwxr-x 9 sqa sqa   20480 Sep 26 17:18 BUILD-rw-rw-r-- 1 sqa sqa     722 Sep 26 17:13 build.sh-rwxrwxr-x 1 sqa sqa 2250720 Sep 26 17:18 cares_fuzzerdrwxrwxr-x 2 sqa sqa    4096 Sep 26 17:47 corpus-rw-rw-r-- 1 sqa sqa      15 Sep 26 17:47 crash-157768d6f06d94325fe0e6bcf66cbd2d27dd8db7-rw-rw-r-- 1 sqa sqa     499 Sep 26 17:14 target.ccsqa@twtpesqa03:~/dss/fuzz/cares$ ls corpus/08534f33c201a45017b502e90a800f1b708ebcb3  5175b74bd75b8d90a01f77709deba3982fbbdcb2  78bdce51613f555049a9937095bf469bcb77e94f  be566cb17d3bce0b2a8e5e710b3779df720db1f50f1c5448bf80343eeac759f8adcbdc2720533d15  5318c4ac20dac95a702bee2e27834d39ea6bc2b6  8e54ed049741d7cf6fb8ef7f4288ef0be3b54f17  be5c29e07560abcf094c3419712a01590bbe85940fe509b10d833be6eb3d5ed4947cbe0fbb64ed84  5ba93c9db0cff93f52b521d7420e43f6eda2784f  8ea51a3719d7cbfc3e2dcd3edf6109918d5aad55  caea31b9ef76b9be352ad1054956efbb86d4451a1bef8aac927d18852642a96c20e50efba80fdfae  60321f72401b49b895535045eb8d3b9ca7db7c7c  91a3f7c503955600f5dac12c1c1a3c5b674a4d98  dea712be0e801f4502a21e04dfbec5bd0cbc677c24792aa3923c4cd185519d3d445ecfd0801db1c1  6380a9a2d2701df0cb53d880842747cbefef8a5d  9f64357cb30f24cf567513e140e9fb0cbf1a2be5  e716589d09e16cf4a48d2c7f1d357bb481aaf3bc3a52ce780950d4d969792a2559cd519d7ee8c727  6414bd7955e39106721edf7cc29efdb82f7007ac  b534844fd943d8b338025ad82d68283f1bcdb5c0\n\n6. 合并语料  当 Fuzz 执行很久之后，会产生大量语料。为了减少语料数量，可以使用 merge 参数进行合并。创建一个 min_corpus 目录，执行 Fuzz 时，启动 merge 参数，传入 min_corpus 目录和 corpus 目录，合并完后，可以在 min_corpus 目录下看到缩减之后的语料。以下示例显示预料数据从 31 个减少到 29 个：\n1234567891011121314151617181920212223sqa@twtpesqa03:~/dss/fuzz/cares$ mkdir min_corpussqa@twtpesqa03:~/dss/fuzz/cares$ ./cares_fuzzer -merge=1 min_corpus/ corpus/INFO: Seed: 1671146211INFO: Loaded 1 modules   (57 inline 8-bit counters): 57 [0x5a9100, 0x5a9139),INFO: Loaded 1 PC tables (57 PCs): 57 [0x5a9140,0x5a94d0),MERGE-OUTER: 31 files, 0 in the initial corpus, 0 processed earlierMERGE-OUTER: attempt 1INFO: Seed: 1671165588INFO: Loaded 1 modules   (57 inline 8-bit counters): 57 [0x5a9100, 0x5a9139),INFO: Loaded 1 PC tables (57 PCs): 57 [0x5a9140,0x5a94d0),INFO: -max_len is not provided; libFuzzer will not generate inputs larger than 1048576 bytesMERGE-INNER: using the control file &#x27;/tmp/libFuzzerTemp.3327149.txt&#x27;MERGE-INNER: 31 total files; 0 processed earlier; will process 31 files now#1      pulse  cov: 9 ft: 10 exec/s: 0 rss: 27Mb#2      pulse  cov: 13 ft: 14 exec/s: 0 rss: 27Mb#4      pulse  cov: 20 ft: 22 exec/s: 0 rss: 27Mb#8      pulse  cov: 28 ft: 38 exec/s: 0 rss: 27Mb#16     pulse  cov: 29 ft: 56 exec/s: 0 rss: 27Mb#31     DONE   cov: 29 ft: 82 exec/s: 0 rss: 28MbMERGE-OUTER: succesfull in 1 attempt(s)MERGE-OUTER: the control file has 2691 bytesMERGE-OUTER: consumed 0Mb (27Mb rss) to parse the control fileMERGE-OUTER: 29 new files with 82 new features added; 29 new coverage edges\n\n三、优化技巧  整体优化思路分两种：\n\n找到 crash 更快 –&gt; 并行化，多个实例一起运行\n覆盖 edge 更多 –&gt; 加强语料，让输入能走到更深的分支\n\n（一）并行化1、LibFuzzer(1) jobs 和 workers\n\njobs：指定 fuzz 实例的数量。在不设置运行时长的情况下，每个 fuzz 实例找到 crash 才会停止。理论上有多少 jobs，最后会产生多少个 crash 文件。但实际上，不同的 job 可能找到同样的 crash，最后 crash 文件个数少于 job 个数。\nworks：执行 fuzz 进程的数量。在多个 jobs 的情况下，平均每个 woker 执行 #jobs&#x2F;#workers 个 job。\n\n简单来说，使用 workers 能提升 fuzz 运行速度，使用 jobs 能增加 crash 数量（仅根据输入去重，没有对调用栈去重）。 只使用 jobs 的情况下，默认开启 min(#jobs, #cores) &#x2F;&#x2F; 2 个 workers。\n(2) fork\n目前 fork 是实验阶段的参数，计划最终使用 fork 代替 jobs 和 workers 来实现 LibFuzzer 的并行化。\n\nfork：父进程不直接执行 fuzz，而是开启 N 个子进程，每个子进程使用语料库的随机子集进行 fuzz，当子进程退出后，该子进程的语料将被合并到主语料库中。子进程可以通过设置参数，来实现对指定错误的容错能力：\n\n-ignore_ooms：默认为 True。子进程发生内存溢出时，保存输入用于重现，但 fuzz 继续执行。\n\n-ignore_timeouts：默认为 True。子进程发生超时时，保留输入用于重现，但 fuzz 继续执行。\n\n-ignore_crashes：默认为 False。子进程发生其他类型 crash 时，保留输入用于重现，但 fuzz 继续执行。\n\n\n2、LibFuzzer 结合 AFLAFL 可以支持 LibFuzzer 的 target，编译方法参考  此处说明。\n12afl-fuzz -i testcase_dir -o findings_dir ./fuzz-target @@ ./fuzz-target testcase_dir findings_dir # Will write new tests to testcase_dir\n\n需要定期重启 AFL 和 LibFuzzer，以完成语料同步。\n（二）加强语料 1、字典 运行时使用 -dict 参数指定字典（Dictionary）文件的路径，字典用于指定和控制模糊测试中输入数据的一部分，从而提高模糊测试的效果。\n字典文件：\n12345678910# Lines starting with &#x27;#&#x27; and empty lines are ignored.# Adds &quot;blah&quot; (w/o quotes) to the dictionary.kw1=&quot;blah&quot;# Use \\\\ for backslash and \\&quot; for quotes.kw2=&quot;\\&quot;ac\\\\dc\\&quot;&quot;# Use \\xAB for hex valueskw3=&quot;\\xF7\\xF8&quot;# the name of the keyword followed by &#x27;=&#x27; may be omitted:&quot;foo\\x0Abar&quot;\n\n使用方法（运行时）：\n1./fuzz-target -dict=dict_file\n\n2、CMP编译时使用 -fsanitize-coverage&#x3D;trace-cmp 参数，让 fuzz 拦截 CMP 指令（例如 if 语句中的 compare 条件）并根据拦截到的 CMP 指令的参数来引导变异。这可能会减慢模糊测试的速度，但很可能会改善测试结果。\n使用方法（编译时）：\n1clang++ buggy.cc -fsanitize=fuzzer,address -fsanitize-coverage=trace-cmp -g -o buggy-fuzzer\n\n3、Value Profile需要与 -fsanitize-coverage=trace-cmp 一起使用，让 fuzz 收集 CMP 指令的参数值进行分析，用于发现更多的有效输入。但是有两个缺点：首先可能会导致速度降低 2 倍。 其次语料库可能增长数倍。\n使用方法（运行时）：\n1./fuzz-target -use_value_profile=1\n\n4、Fuzzer-friendly build mode程序中可能存在某些对 fuzz 不友好的特性，例如：\n\n随机化：同一个输入，可能走不同的路径\n校验和：拦截无效输入\n\n此时可以用构建宏 FUZZING_BUILD_MODE_UNSAFE_FOR_PRODUCTION 来编译一个对 fuzz 友好的版本，使用时需要对源码进行修改。例如：\n12345678void MyInitPRNG() &#123;#ifdef FUZZING_BUILD_MODE_UNSAFE_FOR_PRODUCTION  // In fuzzing mode the behavior of the code should be deterministic.  srand(0);#else  srand(time(0));#endif&#125;\n\n四、 参考资料\nlibFuzzer – a library for coverage-guided fuzz testing\nlibFuzzer 使用总结教程\nEfficient Fuzzing Guide\nThe art of fuzzing-A Step-by-Step Guide to Coverage-Guided Fuzzing with LibFuzzer\nAn introduction to LLVM libFuzzer\nAn informative guide on using AFL and libFuzzer\nlibfuzzer-workshop\nSanitizers\nThe Magic Behind Feedback-Based Fuzzing\n","dateCreated":"2023-09-17T18:30:15+08:00","dateModified":"2024-04-09T16:00:06+08:00","datePublished":"2023-09-17T18:30:15+08:00","description":"模糊测试工具 LibFuzzer 从 0 到 1，原理 + 安装 + 使用 + 优化，一篇讲完","headline":"LibFuzzer 使用说明","image":[],"mainEntityOfPage":{"@type":"WebPage","@id":"https://jiliguluss.github.io/2023/09/17/LibFuzzer%E4%BD%BF%E7%94%A8%E8%AF%B4%E6%98%8E/"},"publisher":{"@type":"Organization","name":"一瓢清浅","sameAs":["#about","https://github.com/"],"image":"photo.jpg","logo":{"@type":"ImageObject","url":"photo.jpg"}},"url":"https://jiliguluss.github.io/2023/09/17/LibFuzzer%E4%BD%BF%E7%94%A8%E8%AF%B4%E6%98%8E/","keywords":"Fuzz, 安全, 工具, LibFuzzer"}</script>
     <meta name="description" content="模糊测试工具 LibFuzzer 从 0 到 1，原理 + 安装 + 使用 + 优化，一篇讲完">
 <meta property="og:type" content="blog">
 <meta property="og:title" content="LibFuzzer 使用说明">
@@ -24,9 +24,9 @@
 <meta property="article:published_time" content="2023-09-17T10:30:15.000Z">
 <meta property="article:modified_time" content="2024-04-09T08:00:06.524Z">
 <meta property="article:author" content="一瓢清浅">
+<meta property="article:tag" content="Fuzz">
 <meta property="article:tag" content="安全">
 <meta property="article:tag" content="工具">
-<meta property="article:tag" content="Fuzz">
 <meta property="article:tag" content="LibFuzzer">
 <meta name="twitter:card" content="summary">
     
diff --git "a/2023/10/15/AFL\345\216\237\347\220\206\344\270\216\345\256\236\350\267\265/index.html" "b/2023/10/15/AFL\345\216\237\347\220\206\344\270\216\345\256\236\350\267\265/index.html"
index cfc7d26..f58d727 100644
--- "a/2023/10/15/AFL\345\216\237\347\220\206\344\270\216\345\256\236\350\267\265/index.html"
+++ "b/2023/10/15/AFL\345\216\237\347\220\206\344\270\216\345\256\236\350\267\265/index.html"
@@ -13,7 +13,7 @@
     
     
     
-    <script type="application/ld+json">{"@context":"http://schema.org","@type":"BlogPosting","author":{"@type":"Person","name":"一瓢清浅","sameAs":["#about","https://github.com/"],"image":"photo.jpg"},"articleBody":"\n\n\n在软件开发的世界里，质量和安全性是评估产品成败的重要指标。模糊测试作为一种高效的自动化测试方法，专门用来发现程序中的错误和安全漏洞。本文旨在详细介绍 AFL（American Fuzzy Lop）的基本原理和使用方法。\n一、AFL 的原理介绍  模糊测试是一种通过向软件输入异常或随机数据的自动化技术，目的是发现程序在处理意外或边缘情况输入时的错误。AFL 是这一测试策略中的杰出代表，它通过不断学习程序反应来改进测试用例，提高测试的覆盖率和发现漏洞的概率。\nAFL 利用遗传算法，不断生成测试用例，并通过动态插桩技术监控程序的行为，特别是程序的代码覆盖情况。当新的输入能触发新的代码路径时，这个输入会被保存以供进一步的测试。该过程可以形成一个反馈循环，不断优化测试用例以探索更多程序状态。\n下面是 AFL 工作流程图，展示了从准备测试用例到监控程序行为的步骤：\ngraph TD\n    A[Compile with afl-gcc] --> B[Initialize seed corpus] --> C[Fuzzing loop] --> D[Select seed from corpus queue]\n    D[Select seed from corpus queue] --> E[Mutate selected seed] --> F[Execute with mutated testcase]\n    F[Execute with mutated testcase] --> G[Monitor for crashes and coverage update] --> H{Check for new coverage}\n    H{Check for new coverage} -- YES --> I[Save mutated testcase to queue] --> D\n    H{Check for new coverage} -- NO --> D\n\n流程图详细展示了 AFL 在模糊测试中的核心步骤：\n\n编译（Compile with afl-gcc） - 使用 AFL 提供的编译器 afl-gcc，对目标程序进行编译，实现程序的动态插桩。\n\n初始化种子库（Initialize seed corpus） - 创建初始测试用例集（种子库），这些测试用例将作为模糊测试的起点。\n\n模糊测试循环（Fuzzing loop） - 一个不断循环的过程，根据测试结果更新种子库，并反复执行下列子步骤：a. 选择种子（Select seed from corpus queue） - 从种子库中选择一个种子文件作为当前测试的输入。b. 突变种子（Mutate selected seed） - 对选中的种子文件应用突变算法，生成新的测试用例。c. 执行测试（Execute with mutated test case） - 将变异后的测试用例作为输入执行已插桩的目标程序。d. 监控结果（Monitor for crashes and coverage update） - 监控程序的执行情况，记录崩溃和代码覆盖率的变化。\n\n覆盖率检查（Check for new coverage） - 判断是否出现新的代码覆盖，如果有，则将其保存为新测试用例。\n\n保存新测试用例（Save new testcase to queue） - 将触发新代码覆盖的测试用例保存到队列中，用于后续的测试。\n\n\nAFL 采用了 fork 的运行模式，这使得当待测程序出现崩溃时，fuzz 进程不会终止，这一点相较于 LibFuzzer 更具优势。然而，频繁的 fork 操作也导致了 AFL 的效率不如 LibFuzzer。\n二、AFL 安装和运行1. 支持的系统和架构AFL 设计之初主要针对 UNIX-like 系统，其在 Linux 系统上有最好的支持。然而，在社区的努力下，也有 Windows 版本的 AFL，如 winafl，其可以在 Windows 进行模糊测试。\nAFL 还支持多种 CPU 架构，其中对 x86 和 x64 架构的支持最好。如果要支持 ARM 架构，则需要使用 AFL 的 QEMU 模式。\n2. 安装步骤AFL 可以通过源码进行安装：\n123apt install git make gccgit clone https://github.com/google/AFL.git cd AFL &amp;&amp; make\n\n3. 运行参数  在安装并编译完 AFL 之后，可以使用 afl-fuzz 命令来启动模糊测试。一个基本的 AFL fuzz 命令如下：\n1afl-fuzz -i input_dir -o output_dir -- /path/to/program [options] @@\n\n这里：\n\nafl-fuzz 是启动 AFL 模糊测试的程序。\n-i input_dir 指定包含初始化测试用例的目录。\n-o output_dir 指定存放的 fuzzing 结果的目录。\n\n-- 之后的部分是运行被测试程序的命令行，其中 /path/to/program 替换为需要进行模糊测试的程序的路径，[options] 是运行该程序的任何选项或参数。\n如果测试程序需要从文件中读取输入，可以在实际输入文件路径的位置使用 @@ 占位符。AFL 将替换 @@ 来插入它正在测试的输入文件。如果省略这个占位符，AFL 将会把模糊测试用例通过 stdin 传递给测试程序。\n三、AFL 的使用示例  本节使用一个简单的示例，演示 AFL 的操作步骤。\n这是待测源码，其功能是接受一行命令行输入，进行四则运算。其中使用了不安全的 gets 函数，可能导致缓冲区溢出：\n1234567891011121314151617181920212223242526272829303132#include &lt;stdio.h&gt;#include &lt;string.h&gt;int calculate(int a, int b, char op) &#123;    switch (op) &#123;        case &#x27;+&#x27;: return a + b;        case &#x27;-&#x27;: return a - b;        case &#x27;x&#x27;: return a * b;        case &#x27;/&#x27;: return b ? a / b : 0;        default: return 0;    &#125;&#125;int main() &#123;    char input[100];    // unsafe method that may cause buffer overflow    gets(input);    int a, b, result;    char op;    if (sscanf(input, &quot;%d %c %d&quot;, &amp;a, &amp;op, &amp;b) != 3)        return 1;    result = calculate(a, b, op);    printf(&quot;Result: %d\\n&quot;, result);    return 0;&#125;\n\n1. 编译源码  使用 AFL 的编译器 afl-gcc 或afl-clang对源文件 hello.c 进行编译，添加所需要的代码覆盖插桩。afl-gcc或 afl-clang 实际上是对常规的 gcc 或clang编译器进行了封装，通过在编译时进行插桩，来统计 fuzz 过程中的代码覆盖率：\n1afl-gcc -o hello hello.c\n\n2. 准备种子语料库  不论程序是从 file 还是从 stdin 获取数据，AFL 都需要一个初始语料库来启动模糊测试过程。输入（无论是来自 file 或 stdin）是 AFL 用来开始探索程序行为的基础。初始语料库（seed corpus）是一组文件，其中包含了各种有效的输入示例，这些输入会被 AFL 用作模糊测试的起始点。\n从 stdin 读取输入时，AFL 会将语料库中的每个文件内容作为输入在每次测试运行时送到程序的标准输入流中。使用 AFL 时，必须要有初始语料库。注意这一点 AFL 与 Libfuzzer 不同，Libfuzzer 只接受 stdin，不接受 file，初始语料库为可选项。\n12mkdir inecho &#x27;abc&#x27; &gt; in/seed\n\n3. 执行测试  在运行 AFL 之前，需要执行下面的系统设置命令，将字符串”core”写入到文件 /proc/sys/kernel/core_pattern 中。\n在 Linux 系统中，/proc/sys/kernel/core_pattern 文件用于指定当程序崩溃时，内核转储文件（core dump）的文件名模式。通过修改这个文件，可以控制内核生成 core 文件的行为。\n通过执行这个命令，生成的核心转储文件将以”core”命名，这使得 AFL 更容易检测和处理目标程序的崩溃情况，从而更好地进行模糊测试。\n1echo core | tee /proc/sys/kernel/core_pattern\n\n在 hello 中使用 gets 函数从 stdin 中读取数据，因此在运行 AFL 时，不需要添加 @@。是否使用@@ 取决于待测程序接受的输入来自 file 还是 stdin。\n1afl-fuzz -i in -o out -- ./hello\n\n4. 结果解读AFL 开始运行后，将会看到如下的界面显示：\n\n\n从这个界面上可以看到 AFL 找到了多少 crash，但还不能直观地显示覆盖率。pythia是一款 AFL 的扩展工具，可以查看代码覆盖率的情况。\nAFL 在运行过程中，会不断地产生输出。输出目录结构如下：\n123456789101112131415161718192021222324out|-- crashes|   |-- README.txt|   |-- id:000000,sig:06,src:000000,op:havoc,rep:64|   |-- id:000001,sig:06,src:000002+000003,op:splice,rep:128|   |-- id:000002,sig:06,src:000003,op:havoc,rep:32|   |-- id:000003,sig:06,src:000002+000003,op:splice,rep:16|   |-- id:000004,sig:06,src:000004,op:havoc,rep:32|   |-- id:000005,sig:11,src:000003+000002,op:splice,rep:64|   `-- id:000006,sig:06,src:000004+000005,op:splice,rep:2|-- fuzz_bitmap|-- fuzzer_stats|-- hangs|-- plot_data`-- queue    |-- id:000000,orig:seed    |-- id:000001,src:000000,op:havoc,rep:16,+cov    |-- id:000002,src:000000+000001,op:splice,rep:4,+cov    |-- id:000003,src:000001,op:arith8,pos:1,val:-5,+cov    |-- id:000004,src:000001,op:arith8,pos:1,val:-9,+cov    `-- id:000005,src:000002+000003,op:splice,rep:4,+cov3 directories, 17 files\n\n\nqueue&#x2F; - 存放 AFL 生成的触发新代码路径的测试样本\n\ncrashes&#x2F; - 存放能触发待测程序崩溃的测试样本\n\nhangs&#x2F; - 存发导致待测程序超时的测试样本\n\nfuzzer_stats - 文本文件，包含了 fuzzer 的实时统计信息，如执行速度、路径覆盖等度量指标。这个文件不断更新以反映当前的 fuzzing 状态。\n\nplot_data - 文本文件，包含了 AFL 执行过程中的统计数据。使用 AFL 的 afl-plot 工具处理 plot_data 文件，可以生成 fuzz 过程的可视化图像。\n\nfuzz_bitmap - 这是用来记录路径覆盖率的位图（coverage bitmap），非人类可读。AFL 使用这个位图来跟踪程序在处理不同输入时执行的不同分支，用来帮助 AFL 识别新的、唯一的代码路径，以便后续生成更具有探索性的测试样本。\n\n\n四、AFL 的 QEMU 模式  前面的例子中，AFL 在对待测程序的源码进行编译时插桩。实际中，我们不一定能拿到待测源码，我们要测的可能是一个已经编译好的二进制文件。这种情况下 Libfuzzer 就无能为力了，但 AFL 还能用，这依赖于 AFL 的 QEMU 模式。\nAFL 的 QEMU 模式，也称为 AFL-QEMU，允许你在二进制模糊测试中使用 AFL，即使源代码不可用。这在对闭源应用进行模糊测试时非常有用。这种模式使用 QEMU 的用户模式仿真，来运行并分析非原生的二进制文件。以下是安装 AFL 的 QEMU 模式和使用步骤的指南：\n1. 编译 QEMU 支持  在 AFL 主目录下有一个专门的 QEMU 模式目录。进入该目录并编译 QEMU 模式，过程中可能缺少依赖项，根据提示进行安装即可：\n12cd qemu_mode./build_qemu_support.sh\n\n2. AFL-QEMU 使用步骤  用法很简单，在 AFL 运行命令中添加 -Q 参数即可：\n1afl-fuzz -i input -o output -Q -- /path/to/binary @@\n\n\n五、AFL 的升级版——AFL++AFL++ 可以看作是原始 AFL 的”增强版”，对 AFL 的调度策略和变异算法进行了很多改进，同时还引入了很多新特性，如 CMPLOG 和持久化这样的特性。\n1. CMPLOGCMPLOG 是 AFL++ 引入的一个新功能，类似于 Libfuzzer 中的 trace-cmp，它可以极大地提高代码覆盖率。CMPLOG 的主要作用是对程序中的所有比较操作进行记录，包括等于、不等于、小于等逻辑比较。当 fuzzer 执行时，CMPLOG 能够捕获比较操作的参数，并将对应的值添加到 fuzzer 的输入测试用例中。这个过程实际上帮助 fuzzer 更好地理解代码中期待的输入，特别是那些用于逻辑分支的字面值和魔法数字。这种理解能够导向更深入的路径覆盖，进而揭露隐藏更深的潜在缺陷。\n2. 持久化模式AFL 的持久化（persistent）模式允许目标程序在单个进程周期内重复执行多次模糊测试用例。这对性能产生了显著的提升，因为它减少了程序启动和终止的开销，特别是当测试的目标程序需要很大的初始化成本时。在 AFL++ 中，持久化模式的执行更为高效，它允许模糊器在目标程序中一次性执行多个测试用例，而非每次执行一个用例都重启目标程序。有了持久化模式，AFL++ 能够在相同的时间内执行更多的测试迭代，从而提高漏洞检测的速度。\n六、小结AFL 是一款强大的模糊测试工具，实践中 AFL++ 的应用非常广泛。相比 Libfuzzer，AFL++ 不局限于源码，并且支持多种 cpu 架构，还有丰富的插件生态可以使用。\n但模糊测试本身存在覆盖率瓶颈的问题，难以探索复杂的程序路径，这时候可以结合其他的技术，如符号执行来突破。","dateCreated":"2023-10-15T11:23:55+08:00","dateModified":"2024-04-09T15:59:36+08:00","datePublished":"2023-10-15T11:23:55+08:00","description":"模糊测试工具 AFL（American Fuzzy Lop）的原理介绍与实践应用","headline":"AFL 原理与实践","image":[],"mainEntityOfPage":{"@type":"WebPage","@id":"https://jiliguluss.github.io/2023/10/15/AFL%E5%8E%9F%E7%90%86%E4%B8%8E%E5%AE%9E%E8%B7%B5/"},"publisher":{"@type":"Organization","name":"一瓢清浅","sameAs":["#about","https://github.com/"],"image":"photo.jpg","logo":{"@type":"ImageObject","url":"photo.jpg"}},"url":"https://jiliguluss.github.io/2023/10/15/AFL%E5%8E%9F%E7%90%86%E4%B8%8E%E5%AE%9E%E8%B7%B5/","keywords":"安全, 工具, AFL, Fuzz"}</script>
+    <script type="application/ld+json">{"@context":"http://schema.org","@type":"BlogPosting","author":{"@type":"Person","name":"一瓢清浅","sameAs":["#about","https://github.com/"],"image":"photo.jpg"},"articleBody":"\n\n\n在软件开发的世界里，质量和安全性是评估产品成败的重要指标。模糊测试作为一种高效的自动化测试方法，专门用来发现程序中的错误和安全漏洞。本文旨在详细介绍 AFL（American Fuzzy Lop）的基本原理和使用方法。\n一、AFL 的原理介绍  模糊测试是一种通过向软件输入异常或随机数据的自动化技术，目的是发现程序在处理意外或边缘情况输入时的错误。AFL 是这一测试策略中的杰出代表，它通过不断学习程序反应来改进测试用例，提高测试的覆盖率和发现漏洞的概率。\nAFL 利用遗传算法，不断生成测试用例，并通过动态插桩技术监控程序的行为，特别是程序的代码覆盖情况。当新的输入能触发新的代码路径时，这个输入会被保存以供进一步的测试。该过程可以形成一个反馈循环，不断优化测试用例以探索更多程序状态。\n下面是 AFL 工作流程图，展示了从准备测试用例到监控程序行为的步骤：\ngraph TD\n    A[Compile with afl-gcc] --> B[Initialize seed corpus] --> C[Fuzzing loop] --> D[Select seed from corpus queue]\n    D[Select seed from corpus queue] --> E[Mutate selected seed] --> F[Execute with mutated testcase]\n    F[Execute with mutated testcase] --> G[Monitor for crashes and coverage update] --> H{Check for new coverage}\n    H{Check for new coverage} -- YES --> I[Save mutated testcase to queue] --> D\n    H{Check for new coverage} -- NO --> D\n\n流程图详细展示了 AFL 在模糊测试中的核心步骤：\n\n编译（Compile with afl-gcc） - 使用 AFL 提供的编译器 afl-gcc，对目标程序进行编译，实现程序的动态插桩。\n\n初始化种子库（Initialize seed corpus） - 创建初始测试用例集（种子库），这些测试用例将作为模糊测试的起点。\n\n模糊测试循环（Fuzzing loop） - 一个不断循环的过程，根据测试结果更新种子库，并反复执行下列子步骤：a. 选择种子（Select seed from corpus queue） - 从种子库中选择一个种子文件作为当前测试的输入。b. 突变种子（Mutate selected seed） - 对选中的种子文件应用突变算法，生成新的测试用例。c. 执行测试（Execute with mutated test case） - 将变异后的测试用例作为输入执行已插桩的目标程序。d. 监控结果（Monitor for crashes and coverage update） - 监控程序的执行情况，记录崩溃和代码覆盖率的变化。\n\n覆盖率检查（Check for new coverage） - 判断是否出现新的代码覆盖，如果有，则将其保存为新测试用例。\n\n保存新测试用例（Save new testcase to queue） - 将触发新代码覆盖的测试用例保存到队列中，用于后续的测试。\n\n\nAFL 采用了 fork 的运行模式，这使得当待测程序出现崩溃时，fuzz 进程不会终止，这一点相较于 LibFuzzer 更具优势。然而，频繁的 fork 操作也导致了 AFL 的效率不如 LibFuzzer。\n二、AFL 安装和运行1. 支持的系统和架构AFL 设计之初主要针对 UNIX-like 系统，其在 Linux 系统上有最好的支持。然而，在社区的努力下，也有 Windows 版本的 AFL，如 winafl，其可以在 Windows 进行模糊测试。\nAFL 还支持多种 CPU 架构，其中对 x86 和 x64 架构的支持最好。如果要支持 ARM 架构，则需要使用 AFL 的 QEMU 模式。\n2. 安装步骤AFL 可以通过源码进行安装：\n123apt install git make gccgit clone https://github.com/google/AFL.git cd AFL &amp;&amp; make\n\n3. 运行参数  在安装并编译完 AFL 之后，可以使用 afl-fuzz 命令来启动模糊测试。一个基本的 AFL fuzz 命令如下：\n1afl-fuzz -i input_dir -o output_dir -- /path/to/program [options] @@\n\n这里：\n\nafl-fuzz 是启动 AFL 模糊测试的程序。\n-i input_dir 指定包含初始化测试用例的目录。\n-o output_dir 指定存放的 fuzzing 结果的目录。\n\n-- 之后的部分是运行被测试程序的命令行，其中 /path/to/program 替换为需要进行模糊测试的程序的路径，[options] 是运行该程序的任何选项或参数。\n如果测试程序需要从文件中读取输入，可以在实际输入文件路径的位置使用 @@ 占位符。AFL 将替换 @@ 来插入它正在测试的输入文件。如果省略这个占位符，AFL 将会把模糊测试用例通过 stdin 传递给测试程序。\n三、AFL 的使用示例  本节使用一个简单的示例，演示 AFL 的操作步骤。\n这是待测源码，其功能是接受一行命令行输入，进行四则运算。其中使用了不安全的 gets 函数，可能导致缓冲区溢出：\n1234567891011121314151617181920212223242526272829303132#include &lt;stdio.h&gt;#include &lt;string.h&gt;int calculate(int a, int b, char op) &#123;    switch (op) &#123;        case &#x27;+&#x27;: return a + b;        case &#x27;-&#x27;: return a - b;        case &#x27;x&#x27;: return a * b;        case &#x27;/&#x27;: return b ? a / b : 0;        default: return 0;    &#125;&#125;int main() &#123;    char input[100];    // unsafe method that may cause buffer overflow    gets(input);    int a, b, result;    char op;    if (sscanf(input, &quot;%d %c %d&quot;, &amp;a, &amp;op, &amp;b) != 3)        return 1;    result = calculate(a, b, op);    printf(&quot;Result: %d\\n&quot;, result);    return 0;&#125;\n\n1. 编译源码  使用 AFL 的编译器 afl-gcc 或afl-clang对源文件 hello.c 进行编译，添加所需要的代码覆盖插桩。afl-gcc或 afl-clang 实际上是对常规的 gcc 或clang编译器进行了封装，通过在编译时进行插桩，来统计 fuzz 过程中的代码覆盖率：\n1afl-gcc -o hello hello.c\n\n2. 准备种子语料库  不论程序是从 file 还是从 stdin 获取数据，AFL 都需要一个初始语料库来启动模糊测试过程。输入（无论是来自 file 或 stdin）是 AFL 用来开始探索程序行为的基础。初始语料库（seed corpus）是一组文件，其中包含了各种有效的输入示例，这些输入会被 AFL 用作模糊测试的起始点。\n从 stdin 读取输入时，AFL 会将语料库中的每个文件内容作为输入在每次测试运行时送到程序的标准输入流中。使用 AFL 时，必须要有初始语料库。注意这一点 AFL 与 Libfuzzer 不同，Libfuzzer 只接受 stdin，不接受 file，初始语料库为可选项。\n12mkdir inecho &#x27;abc&#x27; &gt; in/seed\n\n3. 执行测试  在运行 AFL 之前，需要执行下面的系统设置命令，将字符串”core”写入到文件 /proc/sys/kernel/core_pattern 中。\n在 Linux 系统中，/proc/sys/kernel/core_pattern 文件用于指定当程序崩溃时，内核转储文件（core dump）的文件名模式。通过修改这个文件，可以控制内核生成 core 文件的行为。\n通过执行这个命令，生成的核心转储文件将以”core”命名，这使得 AFL 更容易检测和处理目标程序的崩溃情况，从而更好地进行模糊测试。\n1echo core | tee /proc/sys/kernel/core_pattern\n\n在 hello 中使用 gets 函数从 stdin 中读取数据，因此在运行 AFL 时，不需要添加 @@。是否使用@@ 取决于待测程序接受的输入来自 file 还是 stdin。\n1afl-fuzz -i in -o out -- ./hello\n\n4. 结果解读AFL 开始运行后，将会看到如下的界面显示：\n\n\n从这个界面上可以看到 AFL 找到了多少 crash，但还不能直观地显示覆盖率。pythia是一款 AFL 的扩展工具，可以查看代码覆盖率的情况。\nAFL 在运行过程中，会不断地产生输出。输出目录结构如下：\n123456789101112131415161718192021222324out|-- crashes|   |-- README.txt|   |-- id:000000,sig:06,src:000000,op:havoc,rep:64|   |-- id:000001,sig:06,src:000002+000003,op:splice,rep:128|   |-- id:000002,sig:06,src:000003,op:havoc,rep:32|   |-- id:000003,sig:06,src:000002+000003,op:splice,rep:16|   |-- id:000004,sig:06,src:000004,op:havoc,rep:32|   |-- id:000005,sig:11,src:000003+000002,op:splice,rep:64|   `-- id:000006,sig:06,src:000004+000005,op:splice,rep:2|-- fuzz_bitmap|-- fuzzer_stats|-- hangs|-- plot_data`-- queue    |-- id:000000,orig:seed    |-- id:000001,src:000000,op:havoc,rep:16,+cov    |-- id:000002,src:000000+000001,op:splice,rep:4,+cov    |-- id:000003,src:000001,op:arith8,pos:1,val:-5,+cov    |-- id:000004,src:000001,op:arith8,pos:1,val:-9,+cov    `-- id:000005,src:000002+000003,op:splice,rep:4,+cov3 directories, 17 files\n\n\nqueue&#x2F; - 存放 AFL 生成的触发新代码路径的测试样本\n\ncrashes&#x2F; - 存放能触发待测程序崩溃的测试样本\n\nhangs&#x2F; - 存发导致待测程序超时的测试样本\n\nfuzzer_stats - 文本文件，包含了 fuzzer 的实时统计信息，如执行速度、路径覆盖等度量指标。这个文件不断更新以反映当前的 fuzzing 状态。\n\nplot_data - 文本文件，包含了 AFL 执行过程中的统计数据。使用 AFL 的 afl-plot 工具处理 plot_data 文件，可以生成 fuzz 过程的可视化图像。\n\nfuzz_bitmap - 这是用来记录路径覆盖率的位图（coverage bitmap），非人类可读。AFL 使用这个位图来跟踪程序在处理不同输入时执行的不同分支，用来帮助 AFL 识别新的、唯一的代码路径，以便后续生成更具有探索性的测试样本。\n\n\n四、AFL 的 QEMU 模式  前面的例子中，AFL 在对待测程序的源码进行编译时插桩。实际中，我们不一定能拿到待测源码，我们要测的可能是一个已经编译好的二进制文件。这种情况下 Libfuzzer 就无能为力了，但 AFL 还能用，这依赖于 AFL 的 QEMU 模式。\nAFL 的 QEMU 模式，也称为 AFL-QEMU，允许你在二进制模糊测试中使用 AFL，即使源代码不可用。这在对闭源应用进行模糊测试时非常有用。这种模式使用 QEMU 的用户模式仿真，来运行并分析非原生的二进制文件。以下是安装 AFL 的 QEMU 模式和使用步骤的指南：\n1. 编译 QEMU 支持  在 AFL 主目录下有一个专门的 QEMU 模式目录。进入该目录并编译 QEMU 模式，过程中可能缺少依赖项，根据提示进行安装即可：\n12cd qemu_mode./build_qemu_support.sh\n\n2. AFL-QEMU 使用步骤  用法很简单，在 AFL 运行命令中添加 -Q 参数即可：\n1afl-fuzz -i input -o output -Q -- /path/to/binary @@\n\n\n五、AFL 的升级版——AFL++AFL++ 可以看作是原始 AFL 的”增强版”，对 AFL 的调度策略和变异算法进行了很多改进，同时还引入了很多新特性，如 CMPLOG 和持久化这样的特性。\n1. CMPLOGCMPLOG 是 AFL++ 引入的一个新功能，类似于 Libfuzzer 中的 trace-cmp，它可以极大地提高代码覆盖率。CMPLOG 的主要作用是对程序中的所有比较操作进行记录，包括等于、不等于、小于等逻辑比较。当 fuzzer 执行时，CMPLOG 能够捕获比较操作的参数，并将对应的值添加到 fuzzer 的输入测试用例中。这个过程实际上帮助 fuzzer 更好地理解代码中期待的输入，特别是那些用于逻辑分支的字面值和魔法数字。这种理解能够导向更深入的路径覆盖，进而揭露隐藏更深的潜在缺陷。\n2. 持久化模式AFL 的持久化（persistent）模式允许目标程序在单个进程周期内重复执行多次模糊测试用例。这对性能产生了显著的提升，因为它减少了程序启动和终止的开销，特别是当测试的目标程序需要很大的初始化成本时。在 AFL++ 中，持久化模式的执行更为高效，它允许模糊器在目标程序中一次性执行多个测试用例，而非每次执行一个用例都重启目标程序。有了持久化模式，AFL++ 能够在相同的时间内执行更多的测试迭代，从而提高漏洞检测的速度。\n六、小结AFL 是一款强大的模糊测试工具，实践中 AFL++ 的应用非常广泛。相比 Libfuzzer，AFL++ 不局限于源码，并且支持多种 cpu 架构，还有丰富的插件生态可以使用。\n但模糊测试本身存在覆盖率瓶颈的问题，难以探索复杂的程序路径，这时候可以结合其他的技术，如符号执行来突破。","dateCreated":"2023-10-15T11:23:55+08:00","dateModified":"2024-04-09T15:59:36+08:00","datePublished":"2023-10-15T11:23:55+08:00","description":"模糊测试工具 AFL（American Fuzzy Lop）的原理介绍与实践应用","headline":"AFL 原理与实践","image":[],"mainEntityOfPage":{"@type":"WebPage","@id":"https://jiliguluss.github.io/2023/10/15/AFL%E5%8E%9F%E7%90%86%E4%B8%8E%E5%AE%9E%E8%B7%B5/"},"publisher":{"@type":"Organization","name":"一瓢清浅","sameAs":["#about","https://github.com/"],"image":"photo.jpg","logo":{"@type":"ImageObject","url":"photo.jpg"}},"url":"https://jiliguluss.github.io/2023/10/15/AFL%E5%8E%9F%E7%90%86%E4%B8%8E%E5%AE%9E%E8%B7%B5/","keywords":"AFL, Fuzz, 安全, 工具"}</script>
     <meta name="description" content="模糊测试工具 AFL（American Fuzzy Lop）的原理介绍与实践应用">
 <meta property="og:type" content="blog">
 <meta property="og:title" content="AFL 原理与实践">
@@ -25,10 +25,10 @@
 <meta property="article:published_time" content="2023-10-15T03:23:55.000Z">
 <meta property="article:modified_time" content="2024-04-09T07:59:36.416Z">
 <meta property="article:author" content="一瓢清浅">
-<meta property="article:tag" content="安全">
-<meta property="article:tag" content="工具">
 <meta property="article:tag" content="AFL">
 <meta property="article:tag" content="Fuzz">
+<meta property="article:tag" content="安全">
+<meta property="article:tag" content="工具">
 <meta name="twitter:card" content="summary">
 <meta name="twitter:image" content="https://jiliguluss.github.io/2023/10/15/AFL%E5%8E%9F%E7%90%86%E4%B8%8E%E5%AE%9E%E8%B7%B5/AFL%E8%BF%90%E8%A1%8C%E7%95%8C%E9%9D%A2.png">
     
diff --git "a/2024/01/23/Angr\351\233\266\345\237\272\347\241\200\345\205\245\351\227\250/index.html" "b/2024/01/23/Angr\351\233\266\345\237\272\347\241\200\345\205\245\351\227\250/index.html"
index 9b45eec..bd36d2b 100644
--- "a/2024/01/23/Angr\351\233\266\345\237\272\347\241\200\345\205\245\351\227\250/index.html"
+++ "b/2024/01/23/Angr\351\233\266\345\237\272\347\241\200\345\205\245\351\227\250/index.html"
@@ -13,7 +13,7 @@
     
     
     
-    <script type="application/ld+json">{"@context":"http://schema.org","@type":"BlogPosting","author":{"@type":"Person","name":"一瓢清浅","sameAs":["#about","https://github.com/"],"image":"photo.jpg"},"articleBody":"\n\n一、Angr 简介Angr 是一个由 Python 语言编写的开源二进制分析框架，它主要用于静态分析、符号执行、逆向工程等安全研究领域。Angr 支持多种操作系统和硬件架构，包括 Windows、Linux、macOS 以及 x86、ARM 等。\n二、Angr 整体架构1、核心组件Angr 是一个复杂的二进制分析框架，其初始的整体架构设计如下图：\n\n\nAngr 的核心组件自下而上依次为：\n\nCLE：加载可执行文件和库文件\n\narchinfo：获取架构信息\n\nPyVEX：将指令转换成 VEX 这种中间语言（IR）\n\nSimuVEX：模拟执行引擎，负责在虚拟环境中执行 VEX\n\nClaripy：用于创建和管理符号变量及条件约束，传递给 Z3 求解器进行求解\n\nAngr：将各个组件集成起来，提供一套整体的二进制分析和符号执行框架\n\nanalysis：提供一套分析工具，通过 CFG、DDG 等对程序进行分析\n\nsurveyors：用于记录和跟踪程序的可执行路径\n\n\n随着 Angr 的发展，部分组件有更新和迭代：\n\nSimuVEX 被移除，其组件已集成到 Angr 中\n\nsurveyors 被移除，被 SimulationManager 所取代\n\n\n2、运作流程Angr 的整体运作流程如图：\n\n\n使用 Angr 进行二进制分析时，各组件的运行步骤为：\n\nCLE 加载二进制，获取机器指令\n\nArchinfo 分析二进制的架构类型\n\nPyVEX 根据架构类型，将机器指令转换为 VEX 中间表达\n\nSimEngine 基于 VEX 来模拟程序执行\n\nClarify 创建和管理执行过程中的符号变量和约束条件，转化为 SMT 表达式，传递给 Z3 求解\n\nSimOS（SimProcedures） 模拟程序与系统的交互，如标准 io 流、文件读写、系统调用等操作\n\n\n三、Angr 使用说明1. 安装Angr 需要 python 3.8 以上的运行环境，需要先装 3.8 版本以上的 python。\n安装 Angr 有两种推荐方式：\n\npip 安装\n1pip install Angr\n\n源码安装\n123git clone https://github.com/Angr/Angr-dev.gitcd Angr-dev./setup.sh -i -e Angr\n\n2. 运行  建议在虚拟环境中运行 Angr。源码安装的方式可以自动创建名为 Angr 的虚拟环境。手动创建虚拟环境的命令为：\n1python3 -m venv Angr\n\n启动虚拟环境：\n1source Angr/bin/active\n\n3. 使用Angr 作为 python 的三方库，通过 import 进行调用：\n1import Angr\n\nAngr 的顶层 API 围绕着 Angr 的核心组件来设计，包含一组常用的 Python 类和对象，它们提供了二进制分析、符号执行和其他功能。\n以下是 Angr 的一些常用 API 组件：\n\nProject（项目）：\n\nProject是 Angr 的中心组件，它代表了用户所要处理的二进制文件。\n创建一个 Project 实例是使用 Angr 进行分析的第一步，Project对象提供了对二进制文件的操作和分析的接口。\n\n\nFactory（工厂）：\n\nFactory对象通过 Project 的factory属性来访问，它提供了快速访问 Angr 的各种分析技术的接口，避免复杂的实例化操作。\n\n\nSimState（模拟状态）：\n\nSimState代表程序的一个瞬时状态，它包含寄存器、内存、堆栈、文件系统等运行时的上下文环境状态，可用于执行符号执行和具体执行。\nSimState对象通过 Project 的factory属性的方法来访问，这些方法包括 entry_state、blank_state、full_init_state 等。\n\n\nSimulationManager（模拟管理器）：\n\nSimulationManager用来跟踪程序执行过程中的路径探索和 SimState 演化，并对这些路径和 SimState 进行管理。\nSimulationManager对象通过 Project 的factory属性的 simulation_manager 方法实例化。\n\n\nLoader（加载器）：\n\nLoader负责将二进制文件载入内存，并处理符号以及它们的地址空间，为后续分析提供详细信息，如入口点、可执行段、符号表等。\nLoader对象通过 Project 的loader属性的方法来访问。\n\n\nBlock（块）：\n\nBlock表示程序基本块，是 Angr 分析的基本单位。每个 Block 是一组顺序执行代码片段，具有原子性，以分支或跳转结尾。\nBlock对象通过 Project 的factory属性的 block 方法实例化。\n\n\n\n四、Angr 实践应用example.c 源码：\n12345678910111213141516171819202122232425262728293031323334#include &lt;stdio.h&gt;#include &lt;string.h&gt;#include &lt;stdint.h&gt;#include &lt;assert.h&gt;#define MAX_LEN 100int calculate(int number)&#123;    return number * number;&#125;int main()&#123;    char input[MAX_LEN];    printf(&quot;Enter the string: &quot;);    fgets(input, MAX_LEN, stdin);    int len = strlen(input);    int num = 0;    for(int i = 0; i &lt; len; i++) &#123;        if(input[i] &gt;= &#x27;0&#x27; &amp;&amp; input[i] &lt;= &#x27;9&#x27;)&#123;            num = num * 10 + (input[i] - &#x27;0&#x27;);        &#125;    &#125;    int res = calculate(num);    assert(res != 65536);    return 0;&#125;\n\n将 example.c 编译为 example_binary ：\n1gcc example.c -o example_binary\n\n以 example_binary 为例，演示 Angr 用法。\n1. 静态程序分析  首先用 Angr 定位程序入口：\n12345678910111213&gt;&gt;&gt; import angr&gt;&gt;&gt; project = angr.Project(&#x27;example_binary&#x27;, load_options=&#123;&#x27;auto_load_libs&#x27;: False&#125;)&gt;&gt;&gt; project.filename&#x27;example_binary&#x27;&gt;&gt;&gt; project.arch&lt;Arch AMD64 (LE)&gt;&gt;&gt;&gt; project.entry4198624&gt;&gt;&gt; bb = project.factory.block(4198624)&gt;&gt;&gt; bb.instructions12&gt;&gt;&gt; hex(bb.addr)&#x27;0x4010e0&#x27;\n\n这个 0x4010e0 地址对应的是程序的入口 block ，包括 12 条指令，在 CFG 中表示为如下节点，可以看到 block 的名字并不是 main，而是 _start ：\n\n\n接着从 _start 开始执行，执行一次后到达 ___libc_start_main ，然而再执行一次后并没有到达 main ：\n123456789101112&gt;&gt;&gt; st_0 = project.factory.entry_state()&gt;&gt;&gt; hex(st_0.addr)&#x27;0x4010e0&#x27;&gt;&gt;&gt; nx  = st_0.step()&gt;&gt;&gt; nx.successors[&lt;SimState @ 0x500000&gt;]&gt;&gt;&gt; st_1 = nx.successors[0]&gt;&gt;&gt; hex(st_1.addr)&#x27;0x500000&#x27;&gt;&gt;&gt; nx = st_1.step()&gt;&gt;&gt; nx.successors[&lt;SimState @ 0x4012e0&gt;]\n\n为了获取 main 这个 block 的状态，可以使用 SimulationManager 来执行：\n12345678&gt;&gt;&gt; simgr = project.factory.simulation_manager(st_0)&gt;&gt;&gt; main_obj = project.loader.main_object.get_symbol(&#x27;main&#x27;)&gt;&gt;&gt; hex(main_obj.rebased_addr)&#x27;0x4011dc&#x27;&gt;&gt;&gt; simgr.explore(find=main_obj.rebased_addr)&lt;SimulationManager with 1 found&gt;&gt;&gt;&gt; simgr.found[&lt;SimState @ 0x4011dc&gt;]\n\n\n\n2. 静态符号执行example_binary 接受一个最长为 100 位的字符串作为输入，提取字符串中的数字，转换成数值，然后进行平方运算，结果等于 65536 时出现断言错误。反推回来，当输入字符串中包含 2、5、6 这三个数字时，就能导致AssertionError。\n要让程序自动找到触发 example_binary 中 AssertionError 的 input，可以用 Angr 符号执行来求解。\n首先引入claripy，创建符号变量：\n1234&gt;&gt;&gt; import claripy&gt;&gt;&gt; input_size = 100&gt;&gt;&gt; symbolic_buffer = claripy.BVS(&#x27;input&#x27;, 8 * (input_size - 1))&gt;&gt;&gt; entry_state = project.factory.entry_state(stdin=claripy.Concat(symbolic_buffer, claripy.BVV(b&#x27;\\n&#x27;)))\n\n通过 CFG 可以找到 AssertionError 的 block 地址为0x4010c0：\n\n\n然后用 SimulationManager 控制程序朝 AssertionError 开始探索：\n1234567891011121314151617181920212223&gt;&gt;&gt; simgr = project.factory.simulation_manager(entry_state)&gt;&gt;&gt; simgr.explore(find=0x4010c0)WARNING  | 2024-03-11 17:27:02,034 | angr.storage.memory_mixins.default_filler_mixin | The program is accessing memory with an unspecified value. This could indicate unwanted behavior.WARNING  | 2024-03-11 17:27:03,808 | angr.storage.memory_mixins.default_filler_mixin | angr will cope with this by generating an unconstrained symbolic variable and continuing. You can resolve this by:WARNING  | 2024-03-11 17:27:03,808 | angr.storage.memory_mixins.default_filler_mixin | 1) setting a value to the initial stateWARNING  | 2024-03-11 17:27:03,808 | angr.storage.memory_mixins.default_filler_mixin | 2) adding the state option ZERO_FILL_UNCONSTRAINED_&#123;MEMORY,REGISTERS&#125;, to make unknown regions hold nullWARNING  | 2024-03-11 17:27:03,808 | angr.storage.memory_mixins.default_filler_mixin | 3) adding the state option SYMBOL_FILL_UNCONSTRAINED_&#123;MEMORY,REGISTERS&#125;, to suppress these messages.WARNING  | 2024-03-11 17:27:03,994 | angr.storage.memory_mixins.default_filler_mixin | Filling memory at 0x7fffffffffeff70 with 1 unconstrained bytes referenced from 0x500010 (strlen+0x0 in extern-address space (0x10))&lt;SimulationManager with 829 active, 20 deadended, 1 found&gt;&gt;&gt;&gt;&gt;&gt;&gt; simgr.found[&lt;SimState @ 0x4010c0&gt;]&gt;&gt;&gt; found_state = simgr.found[0]&gt;&gt;&gt; found_state&lt;SimState @ 0x4010c0&gt;&gt;&gt;&gt; found_state.solver.eval(symbolic_buffer, cast_to=bytes)b&#x27;256\\x00\\x00\\x00\\x01\\x00\\x00\\x00\\x80\\x01\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00@ \\x08\\x08\\x00\\x02\\x00 \\x00\\x00\\x80\\x00\\x00\\x00@\\x00\\x01 \\x02\\x10\\x00\\x01 \\x10\\x00@\\x04\\x80\\x80\\x01\\x80\\x01@\\x02\\x08\\x08\\x04\\x80\\x01@\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00&#x27;&gt;&gt;&gt; len(found_state.solver.eval(symbolic_buffer, cast_to=bytes))99&gt;&gt;&gt; found_state.solver.constraints[&lt;Bool !(input_3_792[791:784] == 10)&gt;, &lt;Bool !(input_3_792[783:776] == 10)&gt;, &lt;Bool !(input_3_792[775:768] == 10)&gt;, &lt;Bool !(input_3_792[767:760] == 10)&gt;, &lt;Bool !(input_3_792[759:752] == 10)&gt;, &lt;Bool !(input_3_792[751:744] == 10)&gt;, &lt;Bool !(input_3_792[743:736] == 10)&gt;, &lt;Bool !(input_3_792[735:728] == 10)&gt;, &lt;Bool !(input_3_792[727:720] == 10)&gt;, &lt;Bool !(input_3_792[719:712] == 10)&gt;, &lt;Bool !(input_3_792[711:704] == 10)&gt;, &lt;Bool !(input_3_792[703:696] == 10)&gt;, &lt;Bool !……\n\n可以看到虽然很慢，但是 Angr 成功地算出了一个可以触发 AssertionError 的输入。计算结果保存在 SimulationManager 的found属性中，每个结果是一个 SimState 实例，通过 SimState 的solver属性可以查看可行解与约束条件。\n五、同类工具\n\n\n特性 \\ 工具\nAngr\nBAP\nTriton\nBinary Ninja\nGhidra\n\n\n\n发布年份\n2015\n2011\n2015\n2016\n2019\n\n\n开发语言\nPython\nOCaml (接口: C&#x2F;Python)\nC++ (接口: Python)\nC++\nJava\n\n\n模块化\n✅\n✅\n❌\n✅\n✅\n\n\n插件系统\n✅\n✅\n❌\n✅\n✅\n\n\n符号执行\n✅\n✅\n✅\n❌\n✅\n\n\n污点分析\n✅\n部分支持\n✅\n✅\n✅\n\n\n动静态分析\n均支持\n主要是静态分析\n主要是动态分析\n主要静态分析\n均支持\n\n\n形式化验证\n有限支持\n✅\n❌\n❌\n通过插件\n\n\n中间表示\nVEX IR\nMicrocode\nTriton IR\nLLIL&#x2F;MLIL&#x2F;HLIL\nP-Code\n\n\n社区活跃度\n高\n中\n低\n高\n高\n\n\n专长领域\n全栈式分析\n可扩展性与形式化验证\n动态分析与污点追踪\n逆向工程\n逆向工程\n\n\n跨平台支持\n广泛\n广泛\n有限\n广泛\n广泛\n\n\n学习曲线\n中等\n较高\n中等\n中等\n中等\n\n\n应用场景\nCTF&#x2F; 漏洞研究 &#x2F; 二进制加固\n安全研究 &#x2F; 形式化验证\n精确污点追踪 &#x2F; 变量跟踪\n逆向工程\n逆向工程\n\n\n开源\n✅\n部分开源\n✅\n社区版开源\n✅\n\n","dateCreated":"2024-01-23T13:45:08+08:00","dateModified":"2024-04-09T16:00:20+08:00","datePublished":"2024-01-23T13:45:08+08:00","description":"Angr 是一款二进制分析和符号执行工具，常用于 CTF 和安全测试领域","headline":"符号执行工具——Angr 零基础入门","image":[],"mainEntityOfPage":{"@type":"WebPage","@id":"https://jiliguluss.github.io/2024/01/23/Angr%E9%9B%B6%E5%9F%BA%E7%A1%80%E5%85%A5%E9%97%A8/"},"publisher":{"@type":"Organization","name":"一瓢清浅","sameAs":["#about","https://github.com/"],"image":"photo.jpg","logo":{"@type":"ImageObject","url":"photo.jpg"}},"url":"https://jiliguluss.github.io/2024/01/23/Angr%E9%9B%B6%E5%9F%BA%E7%A1%80%E5%85%A5%E9%97%A8/","keywords":"Angr, CTF, 安全, 工具"}</script>
+    <script type="application/ld+json">{"@context":"http://schema.org","@type":"BlogPosting","author":{"@type":"Person","name":"一瓢清浅","sameAs":["#about","https://github.com/"],"image":"photo.jpg"},"articleBody":"\n\n一、Angr 简介Angr 是一个由 Python 语言编写的开源二进制分析框架，它主要用于静态分析、符号执行、逆向工程等安全研究领域。Angr 支持多种操作系统和硬件架构，包括 Windows、Linux、macOS 以及 x86、ARM 等。\n二、Angr 整体架构1、核心组件Angr 是一个复杂的二进制分析框架，其初始的整体架构设计如下图：\n\n\nAngr 的核心组件自下而上依次为：\n\nCLE：加载可执行文件和库文件\n\narchinfo：获取架构信息\n\nPyVEX：将指令转换成 VEX 这种中间语言（IR）\n\nSimuVEX：模拟执行引擎，负责在虚拟环境中执行 VEX\n\nClaripy：用于创建和管理符号变量及条件约束，传递给 Z3 求解器进行求解\n\nAngr：将各个组件集成起来，提供一套整体的二进制分析和符号执行框架\n\nanalysis：提供一套分析工具，通过 CFG、DDG 等对程序进行分析\n\nsurveyors：用于记录和跟踪程序的可执行路径\n\n\n随着 Angr 的发展，部分组件有更新和迭代：\n\nSimuVEX 被移除，其组件已集成到 Angr 中\n\nsurveyors 被移除，被 SimulationManager 所取代\n\n\n2、运作流程Angr 的整体运作流程如图：\n\n\n使用 Angr 进行二进制分析时，各组件的运行步骤为：\n\nCLE 加载二进制，获取机器指令\n\nArchinfo 分析二进制的架构类型\n\nPyVEX 根据架构类型，将机器指令转换为 VEX 中间表达\n\nSimEngine 基于 VEX 来模拟程序执行\n\nClarify 创建和管理执行过程中的符号变量和约束条件，转化为 SMT 表达式，传递给 Z3 求解\n\nSimOS（SimProcedures） 模拟程序与系统的交互，如标准 io 流、文件读写、系统调用等操作\n\n\n三、Angr 使用说明1. 安装Angr 需要 python 3.8 以上的运行环境，需要先装 3.8 版本以上的 python。\n安装 Angr 有两种推荐方式：\n\npip 安装\n1pip install Angr\n\n源码安装\n123git clone https://github.com/Angr/Angr-dev.gitcd Angr-dev./setup.sh -i -e Angr\n\n2. 运行  建议在虚拟环境中运行 Angr。源码安装的方式可以自动创建名为 Angr 的虚拟环境。手动创建虚拟环境的命令为：\n1python3 -m venv Angr\n\n启动虚拟环境：\n1source Angr/bin/active\n\n3. 使用Angr 作为 python 的三方库，通过 import 进行调用：\n1import Angr\n\nAngr 的顶层 API 围绕着 Angr 的核心组件来设计，包含一组常用的 Python 类和对象，它们提供了二进制分析、符号执行和其他功能。\n以下是 Angr 的一些常用 API 组件：\n\nProject（项目）：\n\nProject是 Angr 的中心组件，它代表了用户所要处理的二进制文件。\n创建一个 Project 实例是使用 Angr 进行分析的第一步，Project对象提供了对二进制文件的操作和分析的接口。\n\n\nFactory（工厂）：\n\nFactory对象通过 Project 的factory属性来访问，它提供了快速访问 Angr 的各种分析技术的接口，避免复杂的实例化操作。\n\n\nSimState（模拟状态）：\n\nSimState代表程序的一个瞬时状态，它包含寄存器、内存、堆栈、文件系统等运行时的上下文环境状态，可用于执行符号执行和具体执行。\nSimState对象通过 Project 的factory属性的方法来访问，这些方法包括 entry_state、blank_state、full_init_state 等。\n\n\nSimulationManager（模拟管理器）：\n\nSimulationManager用来跟踪程序执行过程中的路径探索和 SimState 演化，并对这些路径和 SimState 进行管理。\nSimulationManager对象通过 Project 的factory属性的 simulation_manager 方法实例化。\n\n\nLoader（加载器）：\n\nLoader负责将二进制文件载入内存，并处理符号以及它们的地址空间，为后续分析提供详细信息，如入口点、可执行段、符号表等。\nLoader对象通过 Project 的loader属性的方法来访问。\n\n\nBlock（块）：\n\nBlock表示程序基本块，是 Angr 分析的基本单位。每个 Block 是一组顺序执行代码片段，具有原子性，以分支或跳转结尾。\nBlock对象通过 Project 的factory属性的 block 方法实例化。\n\n\n\n四、Angr 实践应用example.c 源码：\n12345678910111213141516171819202122232425262728293031323334#include &lt;stdio.h&gt;#include &lt;string.h&gt;#include &lt;stdint.h&gt;#include &lt;assert.h&gt;#define MAX_LEN 100int calculate(int number)&#123;    return number * number;&#125;int main()&#123;    char input[MAX_LEN];    printf(&quot;Enter the string: &quot;);    fgets(input, MAX_LEN, stdin);    int len = strlen(input);    int num = 0;    for(int i = 0; i &lt; len; i++) &#123;        if(input[i] &gt;= &#x27;0&#x27; &amp;&amp; input[i] &lt;= &#x27;9&#x27;)&#123;            num = num * 10 + (input[i] - &#x27;0&#x27;);        &#125;    &#125;    int res = calculate(num);    assert(res != 65536);    return 0;&#125;\n\n将 example.c 编译为 example_binary ：\n1gcc example.c -o example_binary\n\n以 example_binary 为例，演示 Angr 用法。\n1. 静态程序分析  首先用 Angr 定位程序入口：\n12345678910111213&gt;&gt;&gt; import angr&gt;&gt;&gt; project = angr.Project(&#x27;example_binary&#x27;, load_options=&#123;&#x27;auto_load_libs&#x27;: False&#125;)&gt;&gt;&gt; project.filename&#x27;example_binary&#x27;&gt;&gt;&gt; project.arch&lt;Arch AMD64 (LE)&gt;&gt;&gt;&gt; project.entry4198624&gt;&gt;&gt; bb = project.factory.block(4198624)&gt;&gt;&gt; bb.instructions12&gt;&gt;&gt; hex(bb.addr)&#x27;0x4010e0&#x27;\n\n这个 0x4010e0 地址对应的是程序的入口 block ，包括 12 条指令，在 CFG 中表示为如下节点，可以看到 block 的名字并不是 main，而是 _start ：\n\n\n接着从 _start 开始执行，执行一次后到达 ___libc_start_main ，然而再执行一次后并没有到达 main ：\n123456789101112&gt;&gt;&gt; st_0 = project.factory.entry_state()&gt;&gt;&gt; hex(st_0.addr)&#x27;0x4010e0&#x27;&gt;&gt;&gt; nx  = st_0.step()&gt;&gt;&gt; nx.successors[&lt;SimState @ 0x500000&gt;]&gt;&gt;&gt; st_1 = nx.successors[0]&gt;&gt;&gt; hex(st_1.addr)&#x27;0x500000&#x27;&gt;&gt;&gt; nx = st_1.step()&gt;&gt;&gt; nx.successors[&lt;SimState @ 0x4012e0&gt;]\n\n为了获取 main 这个 block 的状态，可以使用 SimulationManager 来执行：\n12345678&gt;&gt;&gt; simgr = project.factory.simulation_manager(st_0)&gt;&gt;&gt; main_obj = project.loader.main_object.get_symbol(&#x27;main&#x27;)&gt;&gt;&gt; hex(main_obj.rebased_addr)&#x27;0x4011dc&#x27;&gt;&gt;&gt; simgr.explore(find=main_obj.rebased_addr)&lt;SimulationManager with 1 found&gt;&gt;&gt;&gt; simgr.found[&lt;SimState @ 0x4011dc&gt;]\n\n\n\n2. 静态符号执行example_binary 接受一个最长为 100 位的字符串作为输入，提取字符串中的数字，转换成数值，然后进行平方运算，结果等于 65536 时出现断言错误。反推回来，当输入字符串中包含 2、5、6 这三个数字时，就能导致AssertionError。\n要让程序自动找到触发 example_binary 中 AssertionError 的 input，可以用 Angr 符号执行来求解。\n首先引入claripy，创建符号变量：\n1234&gt;&gt;&gt; import claripy&gt;&gt;&gt; input_size = 100&gt;&gt;&gt; symbolic_buffer = claripy.BVS(&#x27;input&#x27;, 8 * (input_size - 1))&gt;&gt;&gt; entry_state = project.factory.entry_state(stdin=claripy.Concat(symbolic_buffer, claripy.BVV(b&#x27;\\n&#x27;)))\n\n通过 CFG 可以找到 AssertionError 的 block 地址为0x4010c0：\n\n\n然后用 SimulationManager 控制程序朝 AssertionError 开始探索：\n1234567891011121314151617181920212223&gt;&gt;&gt; simgr = project.factory.simulation_manager(entry_state)&gt;&gt;&gt; simgr.explore(find=0x4010c0)WARNING  | 2024-03-11 17:27:02,034 | angr.storage.memory_mixins.default_filler_mixin | The program is accessing memory with an unspecified value. This could indicate unwanted behavior.WARNING  | 2024-03-11 17:27:03,808 | angr.storage.memory_mixins.default_filler_mixin | angr will cope with this by generating an unconstrained symbolic variable and continuing. You can resolve this by:WARNING  | 2024-03-11 17:27:03,808 | angr.storage.memory_mixins.default_filler_mixin | 1) setting a value to the initial stateWARNING  | 2024-03-11 17:27:03,808 | angr.storage.memory_mixins.default_filler_mixin | 2) adding the state option ZERO_FILL_UNCONSTRAINED_&#123;MEMORY,REGISTERS&#125;, to make unknown regions hold nullWARNING  | 2024-03-11 17:27:03,808 | angr.storage.memory_mixins.default_filler_mixin | 3) adding the state option SYMBOL_FILL_UNCONSTRAINED_&#123;MEMORY,REGISTERS&#125;, to suppress these messages.WARNING  | 2024-03-11 17:27:03,994 | angr.storage.memory_mixins.default_filler_mixin | Filling memory at 0x7fffffffffeff70 with 1 unconstrained bytes referenced from 0x500010 (strlen+0x0 in extern-address space (0x10))&lt;SimulationManager with 829 active, 20 deadended, 1 found&gt;&gt;&gt;&gt;&gt;&gt;&gt; simgr.found[&lt;SimState @ 0x4010c0&gt;]&gt;&gt;&gt; found_state = simgr.found[0]&gt;&gt;&gt; found_state&lt;SimState @ 0x4010c0&gt;&gt;&gt;&gt; found_state.solver.eval(symbolic_buffer, cast_to=bytes)b&#x27;256\\x00\\x00\\x00\\x01\\x00\\x00\\x00\\x80\\x01\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00@ \\x08\\x08\\x00\\x02\\x00 \\x00\\x00\\x80\\x00\\x00\\x00@\\x00\\x01 \\x02\\x10\\x00\\x01 \\x10\\x00@\\x04\\x80\\x80\\x01\\x80\\x01@\\x02\\x08\\x08\\x04\\x80\\x01@\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00\\x00&#x27;&gt;&gt;&gt; len(found_state.solver.eval(symbolic_buffer, cast_to=bytes))99&gt;&gt;&gt; found_state.solver.constraints[&lt;Bool !(input_3_792[791:784] == 10)&gt;, &lt;Bool !(input_3_792[783:776] == 10)&gt;, &lt;Bool !(input_3_792[775:768] == 10)&gt;, &lt;Bool !(input_3_792[767:760] == 10)&gt;, &lt;Bool !(input_3_792[759:752] == 10)&gt;, &lt;Bool !(input_3_792[751:744] == 10)&gt;, &lt;Bool !(input_3_792[743:736] == 10)&gt;, &lt;Bool !(input_3_792[735:728] == 10)&gt;, &lt;Bool !(input_3_792[727:720] == 10)&gt;, &lt;Bool !(input_3_792[719:712] == 10)&gt;, &lt;Bool !(input_3_792[711:704] == 10)&gt;, &lt;Bool !(input_3_792[703:696] == 10)&gt;, &lt;Bool !……\n\n可以看到虽然很慢，但是 Angr 成功地算出了一个可以触发 AssertionError 的输入。计算结果保存在 SimulationManager 的found属性中，每个结果是一个 SimState 实例，通过 SimState 的solver属性可以查看可行解与约束条件。\n五、同类工具\n\n\n特性 \\ 工具\nAngr\nBAP\nTriton\nBinary Ninja\nGhidra\n\n\n\n发布年份\n2015\n2011\n2015\n2016\n2019\n\n\n开发语言\nPython\nOCaml (接口: C&#x2F;Python)\nC++ (接口: Python)\nC++\nJava\n\n\n模块化\n✅\n✅\n❌\n✅\n✅\n\n\n插件系统\n✅\n✅\n❌\n✅\n✅\n\n\n符号执行\n✅\n✅\n✅\n❌\n✅\n\n\n污点分析\n✅\n部分支持\n✅\n✅\n✅\n\n\n动静态分析\n均支持\n主要是静态分析\n主要是动态分析\n主要静态分析\n均支持\n\n\n形式化验证\n有限支持\n✅\n❌\n❌\n通过插件\n\n\n中间表示\nVEX IR\nMicrocode\nTriton IR\nLLIL&#x2F;MLIL&#x2F;HLIL\nP-Code\n\n\n社区活跃度\n高\n中\n低\n高\n高\n\n\n专长领域\n全栈式分析\n可扩展性与形式化验证\n动态分析与污点追踪\n逆向工程\n逆向工程\n\n\n跨平台支持\n广泛\n广泛\n有限\n广泛\n广泛\n\n\n学习曲线\n中等\n较高\n中等\n中等\n中等\n\n\n应用场景\nCTF&#x2F; 漏洞研究 &#x2F; 二进制加固\n安全研究 &#x2F; 形式化验证\n精确污点追踪 &#x2F; 变量跟踪\n逆向工程\n逆向工程\n\n\n开源\n✅\n部分开源\n✅\n社区版开源\n✅\n\n\n六、参考资料\nangr 原理与实践（一）——原理\nangr 官方文档\nangr 系列教程(一）核心概念及模块解读\nAngr 初学笔记\nBinary 自动分析的那些事\n","dateCreated":"2024-01-23T13:45:08+08:00","dateModified":"2024-04-19T09:47:57+08:00","datePublished":"2024-01-23T13:45:08+08:00","description":"Angr 是一款二进制分析和符号执行工具，常用于 CTF 和安全测试领域","headline":"符号执行工具——Angr 零基础入门","image":[],"mainEntityOfPage":{"@type":"WebPage","@id":"https://jiliguluss.github.io/2024/01/23/Angr%E9%9B%B6%E5%9F%BA%E7%A1%80%E5%85%A5%E9%97%A8/"},"publisher":{"@type":"Organization","name":"一瓢清浅","sameAs":["#about","https://github.com/"],"image":"photo.jpg","logo":{"@type":"ImageObject","url":"photo.jpg"}},"url":"https://jiliguluss.github.io/2024/01/23/Angr%E9%9B%B6%E5%9F%BA%E7%A1%80%E5%85%A5%E9%97%A8/","keywords":"安全, 工具, Angr, CTF"}</script>
     <meta name="description" content="Angr 是一款二进制分析和符号执行工具，常用于 CTF 和安全测试领域">
 <meta property="og:type" content="blog">
 <meta property="og:title" content="符号执行工具——Angr 零基础入门">
@@ -26,12 +26,12 @@
 <meta property="og:image" content="https://jiliguluss.github.io/2024/01/23/Angr%E9%9B%B6%E5%9F%BA%E7%A1%80%E5%85%A5%E9%97%A8/%E6%89%A7%E8%A1%8Cblock.png">
 <meta property="og:image" content="https://jiliguluss.github.io/2024/01/23/Angr%E9%9B%B6%E5%9F%BA%E7%A1%80%E5%85%A5%E9%97%A8/AssertError%E8%8A%82%E7%82%B9.png">
 <meta property="article:published_time" content="2024-01-23T05:45:08.000Z">
-<meta property="article:modified_time" content="2024-04-09T08:00:20.286Z">
+<meta property="article:modified_time" content="2024-04-19T01:47:57.586Z">
 <meta property="article:author" content="一瓢清浅">
-<meta property="article:tag" content="Angr">
-<meta property="article:tag" content="CTF">
 <meta property="article:tag" content="安全">
 <meta property="article:tag" content="工具">
+<meta property="article:tag" content="Angr">
+<meta property="article:tag" content="CTF">
 <meta name="twitter:card" content="summary">
 <meta name="twitter:image" content="https://jiliguluss.github.io/2024/01/23/Angr%E9%9B%B6%E5%9F%BA%E7%A1%80%E5%85%A5%E9%97%A8/Angr%E6%A0%B8%E5%BF%83%E7%BB%84%E4%BB%B6.png">
     
@@ -548,6 +548,13 @@ <h2 id="五、同类工具"><a href="# 五、同类工具" class="headerlink" ti
 <td>✅</td>
 </tr>
 </tbody></table>
+<h2 id="六、参考资料"><a href="# 六、参考资料" class="headerlink" title="六、参考资料"></a>六、参考资料</h2><ol>
+<li><a target="_blank" rel="noopener" href="https://www.cnblogs.com/welkinchan/p/16483119.html">angr 原理与实践（一）——原理</a></li>
+<li><a target="_blank" rel="noopener" href="https://docs.angr.io/en/latest/">angr 官方文档</a></li>
+<li><a target="_blank" rel="noopener" href="https://xz.aliyun.com/t/7117?time__1311=n4+xnD0GDtKYqAKAx05+bDyiDu7DgiiegjjYD&alichlgref=https://www.google.com/">angr 系列教程(一）核心概念及模块解读</a></li>
+<li><a target="_blank" rel="noopener" href="https://www.kn0sky.com/?p=0e2f9462-df20-4705-83c2-4ff36b5b0c40#angr-%E5%88%9D%E5%AD%A6%E7%AC%94%E8%AE%B0">Angr 初学笔记</a></li>
+<li><a target="_blank" rel="noopener" href="https://hitcon.org/2016/CMT/slide/day1-r1-a-1.pdf">Binary 自动分析的那些事</a></li>
+</ol>
             
 
 
diff --git "a/2024/02/27/Symbion\345\210\235\346\216\242/index.html" "b/2024/02/27/Symbion\345\210\235\346\216\242/index.html"
index 6580d71..b51f45f 100644
--- "a/2024/02/27/Symbion\345\210\235\346\216\242/index.html"
+++ "b/2024/02/27/Symbion\345\210\235\346\216\242/index.html"
@@ -13,7 +13,7 @@
     
     
     
-    <script type="application/ld+json">{"@context":"http://schema.org","@type":"BlogPosting","author":{"@type":"Person","name":"一瓢清浅","sameAs":["#about","https://github.com/"],"image":"photo.jpg"},"articleBody":"\n\n一、原理介绍  原始论文：SYMBION: Interleaving Symbolic with Concrete Execution\n官方博客：symbion: fusing concrete and symbolic execution\n1. 背景  符号执行可以用来获取走到指定程序区块的可行输入，但是符号执行在实际应用中面临很多挑战：\n\n路径爆炸问题：符号执行从程序入口开始探索，当程序中出现分支和循环时，会导致路径状态呈指数增长。\n\n环境交互问题：当程序与系统或三方库进行交互时，由于缺失源码或交互复杂等原因，会阻碍符号执行的状态更新。\n\n\n2. 方案Symbion 通过具体执行环境与符号执行环境的同步与切换，实现具体值和符号值交替执行。通过这种交替执行机制，减少符号执行探索的路径状态，并解决程序对外部环境的依赖问题。\n图中演示了具体执行环境与符号执行环境相互切换的过程：\n\n\n目标是对从 PoI 到TP的路径进行符号推理，CSP节点是程序入口。从 CSP 到PoI要经过复杂的运算和交互，这导致直接从 CSP 开始符号推理，将无法向后演进到PoI。\n使用 Symbion 时，首先将具体值输入给 CSP，在具体执行后到达PoI。然后在PoI 切换到符号执行环境，算出到达 TP 所需的变量取值。再将算出来的结果同步给具体执行环境，在 PoI 恢复具体执行，即可到达TP。\n3. 实现Symbion 的架构设计如下：\n\n\nSymbion 在 Angr 的基础上，增加了如下组件：\n\nConcrete Target：定义了与具体执行环境交互的方法，通过实现这些方法可以让 Symbion 支持特定的交互环境。例如 Symbion 实现的GDBConcreteTarget，它通过 gdbsever 控制远程目标程序的交互。\n\nread_memory(address, nbytes)：从具体进程内存中 address 开始读取 nbytes 字节。\nwrite_memory(address, value)：在具体进程内存中 address 处写入value。\nread_register(register)：返回具体进程中指定 register 的内容。\nwrite_register(register, value)：在具体进程的 register 中写入value。\nset_breakpoint(address)：在具体进程中的 address 处设置断点。\nremove_breakpoint(address)：移除之前在 address 处设置的断点。\nrun()：恢复具体进程的执行。\n\n\nSimEngineConcrete：利用 Concrete Target 的方法执行以下步骤，实现 Symbolic 环境到 Concrete 环境的切换。\n\n用用户提供的值修改具体进程的内存。\n用用户提供的值修改具体进程的寄存器。\n通过断点来设置新的PoI。\n恢复程序的具体执行，直到到达新的PoI，并将控制权交还给 Angr。\n\n\nConcrete SimPlugin：当具体执行到达 PoI，这个插件实现Concrete 环境到 Symbolic 环境的切换，它将具体状态导入 Angr 来创建SimState。\n\n将 SimState 的内存后端重定向到具体进程的内存，即在符号执行过程中，SimState的内存读取都是从具体进程中来操作。\n\n将具体进程中的寄存器值复制到 SimState 中。\n\n将具体进程的内存映射与 Angr 在启动期间加载的内存映射同步。\n\n\n\nSYMBION Exploration Technique：提供用户使用 Symbion 的 API ，通过这些 API ，用户指定 PoI 的地址，在具体执行到达 PoI 后，Symbion 切换为符号执行。\n\n\n简而言之，在 Symbion 的工作流程中，各组件的作用为：\n\n用户通过 SYMBION Exploration Technique 指定PoI。\n\n程序经过具体执行到达到 PoI 后暂停， Concrete SimPlugin 根据具体执行环境来创建一个SimState。\n\nAngr 通过符号执行，计算到达下一个 PoI 的可行解。\n\nSimEngineConcrete 用 Angr 算出来的结果修改具体进程中的变量，恢复具体执行直到下一个PoI。\n\n\n二、示例分析Symbion 官方示例：test_concrete_not_packed_elf64\n示例使用的二进制：not_packed_elf64\n二进制没有给源码，通过 IDA 逆向源码，并用 AI 改写，得到 C 源码如下，源码中取 dest 变量中的一串数值做判断，不同的分支触发不同的print。\n\n\n在 Symbion 的示例代码中，首先通过具体执行到达 BINARY_DECISION_ADDRESS，然后用符号执行探索从BINARY_DECISION_ADDRESS 到DROP_STAGE2_V2的路径。\n\n\n在符号执行求解成功后，再将求解结果传递给具体执行环境，并启动具体执行，即可到达DROP_STAGE2_V2：\n\n\n结合 CFG 和源码可以看到，符号执行的起点 BINARY_DECISION_ADDRESS 对应源码图右侧 55 行，符号执行的终点 DROP_STAGE2_V2 对应源码图右侧 77 行。通过 Symbion，实现了对二进制按指定路径的进行分析的目的。\n\n\nSymbion 的示例代码中，涉及到很多内存地址操作，需要结合 IDA 的反编译源码来看：\n\n\n\nline 2：启动具体执行，到 BINARY_DECISION_ADDRESS 停下，即 IDA 反编译源码第 67 行代码\n\nline 3：从具体执行环境的获取寄存器中的栈指针sp，指向栈顶（即栈开始的位置）\n\nline 4：从栈顶 sp 开始读取 20 个字节的内存，这块内存包括反编译源码中的变量 i 和v5\n\nline 5：判断是否为符号变量，此时为具体执行环境，所以不是符号变量\n\nline 7：定义符号变量，变量名为arg0，大小为 32 字节\n\nline 8：用 symbolic_buffer_memory 指向具体执行环境中 rbp-0xc0 的内存地址，它对应 IDA 反编译源码中的数组 s 的起始地址。\n\nline 10：从 symbolic_buffer_memory 开始加载 36 个字节的内存\n\nline 11：判断是否为符号变量，此时为具体执行环境，所以不是符号变量\n\nline 12：将 angr0 存储到symbolic_buffer_memory，将符号变量与具体执行环境的内存地址关联起来\n\nline 15：从 symbolic_buffer_memory 开始加载 36 个字节的内存\n\nline 16：判断是否为符号变量，因为 把 angr0 保存到这块内存，所以是符号变量\n\nline 19：符号执行状态初始化\n\nline 37：启动符号执行\n\n\n可以看到，Symbion 在切换具体执行环境和符号执行环境时，是通过内存地址把变量的具体值和符号值对应起来。需要结合 IDA 反编译的源码中给出的变量地址和内存大小，人工设置符号执行中所需要的符号变量，难以实现自动化。","dateCreated":"2024-02-27T16:33:24+08:00","dateModified":"2024-04-09T16:00:29+08:00","datePublished":"2024-02-27T16:33:24+08:00","description":"Symbion 是 Angr 的一款插件，可以实现具体执行与符号执行交替运行","headline":"交替符号执行工具——Symbion 初探","image":[],"mainEntityOfPage":{"@type":"WebPage","@id":"https://jiliguluss.github.io/2024/02/27/Symbion%E5%88%9D%E6%8E%A2/"},"publisher":{"@type":"Organization","name":"一瓢清浅","sameAs":["#about","https://github.com/"],"image":"photo.jpg","logo":{"@type":"ImageObject","url":"photo.jpg"}},"url":"https://jiliguluss.github.io/2024/02/27/Symbion%E5%88%9D%E6%8E%A2/","keywords":"Angr, 安全, 工具"}</script>
+    <script type="application/ld+json">{"@context":"http://schema.org","@type":"BlogPosting","author":{"@type":"Person","name":"一瓢清浅","sameAs":["#about","https://github.com/"],"image":"photo.jpg"},"articleBody":"\n\n一、原理介绍  原始论文：SYMBION: Interleaving Symbolic with Concrete Execution\n官方博客：symbion: fusing concrete and symbolic execution\n1. 背景  符号执行可以用来获取走到指定程序区块的可行输入，但是符号执行在实际应用中面临很多挑战：\n\n路径爆炸问题：符号执行从程序入口开始探索，当程序中出现分支和循环时，会导致路径状态呈指数增长。\n\n环境交互问题：当程序与系统或三方库进行交互时，由于缺失源码或交互复杂等原因，会阻碍符号执行的状态更新。\n\n\n2. 方案Symbion 通过具体执行环境与符号执行环境的同步与切换，实现具体值和符号值交替执行。通过这种交替执行机制，减少符号执行探索的路径状态，并解决程序对外部环境的依赖问题。\n图中演示了具体执行环境与符号执行环境相互切换的过程：\n\n\n目标是对从 PoI 到TP的路径进行符号推理，CSP节点是程序入口。从 CSP 到PoI要经过复杂的运算和交互，这导致直接从 CSP 开始符号推理，将无法向后演进到PoI。\n使用 Symbion 时，首先将具体值输入给 CSP，在具体执行后到达PoI。然后在PoI 切换到符号执行环境，算出到达 TP 所需的变量取值。再将算出来的结果同步给具体执行环境，在 PoI 恢复具体执行，即可到达TP。\n3. 实现Symbion 的架构设计如下：\n\n\nSymbion 在 Angr 的基础上，增加了如下组件：\n\nConcrete Target：定义了与具体执行环境交互的方法，通过实现这些方法可以让 Symbion 支持特定的交互环境。例如 Symbion 实现的GDBConcreteTarget，它通过 gdbsever 控制远程目标程序的交互。\n\nread_memory(address, nbytes)：从具体进程内存中 address 开始读取 nbytes 字节。\nwrite_memory(address, value)：在具体进程内存中 address 处写入value。\nread_register(register)：返回具体进程中指定 register 的内容。\nwrite_register(register, value)：在具体进程的 register 中写入value。\nset_breakpoint(address)：在具体进程中的 address 处设置断点。\nremove_breakpoint(address)：移除之前在 address 处设置的断点。\nrun()：恢复具体进程的执行。\n\n\nSimEngineConcrete：利用 Concrete Target 的方法执行以下步骤，实现 Symbolic 环境到 Concrete 环境的切换。\n\n用用户提供的值修改具体进程的内存。\n用用户提供的值修改具体进程的寄存器。\n通过断点来设置新的PoI。\n恢复程序的具体执行，直到到达新的PoI，并将控制权交还给 Angr。\n\n\nConcrete SimPlugin：当具体执行到达 PoI，这个插件实现Concrete 环境到 Symbolic 环境的切换，它将具体状态导入 Angr 来创建SimState。\n\n将 SimState 的内存后端重定向到具体进程的内存，即在符号执行过程中，SimState的内存读取都是从具体进程中来操作。\n\n将具体进程中的寄存器值复制到 SimState 中。\n\n将具体进程的内存映射与 Angr 在启动期间加载的内存映射同步。\n\n\n\nSYMBION Exploration Technique：提供用户使用 Symbion 的 API ，通过这些 API ，用户指定 PoI 的地址，在具体执行到达 PoI 后，Symbion 切换为符号执行。\n\n\n简而言之，在 Symbion 的工作流程中，各组件的作用为：\n\n用户通过 SYMBION Exploration Technique 指定PoI。\n\n程序经过具体执行到达到 PoI 后暂停， Concrete SimPlugin 根据具体执行环境来创建一个SimState。\n\nAngr 通过符号执行，计算到达下一个 PoI 的可行解。\n\nSimEngineConcrete 用 Angr 算出来的结果修改具体进程中的变量，恢复具体执行直到下一个PoI。\n\n\n二、示例分析Symbion 官方示例：test_concrete_not_packed_elf64\n示例使用的二进制：not_packed_elf64\n二进制没有给源码，通过 IDA 逆向源码，并用 AI 改写，得到 C 源码如下，源码中取 dest 变量中的一串数值做判断，不同的分支触发不同的print。\n\n\n在 Symbion 的示例代码中，首先通过具体执行到达 BINARY_DECISION_ADDRESS，然后用符号执行探索从BINARY_DECISION_ADDRESS 到DROP_STAGE2_V2的路径。\n\n\n在符号执行求解成功后，再将求解结果传递给具体执行环境，并启动具体执行，即可到达DROP_STAGE2_V2：\n\n\n结合 CFG 和源码可以看到，符号执行的起点 BINARY_DECISION_ADDRESS 对应源码图右侧 55 行，符号执行的终点 DROP_STAGE2_V2 对应源码图右侧 77 行。通过 Symbion，实现了对二进制按指定路径的进行分析的目的。\n\n\nSymbion 的示例代码中，涉及到很多内存地址操作，需要结合 IDA 的反编译源码来看：\n\n\n\nline 2：启动具体执行，到 BINARY_DECISION_ADDRESS 停下，即 IDA 反编译源码第 67 行代码\n\nline 3：从具体执行环境的获取寄存器中的栈指针sp，指向栈顶（即栈开始的位置）\n\nline 4：从栈顶 sp 开始读取 20 个字节的内存，这块内存包括反编译源码中的变量 i 和v5\n\nline 5：判断是否为符号变量，此时为具体执行环境，所以不是符号变量\n\nline 7：定义符号变量，变量名为arg0，大小为 32 字节\n\nline 8：用 symbolic_buffer_memory 指向具体执行环境中 rbp-0xc0 的内存地址，它对应 IDA 反编译源码中的数组 s 的起始地址。\n\nline 10：从 symbolic_buffer_memory 开始加载 36 个字节的内存\n\nline 11：判断是否为符号变量，此时为具体执行环境，所以不是符号变量\n\nline 12：将 angr0 存储到symbolic_buffer_memory，将符号变量与具体执行环境的内存地址关联起来\n\nline 15：从 symbolic_buffer_memory 开始加载 36 个字节的内存\n\nline 16：判断是否为符号变量，因为 把 angr0 保存到这块内存，所以是符号变量\n\nline 19：符号执行状态初始化\n\nline 37：启动符号执行\n\n\n可以看到，Symbion 在切换具体执行环境和符号执行环境时，是通过内存地址把变量的具体值和符号值对应起来。需要结合 IDA 反编译的源码中给出的变量地址和内存大小，人工设置符号执行中所需要的符号变量，难以实现自动化。","dateCreated":"2024-02-27T16:33:24+08:00","dateModified":"2024-04-09T16:00:29+08:00","datePublished":"2024-02-27T16:33:24+08:00","description":"Symbion 是 Angr 的一款插件，可以实现具体执行与符号执行交替运行","headline":"交替符号执行工具——Symbion 初探","image":[],"mainEntityOfPage":{"@type":"WebPage","@id":"https://jiliguluss.github.io/2024/02/27/Symbion%E5%88%9D%E6%8E%A2/"},"publisher":{"@type":"Organization","name":"一瓢清浅","sameAs":["#about","https://github.com/"],"image":"photo.jpg","logo":{"@type":"ImageObject","url":"photo.jpg"}},"url":"https://jiliguluss.github.io/2024/02/27/Symbion%E5%88%9D%E6%8E%A2/","keywords":"安全, 工具, Angr"}</script>
     <meta name="description" content="Symbion 是 Angr 的一款插件，可以实现具体执行与符号执行交替运行">
 <meta property="og:type" content="blog">
 <meta property="og:title" content="交替符号执行工具——Symbion 初探">
@@ -31,9 +31,9 @@
 <meta property="article:published_time" content="2024-02-27T08:33:24.000Z">
 <meta property="article:modified_time" content="2024-04-09T08:00:29.509Z">
 <meta property="article:author" content="一瓢清浅">
-<meta property="article:tag" content="Angr">
 <meta property="article:tag" content="安全">
 <meta property="article:tag" content="工具">
+<meta property="article:tag" content="Angr">
 <meta name="twitter:card" content="summary">
 <meta name="twitter:image" content="https://jiliguluss.github.io/2024/02/27/Symbion%E5%88%9D%E6%8E%A2/symbion%E4%B8%8A%E4%B8%8B%E6%96%87%E5%88%87%E6%8D%A2.png">
     
diff --git a/all-archives/index.html b/all-archives/index.html
index 32d412a..8af43aa 100644
--- a/all-archives/index.html
+++ b/all-archives/index.html
@@ -415,6 +415,24 @@ <h5 class="archive-title">
                 <span class="archive-post-date"> - 2023 年 4 月 23 日</span>
             </li>
         
+            
+            
+            
+            
+                
+                    </ul>
+                
+                <ul class="archive-posts archive-month" data-date="202301">
+                    <h5 class="archive-title">
+                        <a class="link-unstyled" href="/archives/2023/01">一月</a>
+                    </h5>
+                
+            
+            <li class="archive-post archive-day" data-date="20230108">
+                <a class="archive-post-title" href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/">零基础爬虫入门</a>
+                <span class="archive-post-date"> - 2023 年 1 月 8 日</span>
+            </li>
+        
     </section>
 </div>
 
diff --git a/all-categories/index.html b/all-categories/index.html
index 77eb87f..de2e0f3 100644
--- a/all-categories/index.html
+++ b/all-categories/index.html
@@ -258,11 +258,15 @@ <h5 class="sidebar-profile-bio"><p>个人技术博客<br />涉猎开发、测试
             
         
             
+        
+            
                 <div><a href="#posts-list-安全" class="category-anchor" data-category="安全" data-parent-categories="">安全</a><ul style="margin-bottom:0;"><div><a href="#posts-list-模糊测试" class="category-anchor" data-category="模糊测试" data-parent-categories="安全"> / 模糊测试</a></div><div><a href="#posts-list-符号执行" class="category-anchor" data-category="符号执行" data-parent-categories="安全"> / 符号执行</a></div></ul></div>
             
         
             
-                <div><a href="#posts-list-开发" class="category-anchor" data-category="开发" data-parent-categories="">开发</a><ul style="margin-bottom:0;"><div><a href="#posts-list-Docker" class="category-anchor" data-category="docker" data-parent-categories="开发"> / Docker</a></div><div><a href="#posts-list-Linux" class="category-anchor" data-category="linux" data-parent-categories="开发"> / Linux</a></div></ul></div>
+                <div><a href="#posts-list-开发" class="category-anchor" data-category="开发" data-parent-categories="">开发</a><ul style="margin-bottom:0;"><div><a href="#posts-list-Docker" class="category-anchor" data-category="docker" data-parent-categories="开发"> / Docker</a></div><div><a href="#posts-list-Linux" class="category-anchor" data-category="linux" data-parent-categories="开发"> / Linux</a></div><div><a href="#posts-list-Web" class="category-anchor" data-category="web" data-parent-categories="开发"> / Web</a></div><div><a href="#posts-list-爬虫" class="category-anchor" data-category="爬虫" data-parent-categories="开发"> / 爬虫</a></div></ul></div>
+            
+        
             
         
             
@@ -283,11 +287,15 @@ <h5 class="sidebar-profile-bio"><p>个人技术博客<br />涉猎开发、测试
             
         
             
+        
+            
                     <div id="posts-list-安全" class="archive box" data-category="安全" data-parent-categories=""><h4 class="archive-title text-xlarge"><a class="link-unstyled" href="/categories/%E5%AE%89%E5%85%A8/">安全 (4)</a></h4><ul class="archive-posts"><li class="archive-post"><a class="archive-post-title" href="/2024/02/27/Symbion%E5%88%9D%E6%8E%A2/">交替符号执行工具——Symbion 初探</a><span class="archive-post-date"> - 2024 年 2 月 27 日</span></li><li class="archive-post"><a class="archive-post-title" href="/2024/01/23/Angr%E9%9B%B6%E5%9F%BA%E7%A1%80%E5%85%A5%E9%97%A8/">符号执行工具——Angr 零基础入门</a><span class="archive-post-date"> - 2024 年 1 月 23 日</span></li><li class="archive-post"><a class="archive-post-title" href="/2023/10/15/AFL%E5%8E%9F%E7%90%86%E4%B8%8E%E5%AE%9E%E8%B7%B5/">AFL 原理与实践</a><span class="archive-post-date"> - 2023 年 10 月 15 日</span></li><li class="archive-post"><a class="archive-post-title" href="/2023/09/17/LibFuzzer%E4%BD%BF%E7%94%A8%E8%AF%B4%E6%98%8E/">LibFuzzer 使用说明</a><span class="archive-post-date"> - 2023 年 9 月 17 日</span></li><div id="posts-list-模糊测试" class="archive " data-category="模糊测试" data-parent-categories="安全"><h4 class="archive-title text-xlarge"><a class="link-unstyled" href="/categories/%E5%AE%89%E5%85%A8/%E6%A8%A1%E7%B3%8A%E6%B5%8B%E8%AF%95/">模糊测试 (2)</a></h4><ul class="archive-posts"><li class="archive-post"><a class="archive-post-title" href="/2023/10/15/AFL%E5%8E%9F%E7%90%86%E4%B8%8E%E5%AE%9E%E8%B7%B5/">AFL 原理与实践</a><span class="archive-post-date"> - 2023 年 10 月 15 日</span></li><li class="archive-post"><a class="archive-post-title" href="/2023/09/17/LibFuzzer%E4%BD%BF%E7%94%A8%E8%AF%B4%E6%98%8E/">LibFuzzer 使用说明</a><span class="archive-post-date"> - 2023 年 9 月 17 日</span></li></ul></div><div id="posts-list-符号执行" class="archive " data-category="符号执行" data-parent-categories="安全"><h4 class="archive-title text-xlarge"><a class="link-unstyled" href="/categories/%E5%AE%89%E5%85%A8/%E7%AC%A6%E5%8F%B7%E6%89%A7%E8%A1%8C/">符号执行 (2)</a></h4><ul class="archive-posts"><li class="archive-post"><a class="archive-post-title" href="/2024/02/27/Symbion%E5%88%9D%E6%8E%A2/">交替符号执行工具——Symbion 初探</a><span class="archive-post-date"> - 2024 年 2 月 27 日</span></li><li class="archive-post"><a class="archive-post-title" href="/2024/01/23/Angr%E9%9B%B6%E5%9F%BA%E7%A1%80%E5%85%A5%E9%97%A8/">符号执行工具——Angr 零基础入门</a><span class="archive-post-date"> - 2024 年 1 月 23 日</span></li></ul></div></ul></div>
             
         
             
-                    <div id="posts-list-开发" class="archive box" data-category="开发" data-parent-categories=""><h4 class="archive-title text-xlarge"><a class="link-unstyled" href="/categories/%E5%BC%80%E5%8F%91/">开发 (2)</a></h4><ul class="archive-posts"><li class="archive-post"><a class="archive-post-title" href="/2023/06/08/Docker%E5%BF%85%E7%9F%A5%E5%BF%85%E4%BC%9A/">Docker 必知必会</a><span class="archive-post-date"> - 2023 年 6 月 8 日</span></li><li class="archive-post"><a class="archive-post-title" href="/2023/05/19/Linux%E4%BB%8E%E5%85%A5%E9%97%A8%E5%88%B0%E7%86%9F%E7%BB%83/">Linux 从入门到熟练</a><span class="archive-post-date"> - 2023 年 5 月 19 日</span></li><div id="posts-list-Docker" class="archive " data-category="docker" data-parent-categories="开发"><h4 class="archive-title text-xlarge"><a class="link-unstyled" href="/categories/%E5%BC%80%E5%8F%91/Docker/">Docker (1)</a></h4><ul class="archive-posts"><li class="archive-post"><a class="archive-post-title" href="/2023/06/08/Docker%E5%BF%85%E7%9F%A5%E5%BF%85%E4%BC%9A/">Docker 必知必会</a><span class="archive-post-date"> - 2023 年 6 月 8 日</span></li></ul></div><div id="posts-list-Linux" class="archive " data-category="linux" data-parent-categories="开发"><h4 class="archive-title text-xlarge"><a class="link-unstyled" href="/categories/%E5%BC%80%E5%8F%91/Linux/">Linux (1)</a></h4><ul class="archive-posts"><li class="archive-post"><a class="archive-post-title" href="/2023/05/19/Linux%E4%BB%8E%E5%85%A5%E9%97%A8%E5%88%B0%E7%86%9F%E7%BB%83/">Linux 从入门到熟练</a><span class="archive-post-date"> - 2023 年 5 月 19 日</span></li></ul></div></ul></div>
+                    <div id="posts-list-开发" class="archive box" data-category="开发" data-parent-categories=""><h4 class="archive-title text-xlarge"><a class="link-unstyled" href="/categories/%E5%BC%80%E5%8F%91/">开发 (3)</a></h4><ul class="archive-posts"><li class="archive-post"><a class="archive-post-title" href="/2023/06/08/Docker%E5%BF%85%E7%9F%A5%E5%BF%85%E4%BC%9A/">Docker 必知必会</a><span class="archive-post-date"> - 2023 年 6 月 8 日</span></li><li class="archive-post"><a class="archive-post-title" href="/2023/05/19/Linux%E4%BB%8E%E5%85%A5%E9%97%A8%E5%88%B0%E7%86%9F%E7%BB%83/">Linux 从入门到熟练</a><span class="archive-post-date"> - 2023 年 5 月 19 日</span></li><li class="archive-post"><a class="archive-post-title" href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/">零基础爬虫入门</a><span class="archive-post-date"> - 2023 年 1 月 8 日</span></li><div id="posts-list-Docker" class="archive " data-category="docker" data-parent-categories="开发"><h4 class="archive-title text-xlarge"><a class="link-unstyled" href="/categories/%E5%BC%80%E5%8F%91/Docker/">Docker (1)</a></h4><ul class="archive-posts"><li class="archive-post"><a class="archive-post-title" href="/2023/06/08/Docker%E5%BF%85%E7%9F%A5%E5%BF%85%E4%BC%9A/">Docker 必知必会</a><span class="archive-post-date"> - 2023 年 6 月 8 日</span></li></ul></div><div id="posts-list-Linux" class="archive " data-category="linux" data-parent-categories="开发"><h4 class="archive-title text-xlarge"><a class="link-unstyled" href="/categories/%E5%BC%80%E5%8F%91/Linux/">Linux (1)</a></h4><ul class="archive-posts"><li class="archive-post"><a class="archive-post-title" href="/2023/05/19/Linux%E4%BB%8E%E5%85%A5%E9%97%A8%E5%88%B0%E7%86%9F%E7%BB%83/">Linux 从入门到熟练</a><span class="archive-post-date"> - 2023 年 5 月 19 日</span></li></ul></div><div id="posts-list-Web" class="archive " data-category="web" data-parent-categories="开发"><h4 class="archive-title text-xlarge"><a class="link-unstyled" href="/categories/%E5%BC%80%E5%8F%91/Web/">Web (0)</a></h4><ul class="archive-posts"></ul></div><div id="posts-list-爬虫" class="archive " data-category="爬虫" data-parent-categories="开发"><h4 class="archive-title text-xlarge"><a class="link-unstyled" href="/categories/%E5%BC%80%E5%8F%91/%E7%88%AC%E8%99%AB/">爬虫 (1)</a></h4><ul class="archive-posts"><li class="archive-post"><a class="archive-post-title" href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/">零基础爬虫入门</a><span class="archive-post-date"> - 2023 年 1 月 8 日</span></li></ul></div></ul></div>
+            
+        
             
         
             
diff --git a/all-tags/index.html b/all-tags/index.html
index 88b050e..2f1fe85 100644
--- a/all-tags/index.html
+++ b/all-tags/index.html
@@ -273,6 +273,10 @@ <h5 class="sidebar-profile-bio"><p>个人技术博客<br />涉猎开发、测试
                 Fuzz
             </a>
         
+            <a class="tag tag--primary tag--small" href="#Html-list" data-tag="html">
+                Html
+            </a>
+        
             <a class="tag tag--primary tag--small" href="#LibFuzzer-list" data-tag="libfuzzer">
                 LibFuzzer
             </a>
@@ -281,6 +285,14 @@ <h5 class="sidebar-profile-bio"><p>个人技术博客<br />涉猎开发、测试
                 Linux
             </a>
         
+            <a class="tag tag--primary tag--small" href="#Web-list" data-tag="web">
+                Web
+            </a>
+        
+            <a class="tag tag--primary tag--small" href="#python-list" data-tag="python">
+                python
+            </a>
+        
             <a class="tag tag--primary tag--small" href="#命令-list" data-tag="命令">
                 命令
             </a>
@@ -305,6 +317,14 @@ <h5 class="sidebar-profile-bio"><p>个人技术博客<br />涉猎开发、测试
                 操作系统
             </a>
         
+            <a class="tag tag--primary tag--small" href="#框架-list" data-tag="框架">
+                框架
+            </a>
+        
+            <a class="tag tag--primary tag--small" href="#爬虫-list" data-tag="爬虫">
+                爬虫
+            </a>
+        
             <a class="tag tag--primary tag--small" href="#编程-list" data-tag="编程">
                 编程
             </a>
@@ -477,6 +497,17 @@ <h4 class="archive-title">
                 </ul>
             </div>
         
+            <div id="Html-list" class="archive box" data-tag="html">
+                <h4 class="archive-title">
+                    <a class="link-unstyled" href="/tags/Html">
+                        Html (0)
+                    </a>
+                </h4>
+                <ul class="archive-posts">
+                    
+                </ul>
+            </div>
+        
             <div id="LibFuzzer-list" class="archive box" data-tag="libfuzzer">
                 <h4 class="archive-title">
                     <a class="link-unstyled" href="/tags/LibFuzzer">
@@ -517,6 +548,46 @@ <h4 class="archive-title">
                 </ul>
             </div>
         
+            <div id="Web-list" class="archive box" data-tag="web">
+                <h4 class="archive-title">
+                    <a class="link-unstyled" href="/tags/Web">
+                        Web (1)
+                    </a>
+                </h4>
+                <ul class="archive-posts">
+                    
+                        <li class="archive-post">
+                            <a class="archive-post-title" href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/">
+                                零基础爬虫入门
+                            </a>
+                            <span class="archive-post-date">
+                                 - 2023 年 1 月 8 日
+                            </span>
+                        </li>
+                    
+                </ul>
+            </div>
+        
+            <div id="python-list" class="archive box" data-tag="python">
+                <h4 class="archive-title">
+                    <a class="link-unstyled" href="/tags/python">
+                        python (1)
+                    </a>
+                </h4>
+                <ul class="archive-posts">
+                    
+                        <li class="archive-post">
+                            <a class="archive-post-title" href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/">
+                                零基础爬虫入门
+                            </a>
+                            <span class="archive-post-date">
+                                 - 2023 年 1 月 8 日
+                            </span>
+                        </li>
+                    
+                </ul>
+            </div>
+        
             <div id="命令-list" class="archive box" data-tag="命令">
                 <h4 class="archive-title">
                     <a class="link-unstyled" href="/tags/%E5%91%BD%E4%BB%A4">
@@ -727,6 +798,37 @@ <h4 class="archive-title">
                 </ul>
             </div>
         
+            <div id="框架-list" class="archive box" data-tag="框架">
+                <h4 class="archive-title">
+                    <a class="link-unstyled" href="/tags/%E6%A1%86%E6%9E%B6">
+                        框架 (0)
+                    </a>
+                </h4>
+                <ul class="archive-posts">
+                    
+                </ul>
+            </div>
+        
+            <div id="爬虫-list" class="archive box" data-tag="爬虫">
+                <h4 class="archive-title">
+                    <a class="link-unstyled" href="/tags/%E7%88%AC%E8%99%AB">
+                        爬虫 (1)
+                    </a>
+                </h4>
+                <ul class="archive-posts">
+                    
+                        <li class="archive-post">
+                            <a class="archive-post-title" href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/">
+                                零基础爬虫入门
+                            </a>
+                            <span class="archive-post-date">
+                                 - 2023 年 1 月 8 日
+                            </span>
+                        </li>
+                    
+                </ul>
+            </div>
+        
             <div id="编程-list" class="archive box" data-tag="编程">
                 <h4 class="archive-title">
                     <a class="link-unstyled" href="/tags/%E7%BC%96%E7%A8%8B">
diff --git a/archives/2023/01/index.html b/archives/2023/01/index.html
new file mode 100644
index 0000000..583f1af
--- /dev/null
+++ b/archives/2023/01/index.html
@@ -0,0 +1,390 @@
+
+<!DOCTYPE html>
+<html lang="zh-cn">
+    
+<head>
+    <meta charset="UTF-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="千里之行，始于足下">
+    <title>归档: 2023/1 - 千里之行，始于足下</title>
+    <meta name="author" content="一瓢清浅">
+    
+        <meta name="keywords" content="python,AI,安全,算法,编程,">
+    
+    
+    
+    <script type="application/ld+json">{}</script>
+    <meta name="description" content="个人技术博客，涉及编程(python，c++)、安全测试、Web开发、AI算法等IT领域">
+<meta property="og:type" content="blog">
+<meta property="og:title" content="千里之行，始于足下">
+<meta property="og:url" content="https://jiliguluss.github.io/archives/2023/01/index.html">
+<meta property="og:site_name" content="千里之行，始于足下">
+<meta property="og:description" content="个人技术博客，涉及编程(python，c++)、安全测试、Web开发、AI算法等IT领域">
+<meta property="og:locale" content="zh_CN">
+<meta property="article:author" content="一瓢清浅">
+<meta property="article:tag" content="python">
+<meta property="article:tag" content="AI">
+<meta property="article:tag" content="安全">
+<meta property="article:tag" content="算法">
+<meta property="article:tag" content="编程">
+<meta name="twitter:card" content="summary">
+    
+    
+        
+    
+    
+        <meta property="og:image" content="https://jiliguluss.github.io/assets/images/photo.jpg"/>
+    
+    
+    
+    
+    <!--STYLES-->
+    
+<link rel="stylesheet" href="/assets/css/all.css">
+
+    
+<link rel="stylesheet" href="/assets/css/jquery.fancybox.css">
+
+    
+<link rel="stylesheet" href="/assets/css/thumbs.css">
+
+    
+<link rel="stylesheet" href="/assets/css/tranquilpeak.css">
+
+    <!--STYLES END-->
+    
+
+    
+
+    
+</head>
+
+    <body>
+        <div id="blog">
+            <!-- Define author's picture -->
+
+
+<header id="header" data-behavior="2">
+    <i id="btn-open-sidebar" class="fa fa-lg fa-bars"></i>
+    <div class="header-title">
+        <a
+            class="header-title-link"
+            href="/"
+            aria-label=""
+        >
+            千里之行，始于足下
+        </a>
+    </div>
+    
+        
+            <a
+                class="header-right-icon "
+                href="#about"
+                aria-label="打开链接: /#about"
+            >
+        
+        
+            <i class="fa fa-question fa-lg"></i>
+        
+        </a>
+    
+</header>
+
+            <!-- Define author's picture -->
+
+
+
+        
+    
+
+<nav id="sidebar" data-behavior="2">
+    <div class="sidebar-container">
+        
+            <div class="sidebar-profile">
+                <a
+                    href="/#about"
+                    aria-label="阅读有关作者的更多信息"
+                >
+                    <img class="sidebar-profile-picture" src="/assets/images/photo.jpg" alt="作者的图片"/>
+                </a>
+                <h4 class="sidebar-profile-name">一瓢清浅</h4>
+                
+                    <h5 class="sidebar-profile-bio"><p>个人技术博客<br />涉猎开发、测试、数据、算法、安全等领域</p>
+</h5>
+                
+            </div>
+        
+        
+            <ul class="sidebar-buttons">
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/"
+                            
+                            rel="noopener"
+                            title="首页"
+                        >
+                        <i class="sidebar-button-icon fa fa-home" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">首页</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-categories"
+                            
+                            rel="noopener"
+                            title="分类"
+                        >
+                        <i class="sidebar-button-icon fa fa-bookmark" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">分类</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-tags"
+                            
+                            rel="noopener"
+                            title="标签"
+                        >
+                        <i class="sidebar-button-icon fa fa-tags" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">标签</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-archives"
+                            
+                            rel="noopener"
+                            title="归档"
+                        >
+                        <i class="sidebar-button-icon fa fa-archive" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">归档</span>
+                    </a>
+            </li>
+            
+        </ul>
+        
+            <ul class="sidebar-buttons">
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="#about"
+                            
+                            rel="noopener"
+                            title="关于"
+                        >
+                        <i class="sidebar-button-icon fa fa-question" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">关于</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="https://github.com/"
+                            
+                                target="_blank"
+                            
+                            rel="noopener"
+                            title="GitHub"
+                        >
+                        <i class="sidebar-button-icon fab fa-github" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">GitHub</span>
+                    </a>
+            </li>
+            
+        </ul>
+        
+    </div>
+</nav>
+
+            
+            <div id="main" data-behavior="2"
+                 class="
+                        hasCoverMetaIn
+                        ">
+                
+    <link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/tocbot/4.25.0/tocbot.css">
+    <style>
+        #post-toc {
+            position: fixed !important;
+            top: 80px;
+            padding: 10px;
+            z-index: 100;
+            background-color: rgba(255,255,255,0);
+            transform: translateX(0);
+            right: 4%;
+            width: 240px;
+            height: auto;
+            padding-top: 10px;
+            padding-bottom: 10px;
+        }
+    </style>
+    <div id="post-toc" class="toc"></div>
+
+                
+    <section class="postShorten-group main-content-wrap">
+    
+    
+    <article class="postShorten postShorten--thumbnailimg-right">
+        <div class="postShorten-wrap">
+            
+            <div class="postShorten-header">
+                <h1 class="postShorten-title">
+                    
+                        <a
+                            class="link-unstyled"
+                            href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/"
+                            aria-label=": 零基础爬虫入门"
+                        >
+                            零基础爬虫入门
+                        </a>
+                    
+                </h1>
+                <div class="postShorten-meta">
+    <time datetime="2023-01-08T14:05:37+08:00">
+	
+		    2023 年 1 月 8 日
+    	
+    </time>
+    
+        <span>发布在 </span>
+        
+    <a class="category-link" href="/categories/%E5%BC%80%E5%8F%91/">开发</a>, <a class="category-link" href="/categories/%E5%BC%80%E5%8F%91/%E7%88%AC%E8%99%AB/">爬虫</a>
+
+
+    
+</div>
+
+            </div>
+            
+                <div class="postShorten-excerpt">
+                    <p>从零开始学爬虫</p>
+                    
+                        <a
+                            href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/"
+                            class="postShorten-excerpt_link link"
+                            aria-label=": 零基础爬虫入门"
+                        >
+                            阅读全文
+                        </a>
+                        
+                    
+                </div>
+            
+        </div>
+        
+    </article>
+    
+    <div class="pagination-bar">
+    <ul class="pagination">
+        
+        
+        <li class="pagination-number">第 1 页 共 1 页</li>
+    </ul>
+</div>
+
+</section>
+
+
+
+                <footer id="footer" class="main-content-wrap">
+    <span class="copyrights">
+        Copyrights &copy; 2024 一瓢清浅. All Rights Reserved.
+    </span>
+</footer>
+
+            </div>
+            
+        </div>
+        
+
+
+    
+        
+    
+
+<div id="about">
+    <div id="about-card">
+        <div id="about-btn-close">
+            <i class="fa fa-times"></i>
+        </div>
+        
+            <img id="about-card-picture" src="/assets/images/photo.jpg" alt="作者的图片"/>
+        
+            <h4 id="about-card-name">一瓢清浅</h4>
+        
+            <div id="about-card-bio"><p>个人技术博客<br />涉猎开发、测试、数据、算法、安全等领域</p>
+</div>
+        
+        
+            <div id="about-card-job">
+                <i class="fa fa-briefcase"></i>
+                <br/>
+                <p>IT工程师</p>
+
+            </div>
+        
+        
+            <div id="about-card-location">
+                <i class="fa fa-map-marker-alt"></i>
+                <br/>
+                中国
+            </div>
+        
+    </div>
+</div>
+
+        
+        
+<div id="cover" style="background-image:url('/assets/images/cover.png');"></div>
+        <!--SCRIPTS-->
+
+<script src="/assets/js/jquery.js"></script>
+
+
+<script src="/assets/js/jquery.fancybox.js"></script>
+
+
+<script src="/assets/js/thumbs.js"></script>
+
+
+<script src="/assets/js/tranquilpeak.js"></script>
+
+<!--SCRIPTS END-->
+
+
+
+
+
+
+  <script src="https://cdn.jsdelivr.net/npm/tocbot@4.25.0/dist/tocbot.min.js"></script> 
+  <script type="text/javascript">
+      tocbot.init({
+        tocSelector: '#post-toc', // 目录容器的 ID 或 class
+        contentSelector: '.post-content', // 内容容器的 ID 或 class
+        headingSelector: 'h2,h3', // 你想要包含在目录中的标题级别
+        collapseDepth: 3,
+        scrollSmooth: true, 
+        activeClass: 'active', 
+        orderedList: false
+    });
+  </script> 
+
+
+    </body>
+</html>
diff --git a/archives/2023/index.html b/archives/2023/index.html
index 2bfe130..89acbcf 100644
--- a/archives/2023/index.html
+++ b/archives/2023/index.html
@@ -647,6 +647,57 @@ <h1 class="postShorten-title">
         
     </article>
     
+    
+    <article class="postShorten postShorten--thumbnailimg-right">
+        <div class="postShorten-wrap">
+            
+            <div class="postShorten-header">
+                <h1 class="postShorten-title">
+                    
+                        <a
+                            class="link-unstyled"
+                            href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/"
+                            aria-label=": 零基础爬虫入门"
+                        >
+                            零基础爬虫入门
+                        </a>
+                    
+                </h1>
+                <div class="postShorten-meta">
+    <time datetime="2023-01-08T14:05:37+08:00">
+	
+		    2023 年 1 月 8 日
+    	
+    </time>
+    
+        <span>发布在 </span>
+        
+    <a class="category-link" href="/categories/%E5%BC%80%E5%8F%91/">开发</a>, <a class="category-link" href="/categories/%E5%BC%80%E5%8F%91/%E7%88%AC%E8%99%AB/">爬虫</a>
+
+
+    
+</div>
+
+            </div>
+            
+                <div class="postShorten-excerpt">
+                    <p>从零开始学爬虫</p>
+                    
+                        <a
+                            href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/"
+                            class="postShorten-excerpt_link link"
+                            aria-label=": 零基础爬虫入门"
+                        >
+                            阅读全文
+                        </a>
+                        
+                    
+                </div>
+            
+        </div>
+        
+    </article>
+    
     <div class="pagination-bar">
     <ul class="pagination">
         
diff --git a/archives/index.html b/archives/index.html
index b5e9923..18ada10 100644
--- a/archives/index.html
+++ b/archives/index.html
@@ -753,7 +753,18 @@ <h1 class="postShorten-title">
     <ul class="pagination">
         
         
-        <li class="pagination-number">第 1 页 共 1 页</li>
+          <li class="pagination-next">
+            <a
+                class="btn btn--default btn--small"
+                href="/archives/page/2/"
+                aria-label="下一页"
+            >
+              <span>下一页</span>
+              <i class="fa fa-angle-right text-base icon-ml"></i>
+            </a>
+          </li>
+        
+        <li class="pagination-number">第 1 页 共 2 页</li>
     </ul>
 </div>
 
diff --git a/archives/page/2/index.html b/archives/page/2/index.html
new file mode 100644
index 0000000..76a6fdf
--- /dev/null
+++ b/archives/page/2/index.html
@@ -0,0 +1,401 @@
+
+<!DOCTYPE html>
+<html lang="zh-cn">
+    
+<head>
+    <meta charset="UTF-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="千里之行，始于足下">
+    <title>归档 - 千里之行，始于足下</title>
+    <meta name="author" content="一瓢清浅">
+    
+        <meta name="keywords" content="python,AI,安全,算法,编程,">
+    
+    
+    
+    <script type="application/ld+json">{}</script>
+    <meta name="description" content="个人技术博客，涉及编程(python，c++)、安全测试、Web开发、AI算法等IT领域">
+<meta property="og:type" content="blog">
+<meta property="og:title" content="千里之行，始于足下">
+<meta property="og:url" content="https://jiliguluss.github.io/archives/page/2/index.html">
+<meta property="og:site_name" content="千里之行，始于足下">
+<meta property="og:description" content="个人技术博客，涉及编程(python，c++)、安全测试、Web开发、AI算法等IT领域">
+<meta property="og:locale" content="zh_CN">
+<meta property="article:author" content="一瓢清浅">
+<meta property="article:tag" content="python">
+<meta property="article:tag" content="AI">
+<meta property="article:tag" content="安全">
+<meta property="article:tag" content="算法">
+<meta property="article:tag" content="编程">
+<meta name="twitter:card" content="summary">
+    
+    
+        
+    
+    
+        <meta property="og:image" content="https://jiliguluss.github.io/assets/images/photo.jpg"/>
+    
+    
+    
+    
+    <!--STYLES-->
+    
+<link rel="stylesheet" href="/assets/css/all.css">
+
+    
+<link rel="stylesheet" href="/assets/css/jquery.fancybox.css">
+
+    
+<link rel="stylesheet" href="/assets/css/thumbs.css">
+
+    
+<link rel="stylesheet" href="/assets/css/tranquilpeak.css">
+
+    <!--STYLES END-->
+    
+
+    
+
+    
+</head>
+
+    <body>
+        <div id="blog">
+            <!-- Define author's picture -->
+
+
+<header id="header" data-behavior="2">
+    <i id="btn-open-sidebar" class="fa fa-lg fa-bars"></i>
+    <div class="header-title">
+        <a
+            class="header-title-link"
+            href="/"
+            aria-label=""
+        >
+            千里之行，始于足下
+        </a>
+    </div>
+    
+        
+            <a
+                class="header-right-icon "
+                href="#about"
+                aria-label="打开链接: /#about"
+            >
+        
+        
+            <i class="fa fa-question fa-lg"></i>
+        
+        </a>
+    
+</header>
+
+            <!-- Define author's picture -->
+
+
+
+        
+    
+
+<nav id="sidebar" data-behavior="2">
+    <div class="sidebar-container">
+        
+            <div class="sidebar-profile">
+                <a
+                    href="/#about"
+                    aria-label="阅读有关作者的更多信息"
+                >
+                    <img class="sidebar-profile-picture" src="/assets/images/photo.jpg" alt="作者的图片"/>
+                </a>
+                <h4 class="sidebar-profile-name">一瓢清浅</h4>
+                
+                    <h5 class="sidebar-profile-bio"><p>个人技术博客<br />涉猎开发、测试、数据、算法、安全等领域</p>
+</h5>
+                
+            </div>
+        
+        
+            <ul class="sidebar-buttons">
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/"
+                            
+                            rel="noopener"
+                            title="首页"
+                        >
+                        <i class="sidebar-button-icon fa fa-home" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">首页</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-categories"
+                            
+                            rel="noopener"
+                            title="分类"
+                        >
+                        <i class="sidebar-button-icon fa fa-bookmark" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">分类</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-tags"
+                            
+                            rel="noopener"
+                            title="标签"
+                        >
+                        <i class="sidebar-button-icon fa fa-tags" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">标签</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-archives"
+                            
+                            rel="noopener"
+                            title="归档"
+                        >
+                        <i class="sidebar-button-icon fa fa-archive" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">归档</span>
+                    </a>
+            </li>
+            
+        </ul>
+        
+            <ul class="sidebar-buttons">
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="#about"
+                            
+                            rel="noopener"
+                            title="关于"
+                        >
+                        <i class="sidebar-button-icon fa fa-question" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">关于</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="https://github.com/"
+                            
+                                target="_blank"
+                            
+                            rel="noopener"
+                            title="GitHub"
+                        >
+                        <i class="sidebar-button-icon fab fa-github" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">GitHub</span>
+                    </a>
+            </li>
+            
+        </ul>
+        
+    </div>
+</nav>
+
+            
+            <div id="main" data-behavior="2"
+                 class="
+                        hasCoverMetaIn
+                        ">
+                
+    <link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/tocbot/4.25.0/tocbot.css">
+    <style>
+        #post-toc {
+            position: fixed !important;
+            top: 80px;
+            padding: 10px;
+            z-index: 100;
+            background-color: rgba(255,255,255,0);
+            transform: translateX(0);
+            right: 4%;
+            width: 240px;
+            height: auto;
+            padding-top: 10px;
+            padding-bottom: 10px;
+        }
+    </style>
+    <div id="post-toc" class="toc"></div>
+
+                
+    <section class="postShorten-group main-content-wrap">
+    
+    
+    <article class="postShorten postShorten--thumbnailimg-right">
+        <div class="postShorten-wrap">
+            
+            <div class="postShorten-header">
+                <h1 class="postShorten-title">
+                    
+                        <a
+                            class="link-unstyled"
+                            href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/"
+                            aria-label=": 零基础爬虫入门"
+                        >
+                            零基础爬虫入门
+                        </a>
+                    
+                </h1>
+                <div class="postShorten-meta">
+    <time datetime="2023-01-08T14:05:37+08:00">
+	
+		    2023 年 1 月 8 日
+    	
+    </time>
+    
+        <span>发布在 </span>
+        
+    <a class="category-link" href="/categories/%E5%BC%80%E5%8F%91/">开发</a>, <a class="category-link" href="/categories/%E5%BC%80%E5%8F%91/%E7%88%AC%E8%99%AB/">爬虫</a>
+
+
+    
+</div>
+
+            </div>
+            
+                <div class="postShorten-excerpt">
+                    <p>从零开始学爬虫</p>
+                    
+                        <a
+                            href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/"
+                            class="postShorten-excerpt_link link"
+                            aria-label=": 零基础爬虫入门"
+                        >
+                            阅读全文
+                        </a>
+                        
+                    
+                </div>
+            
+        </div>
+        
+    </article>
+    
+    <div class="pagination-bar">
+    <ul class="pagination">
+        
+          <li class="pagination-prev">
+            <a
+                class="btn btn--default btn--small"
+                href="/archives/"
+                aria-label="上一页"
+            >
+              <i class="fa fa-angle-left text-base icon-mr"></i>
+              <span>上一页</span>
+            </a>
+          </li>
+        
+        
+        <li class="pagination-number">第 2 页 共 2 页</li>
+    </ul>
+</div>
+
+</section>
+
+
+
+                <footer id="footer" class="main-content-wrap">
+    <span class="copyrights">
+        Copyrights &copy; 2024 一瓢清浅. All Rights Reserved.
+    </span>
+</footer>
+
+            </div>
+            
+        </div>
+        
+
+
+    
+        
+    
+
+<div id="about">
+    <div id="about-card">
+        <div id="about-btn-close">
+            <i class="fa fa-times"></i>
+        </div>
+        
+            <img id="about-card-picture" src="/assets/images/photo.jpg" alt="作者的图片"/>
+        
+            <h4 id="about-card-name">一瓢清浅</h4>
+        
+            <div id="about-card-bio"><p>个人技术博客<br />涉猎开发、测试、数据、算法、安全等领域</p>
+</div>
+        
+        
+            <div id="about-card-job">
+                <i class="fa fa-briefcase"></i>
+                <br/>
+                <p>IT工程师</p>
+
+            </div>
+        
+        
+            <div id="about-card-location">
+                <i class="fa fa-map-marker-alt"></i>
+                <br/>
+                中国
+            </div>
+        
+    </div>
+</div>
+
+        
+        
+<div id="cover" style="background-image:url('/assets/images/cover.png');"></div>
+        <!--SCRIPTS-->
+
+<script src="/assets/js/jquery.js"></script>
+
+
+<script src="/assets/js/jquery.fancybox.js"></script>
+
+
+<script src="/assets/js/thumbs.js"></script>
+
+
+<script src="/assets/js/tranquilpeak.js"></script>
+
+<!--SCRIPTS END-->
+
+
+
+
+
+
+  <script src="https://cdn.jsdelivr.net/npm/tocbot@4.25.0/dist/tocbot.min.js"></script> 
+  <script type="text/javascript">
+      tocbot.init({
+        tocSelector: '#post-toc', // 目录容器的 ID 或 class
+        contentSelector: '.post-content', // 内容容器的 ID 或 class
+        headingSelector: 'h2,h3', // 你想要包含在目录中的标题级别
+        collapseDepth: 3,
+        scrollSmooth: true, 
+        activeClass: 'active', 
+        orderedList: false
+    });
+  </script> 
+
+
+    </body>
+</html>
diff --git "a/categories/\345\274\200\345\217\221/index.html" "b/categories/\345\274\200\345\217\221/index.html"
index 4a3c3dd..e728bf6 100644
--- "a/categories/\345\274\200\345\217\221/index.html"
+++ "b/categories/\345\274\200\345\217\221/index.html"
@@ -341,6 +341,57 @@ <h1 class="postShorten-title">
         
     </article>
     
+    
+    <article class="postShorten postShorten--thumbnailimg-right">
+        <div class="postShorten-wrap">
+            
+            <div class="postShorten-header">
+                <h1 class="postShorten-title">
+                    
+                        <a
+                            class="link-unstyled"
+                            href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/"
+                            aria-label=": 零基础爬虫入门"
+                        >
+                            零基础爬虫入门
+                        </a>
+                    
+                </h1>
+                <div class="postShorten-meta">
+    <time datetime="2023-01-08T14:05:37+08:00">
+	
+		    2023 年 1 月 8 日
+    	
+    </time>
+    
+        <span>发布在 </span>
+        
+    <a class="category-link" href="/categories/%E5%BC%80%E5%8F%91/">开发</a>, <a class="category-link" href="/categories/%E5%BC%80%E5%8F%91/%E7%88%AC%E8%99%AB/">爬虫</a>
+
+
+    
+</div>
+
+            </div>
+            
+                <div class="postShorten-excerpt">
+                    <p>从零开始学爬虫</p>
+                    
+                        <a
+                            href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/"
+                            class="postShorten-excerpt_link link"
+                            aria-label=": 零基础爬虫入门"
+                        >
+                            阅读全文
+                        </a>
+                        
+                    
+                </div>
+            
+        </div>
+        
+    </article>
+    
     <div class="pagination-bar">
     <ul class="pagination">
         
diff --git "a/categories/\345\274\200\345\217\221/\347\210\254\350\231\253/index.html" "b/categories/\345\274\200\345\217\221/\347\210\254\350\231\253/index.html"
new file mode 100644
index 0000000..2ceb600
--- /dev/null
+++ "b/categories/\345\274\200\345\217\221/\347\210\254\350\231\253/index.html"
@@ -0,0 +1,390 @@
+
+<!DOCTYPE html>
+<html lang="zh-cn">
+    
+<head>
+    <meta charset="UTF-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="千里之行，始于足下">
+    <title>分类: 爬虫 - 千里之行，始于足下</title>
+    <meta name="author" content="一瓢清浅">
+    
+        <meta name="keywords" content="python,AI,安全,算法,编程,">
+    
+    
+    
+    <script type="application/ld+json">{}</script>
+    <meta name="description" content="个人技术博客，涉及编程(python，c++)、安全测试、Web开发、AI算法等IT领域">
+<meta property="og:type" content="blog">
+<meta property="og:title" content="千里之行，始于足下">
+<meta property="og:url" content="https://jiliguluss.github.io/categories/%E5%BC%80%E5%8F%91/%E7%88%AC%E8%99%AB/index.html">
+<meta property="og:site_name" content="千里之行，始于足下">
+<meta property="og:description" content="个人技术博客，涉及编程(python，c++)、安全测试、Web开发、AI算法等IT领域">
+<meta property="og:locale" content="zh_CN">
+<meta property="article:author" content="一瓢清浅">
+<meta property="article:tag" content="python">
+<meta property="article:tag" content="AI">
+<meta property="article:tag" content="安全">
+<meta property="article:tag" content="算法">
+<meta property="article:tag" content="编程">
+<meta name="twitter:card" content="summary">
+    
+    
+        
+    
+    
+        <meta property="og:image" content="https://jiliguluss.github.io/assets/images/photo.jpg"/>
+    
+    
+    
+    
+    <!--STYLES-->
+    
+<link rel="stylesheet" href="/assets/css/all.css">
+
+    
+<link rel="stylesheet" href="/assets/css/jquery.fancybox.css">
+
+    
+<link rel="stylesheet" href="/assets/css/thumbs.css">
+
+    
+<link rel="stylesheet" href="/assets/css/tranquilpeak.css">
+
+    <!--STYLES END-->
+    
+
+    
+
+    
+</head>
+
+    <body>
+        <div id="blog">
+            <!-- Define author's picture -->
+
+
+<header id="header" data-behavior="2">
+    <i id="btn-open-sidebar" class="fa fa-lg fa-bars"></i>
+    <div class="header-title">
+        <a
+            class="header-title-link"
+            href="/"
+            aria-label=""
+        >
+            千里之行，始于足下
+        </a>
+    </div>
+    
+        
+            <a
+                class="header-right-icon "
+                href="#about"
+                aria-label="打开链接: /#about"
+            >
+        
+        
+            <i class="fa fa-question fa-lg"></i>
+        
+        </a>
+    
+</header>
+
+            <!-- Define author's picture -->
+
+
+
+        
+    
+
+<nav id="sidebar" data-behavior="2">
+    <div class="sidebar-container">
+        
+            <div class="sidebar-profile">
+                <a
+                    href="/#about"
+                    aria-label="阅读有关作者的更多信息"
+                >
+                    <img class="sidebar-profile-picture" src="/assets/images/photo.jpg" alt="作者的图片"/>
+                </a>
+                <h4 class="sidebar-profile-name">一瓢清浅</h4>
+                
+                    <h5 class="sidebar-profile-bio"><p>个人技术博客<br />涉猎开发、测试、数据、算法、安全等领域</p>
+</h5>
+                
+            </div>
+        
+        
+            <ul class="sidebar-buttons">
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/"
+                            
+                            rel="noopener"
+                            title="首页"
+                        >
+                        <i class="sidebar-button-icon fa fa-home" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">首页</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-categories"
+                            
+                            rel="noopener"
+                            title="分类"
+                        >
+                        <i class="sidebar-button-icon fa fa-bookmark" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">分类</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-tags"
+                            
+                            rel="noopener"
+                            title="标签"
+                        >
+                        <i class="sidebar-button-icon fa fa-tags" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">标签</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-archives"
+                            
+                            rel="noopener"
+                            title="归档"
+                        >
+                        <i class="sidebar-button-icon fa fa-archive" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">归档</span>
+                    </a>
+            </li>
+            
+        </ul>
+        
+            <ul class="sidebar-buttons">
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="#about"
+                            
+                            rel="noopener"
+                            title="关于"
+                        >
+                        <i class="sidebar-button-icon fa fa-question" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">关于</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="https://github.com/"
+                            
+                                target="_blank"
+                            
+                            rel="noopener"
+                            title="GitHub"
+                        >
+                        <i class="sidebar-button-icon fab fa-github" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">GitHub</span>
+                    </a>
+            </li>
+            
+        </ul>
+        
+    </div>
+</nav>
+
+            
+            <div id="main" data-behavior="2"
+                 class="
+                        hasCoverMetaIn
+                        ">
+                
+    <link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/tocbot/4.25.0/tocbot.css">
+    <style>
+        #post-toc {
+            position: fixed !important;
+            top: 80px;
+            padding: 10px;
+            z-index: 100;
+            background-color: rgba(255,255,255,0);
+            transform: translateX(0);
+            right: 4%;
+            width: 240px;
+            height: auto;
+            padding-top: 10px;
+            padding-bottom: 10px;
+        }
+    </style>
+    <div id="post-toc" class="toc"></div>
+
+                
+    <section class="postShorten-group main-content-wrap">
+    
+    
+    <article class="postShorten postShorten--thumbnailimg-right">
+        <div class="postShorten-wrap">
+            
+            <div class="postShorten-header">
+                <h1 class="postShorten-title">
+                    
+                        <a
+                            class="link-unstyled"
+                            href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/"
+                            aria-label=": 零基础爬虫入门"
+                        >
+                            零基础爬虫入门
+                        </a>
+                    
+                </h1>
+                <div class="postShorten-meta">
+    <time datetime="2023-01-08T14:05:37+08:00">
+	
+		    2023 年 1 月 8 日
+    	
+    </time>
+    
+        <span>发布在 </span>
+        
+    <a class="category-link" href="/categories/%E5%BC%80%E5%8F%91/">开发</a>, <a class="category-link" href="/categories/%E5%BC%80%E5%8F%91/%E7%88%AC%E8%99%AB/">爬虫</a>
+
+
+    
+</div>
+
+            </div>
+            
+                <div class="postShorten-excerpt">
+                    <p>从零开始学爬虫</p>
+                    
+                        <a
+                            href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/"
+                            class="postShorten-excerpt_link link"
+                            aria-label=": 零基础爬虫入门"
+                        >
+                            阅读全文
+                        </a>
+                        
+                    
+                </div>
+            
+        </div>
+        
+    </article>
+    
+    <div class="pagination-bar">
+    <ul class="pagination">
+        
+        
+        <li class="pagination-number">第 1 页 共 1 页</li>
+    </ul>
+</div>
+
+</section>
+
+
+
+                <footer id="footer" class="main-content-wrap">
+    <span class="copyrights">
+        Copyrights &copy; 2024 一瓢清浅. All Rights Reserved.
+    </span>
+</footer>
+
+            </div>
+            
+        </div>
+        
+
+
+    
+        
+    
+
+<div id="about">
+    <div id="about-card">
+        <div id="about-btn-close">
+            <i class="fa fa-times"></i>
+        </div>
+        
+            <img id="about-card-picture" src="/assets/images/photo.jpg" alt="作者的图片"/>
+        
+            <h4 id="about-card-name">一瓢清浅</h4>
+        
+            <div id="about-card-bio"><p>个人技术博客<br />涉猎开发、测试、数据、算法、安全等领域</p>
+</div>
+        
+        
+            <div id="about-card-job">
+                <i class="fa fa-briefcase"></i>
+                <br/>
+                <p>IT工程师</p>
+
+            </div>
+        
+        
+            <div id="about-card-location">
+                <i class="fa fa-map-marker-alt"></i>
+                <br/>
+                中国
+            </div>
+        
+    </div>
+</div>
+
+        
+        
+<div id="cover" style="background-image:url('/assets/images/cover.png');"></div>
+        <!--SCRIPTS-->
+
+<script src="/assets/js/jquery.js"></script>
+
+
+<script src="/assets/js/jquery.fancybox.js"></script>
+
+
+<script src="/assets/js/thumbs.js"></script>
+
+
+<script src="/assets/js/tranquilpeak.js"></script>
+
+<!--SCRIPTS END-->
+
+
+
+
+
+
+  <script src="https://cdn.jsdelivr.net/npm/tocbot@4.25.0/dist/tocbot.min.js"></script> 
+  <script type="text/javascript">
+      tocbot.init({
+        tocSelector: '#post-toc', // 目录容器的 ID 或 class
+        contentSelector: '.post-content', // 内容容器的 ID 或 class
+        headingSelector: 'h2,h3', // 你想要包含在目录中的标题级别
+        collapseDepth: 3,
+        scrollSmooth: true, 
+        activeClass: 'active', 
+        orderedList: false
+    });
+  </script> 
+
+
+    </body>
+</html>
diff --git a/index.html b/index.html
index 2c4bca1..35d48e9 100644
--- a/index.html
+++ b/index.html
@@ -752,7 +752,18 @@ <h1 class="postShorten-title">
     <ul class="pagination">
         
         
-        <li class="pagination-number">第 1 页 共 1 页</li>
+          <li class="pagination-next">
+            <a
+                class="btn btn--default btn--small"
+                href="/page/2/"
+                aria-label="下一页"
+            >
+              <span>下一页</span>
+              <i class="fa fa-angle-right text-base icon-ml"></i>
+            </a>
+          </li>
+        
+        <li class="pagination-number">第 1 页 共 2 页</li>
     </ul>
 </div>
 
diff --git a/page/2/index.html b/page/2/index.html
new file mode 100644
index 0000000..081e53b
--- /dev/null
+++ b/page/2/index.html
@@ -0,0 +1,399 @@
+
+<!DOCTYPE html>
+<html lang="zh-cn">
+    
+<head>
+    <meta charset="UTF-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="千里之行，始于足下">
+    <title>千里之行，始于足下</title>
+    <meta name="author" content="一瓢清浅">
+    
+        <meta name="keywords" content="python,AI,安全,算法,编程,">
+    
+    
+    
+    <script type="application/ld+json">{"@context":"http://schema.org","@type":"Website","@id":"https://jiliguluss.github.io","author":{"@type":"Person","name":"一瓢清浅","sameAs":["#about","https://github.com/"],"image":"photo.jpg"},"name":"千里之行，始于足下","description":"个人技术博客，涉及编程(python，c++)、安全测试、Web开发、AI算法等IT领域","url":"https://jiliguluss.github.io","keywords":"python, AI, 安全, 算法, 编程"}</script>
+    <meta name="description" content="个人技术博客，涉及编程(python，c++)、安全测试、Web开发、AI算法等IT领域">
+<meta property="og:type" content="blog">
+<meta property="og:title" content="千里之行，始于足下">
+<meta property="og:url" content="https://jiliguluss.github.io/page/2/index.html">
+<meta property="og:site_name" content="千里之行，始于足下">
+<meta property="og:description" content="个人技术博客，涉及编程(python，c++)、安全测试、Web开发、AI算法等IT领域">
+<meta property="og:locale" content="zh_CN">
+<meta property="article:author" content="一瓢清浅">
+<meta property="article:tag" content="python">
+<meta property="article:tag" content="AI">
+<meta property="article:tag" content="安全">
+<meta property="article:tag" content="算法">
+<meta property="article:tag" content="编程">
+<meta name="twitter:card" content="summary">
+    
+    
+        
+    
+    
+        <meta property="og:image" content="https://jiliguluss.github.io/assets/images/photo.jpg"/>
+    
+    
+    
+    
+    <!--STYLES-->
+    
+<link rel="stylesheet" href="/assets/css/all.css">
+
+    
+<link rel="stylesheet" href="/assets/css/jquery.fancybox.css">
+
+    
+<link rel="stylesheet" href="/assets/css/thumbs.css">
+
+    
+<link rel="stylesheet" href="/assets/css/tranquilpeak.css">
+
+    <!--STYLES END-->
+    
+
+    
+
+    
+</head>
+
+    <body>
+        <div id="blog">
+            <!-- Define author's picture -->
+
+
+<header id="header" data-behavior="2">
+    <i id="btn-open-sidebar" class="fa fa-lg fa-bars"></i>
+    <div class="header-title">
+        <a
+            class="header-title-link"
+            href="/"
+            aria-label=""
+        >
+            千里之行，始于足下
+        </a>
+    </div>
+    
+        
+            <a
+                class="header-right-icon "
+                href="#about"
+                aria-label="打开链接: /#about"
+            >
+        
+        
+            <i class="fa fa-question fa-lg"></i>
+        
+        </a>
+    
+</header>
+
+            <!-- Define author's picture -->
+
+
+
+        
+    
+
+<nav id="sidebar" data-behavior="2">
+    <div class="sidebar-container">
+        
+            <div class="sidebar-profile">
+                <a
+                    href="/#about"
+                    aria-label="阅读有关作者的更多信息"
+                >
+                    <img class="sidebar-profile-picture" src="/assets/images/photo.jpg" alt="作者的图片"/>
+                </a>
+                <h4 class="sidebar-profile-name">一瓢清浅</h4>
+                
+                    <h5 class="sidebar-profile-bio"><p>个人技术博客<br />涉猎开发、测试、数据、算法、安全等领域</p>
+</h5>
+                
+            </div>
+        
+        
+            <ul class="sidebar-buttons">
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/"
+                            
+                            rel="noopener"
+                            title="首页"
+                        >
+                        <i class="sidebar-button-icon fa fa-home" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">首页</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-categories"
+                            
+                            rel="noopener"
+                            title="分类"
+                        >
+                        <i class="sidebar-button-icon fa fa-bookmark" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">分类</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-tags"
+                            
+                            rel="noopener"
+                            title="标签"
+                        >
+                        <i class="sidebar-button-icon fa fa-tags" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">标签</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-archives"
+                            
+                            rel="noopener"
+                            title="归档"
+                        >
+                        <i class="sidebar-button-icon fa fa-archive" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">归档</span>
+                    </a>
+            </li>
+            
+        </ul>
+        
+            <ul class="sidebar-buttons">
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="#about"
+                            
+                            rel="noopener"
+                            title="关于"
+                        >
+                        <i class="sidebar-button-icon fa fa-question" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">关于</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="https://github.com/"
+                            
+                                target="_blank"
+                            
+                            rel="noopener"
+                            title="GitHub"
+                        >
+                        <i class="sidebar-button-icon fab fa-github" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">GitHub</span>
+                    </a>
+            </li>
+            
+        </ul>
+        
+    </div>
+</nav>
+
+            
+            <div id="main" data-behavior="2"
+                 class="
+                        hasCoverMetaIn
+                        ">
+                
+    <link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/tocbot/4.25.0/tocbot.css">
+    <style>
+        #post-toc {
+            position: fixed !important;
+            top: 80px;
+            padding: 10px;
+            z-index: 100;
+            background-color: rgba(255,255,255,0);
+            transform: translateX(0);
+            right: 4%;
+            width: 240px;
+            height: auto;
+            padding-top: 10px;
+            padding-bottom: 10px;
+        }
+    </style>
+    <div id="post-toc" class="toc"></div>
+
+                <section class="postShorten-group main-content-wrap">
+    
+    
+    <article class="postShorten postShorten--thumbnailimg-right">
+        <div class="postShorten-wrap">
+            
+            <div class="postShorten-header">
+                <h1 class="postShorten-title">
+                    
+                        <a
+                            class="link-unstyled"
+                            href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/"
+                            aria-label=": 零基础爬虫入门"
+                        >
+                            零基础爬虫入门
+                        </a>
+                    
+                </h1>
+                <div class="postShorten-meta">
+    <time datetime="2023-01-08T14:05:37+08:00">
+	
+		    2023 年 1 月 8 日
+    	
+    </time>
+    
+        <span>发布在 </span>
+        
+    <a class="category-link" href="/categories/%E5%BC%80%E5%8F%91/">开发</a>, <a class="category-link" href="/categories/%E5%BC%80%E5%8F%91/%E7%88%AC%E8%99%AB/">爬虫</a>
+
+
+    
+</div>
+
+            </div>
+            
+                <div class="postShorten-excerpt">
+                    <p>从零开始学爬虫</p>
+                    
+                        <a
+                            href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/"
+                            class="postShorten-excerpt_link link"
+                            aria-label=": 零基础爬虫入门"
+                        >
+                            阅读全文
+                        </a>
+                        
+                    
+                </div>
+            
+        </div>
+        
+    </article>
+    
+    <div class="pagination-bar">
+    <ul class="pagination">
+        
+          <li class="pagination-prev">
+            <a
+                class="btn btn--default btn--small"
+                href="/"
+                aria-label="上一页"
+            >
+              <i class="fa fa-angle-left text-base icon-mr"></i>
+              <span>上一页</span>
+            </a>
+          </li>
+        
+        
+        <li class="pagination-number">第 2 页 共 2 页</li>
+    </ul>
+</div>
+
+</section>
+
+
+                <footer id="footer" class="main-content-wrap">
+    <span class="copyrights">
+        Copyrights &copy; 2024 一瓢清浅. All Rights Reserved.
+    </span>
+</footer>
+
+            </div>
+            
+        </div>
+        
+
+
+    
+        
+    
+
+<div id="about">
+    <div id="about-card">
+        <div id="about-btn-close">
+            <i class="fa fa-times"></i>
+        </div>
+        
+            <img id="about-card-picture" src="/assets/images/photo.jpg" alt="作者的图片"/>
+        
+            <h4 id="about-card-name">一瓢清浅</h4>
+        
+            <div id="about-card-bio"><p>个人技术博客<br />涉猎开发、测试、数据、算法、安全等领域</p>
+</div>
+        
+        
+            <div id="about-card-job">
+                <i class="fa fa-briefcase"></i>
+                <br/>
+                <p>IT工程师</p>
+
+            </div>
+        
+        
+            <div id="about-card-location">
+                <i class="fa fa-map-marker-alt"></i>
+                <br/>
+                中国
+            </div>
+        
+    </div>
+</div>
+
+        
+        
+<div id="cover" style="background-image:url('/assets/images/cover.png');"></div>
+        <!--SCRIPTS-->
+
+<script src="/assets/js/jquery.js"></script>
+
+
+<script src="/assets/js/jquery.fancybox.js"></script>
+
+
+<script src="/assets/js/thumbs.js"></script>
+
+
+<script src="/assets/js/tranquilpeak.js"></script>
+
+<!--SCRIPTS END-->
+
+
+
+
+
+
+  <script src="https://cdn.jsdelivr.net/npm/tocbot@4.25.0/dist/tocbot.min.js"></script> 
+  <script type="text/javascript">
+      tocbot.init({
+        tocSelector: '#post-toc', // 目录容器的 ID 或 class
+        contentSelector: '.post-content', // 内容容器的 ID 或 class
+        headingSelector: 'h2,h3', // 你想要包含在目录中的标题级别
+        collapseDepth: 3,
+        scrollSmooth: true, 
+        activeClass: 'active', 
+        orderedList: false
+    });
+  </script> 
+
+
+    </body>
+</html>
diff --git a/tags/Web/index.html b/tags/Web/index.html
new file mode 100644
index 0000000..f584066
--- /dev/null
+++ b/tags/Web/index.html
@@ -0,0 +1,389 @@
+
+<!DOCTYPE html>
+<html lang="zh-cn">
+    
+<head>
+    <meta charset="UTF-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="千里之行，始于足下">
+    <title>标签: Web - 千里之行，始于足下</title>
+    <meta name="author" content="一瓢清浅">
+    
+        <meta name="keywords" content="python,AI,安全,算法,编程,">
+    
+    
+    
+    <script type="application/ld+json">{}</script>
+    <meta name="description" content="个人技术博客，涉及编程(python，c++)、安全测试、Web开发、AI算法等IT领域">
+<meta property="og:type" content="blog">
+<meta property="og:title" content="千里之行，始于足下">
+<meta property="og:url" content="https://jiliguluss.github.io/tags/Web/index.html">
+<meta property="og:site_name" content="千里之行，始于足下">
+<meta property="og:description" content="个人技术博客，涉及编程(python，c++)、安全测试、Web开发、AI算法等IT领域">
+<meta property="og:locale" content="zh_CN">
+<meta property="article:author" content="一瓢清浅">
+<meta property="article:tag" content="python">
+<meta property="article:tag" content="AI">
+<meta property="article:tag" content="安全">
+<meta property="article:tag" content="算法">
+<meta property="article:tag" content="编程">
+<meta name="twitter:card" content="summary">
+    
+    
+        
+    
+    
+        <meta property="og:image" content="https://jiliguluss.github.io/assets/images/photo.jpg"/>
+    
+    
+    
+    
+    <!--STYLES-->
+    
+<link rel="stylesheet" href="/assets/css/all.css">
+
+    
+<link rel="stylesheet" href="/assets/css/jquery.fancybox.css">
+
+    
+<link rel="stylesheet" href="/assets/css/thumbs.css">
+
+    
+<link rel="stylesheet" href="/assets/css/tranquilpeak.css">
+
+    <!--STYLES END-->
+    
+
+    
+
+    
+</head>
+
+    <body>
+        <div id="blog">
+            <!-- Define author's picture -->
+
+
+<header id="header" data-behavior="2">
+    <i id="btn-open-sidebar" class="fa fa-lg fa-bars"></i>
+    <div class="header-title">
+        <a
+            class="header-title-link"
+            href="/"
+            aria-label=""
+        >
+            千里之行，始于足下
+        </a>
+    </div>
+    
+        
+            <a
+                class="header-right-icon "
+                href="#about"
+                aria-label="打开链接: /#about"
+            >
+        
+        
+            <i class="fa fa-question fa-lg"></i>
+        
+        </a>
+    
+</header>
+
+            <!-- Define author's picture -->
+
+
+
+        
+    
+
+<nav id="sidebar" data-behavior="2">
+    <div class="sidebar-container">
+        
+            <div class="sidebar-profile">
+                <a
+                    href="/#about"
+                    aria-label="阅读有关作者的更多信息"
+                >
+                    <img class="sidebar-profile-picture" src="/assets/images/photo.jpg" alt="作者的图片"/>
+                </a>
+                <h4 class="sidebar-profile-name">一瓢清浅</h4>
+                
+                    <h5 class="sidebar-profile-bio"><p>个人技术博客<br />涉猎开发、测试、数据、算法、安全等领域</p>
+</h5>
+                
+            </div>
+        
+        
+            <ul class="sidebar-buttons">
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/"
+                            
+                            rel="noopener"
+                            title="首页"
+                        >
+                        <i class="sidebar-button-icon fa fa-home" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">首页</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-categories"
+                            
+                            rel="noopener"
+                            title="分类"
+                        >
+                        <i class="sidebar-button-icon fa fa-bookmark" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">分类</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-tags"
+                            
+                            rel="noopener"
+                            title="标签"
+                        >
+                        <i class="sidebar-button-icon fa fa-tags" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">标签</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-archives"
+                            
+                            rel="noopener"
+                            title="归档"
+                        >
+                        <i class="sidebar-button-icon fa fa-archive" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">归档</span>
+                    </a>
+            </li>
+            
+        </ul>
+        
+            <ul class="sidebar-buttons">
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="#about"
+                            
+                            rel="noopener"
+                            title="关于"
+                        >
+                        <i class="sidebar-button-icon fa fa-question" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">关于</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="https://github.com/"
+                            
+                                target="_blank"
+                            
+                            rel="noopener"
+                            title="GitHub"
+                        >
+                        <i class="sidebar-button-icon fab fa-github" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">GitHub</span>
+                    </a>
+            </li>
+            
+        </ul>
+        
+    </div>
+</nav>
+
+            
+            <div id="main" data-behavior="2"
+                 class="
+                        hasCoverMetaIn
+                        ">
+                
+    <link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/tocbot/4.25.0/tocbot.css">
+    <style>
+        #post-toc {
+            position: fixed !important;
+            top: 80px;
+            padding: 10px;
+            z-index: 100;
+            background-color: rgba(255,255,255,0);
+            transform: translateX(0);
+            right: 4%;
+            width: 240px;
+            height: auto;
+            padding-top: 10px;
+            padding-bottom: 10px;
+        }
+    </style>
+    <div id="post-toc" class="toc"></div>
+
+                
+    <section class="postShorten-group main-content-wrap">
+    
+    
+    <article class="postShorten postShorten--thumbnailimg-right">
+        <div class="postShorten-wrap">
+            
+            <div class="postShorten-header">
+                <h1 class="postShorten-title">
+                    
+                        <a
+                            class="link-unstyled"
+                            href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/"
+                            aria-label=": 零基础爬虫入门"
+                        >
+                            零基础爬虫入门
+                        </a>
+                    
+                </h1>
+                <div class="postShorten-meta">
+    <time datetime="2023-01-08T14:05:37+08:00">
+	
+		    2023 年 1 月 8 日
+    	
+    </time>
+    
+        <span>发布在 </span>
+        
+    <a class="category-link" href="/categories/%E5%BC%80%E5%8F%91/">开发</a>, <a class="category-link" href="/categories/%E5%BC%80%E5%8F%91/%E7%88%AC%E8%99%AB/">爬虫</a>
+
+
+    
+</div>
+
+            </div>
+            
+                <div class="postShorten-excerpt">
+                    <p>从零开始学爬虫</p>
+                    
+                        <a
+                            href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/"
+                            class="postShorten-excerpt_link link"
+                            aria-label=": 零基础爬虫入门"
+                        >
+                            阅读全文
+                        </a>
+                        
+                    
+                </div>
+            
+        </div>
+        
+    </article>
+    
+    <div class="pagination-bar">
+    <ul class="pagination">
+        
+        
+        <li class="pagination-number">第 1 页 共 1 页</li>
+    </ul>
+</div>
+
+</section>
+
+
+                <footer id="footer" class="main-content-wrap">
+    <span class="copyrights">
+        Copyrights &copy; 2024 一瓢清浅. All Rights Reserved.
+    </span>
+</footer>
+
+            </div>
+            
+        </div>
+        
+
+
+    
+        
+    
+
+<div id="about">
+    <div id="about-card">
+        <div id="about-btn-close">
+            <i class="fa fa-times"></i>
+        </div>
+        
+            <img id="about-card-picture" src="/assets/images/photo.jpg" alt="作者的图片"/>
+        
+            <h4 id="about-card-name">一瓢清浅</h4>
+        
+            <div id="about-card-bio"><p>个人技术博客<br />涉猎开发、测试、数据、算法、安全等领域</p>
+</div>
+        
+        
+            <div id="about-card-job">
+                <i class="fa fa-briefcase"></i>
+                <br/>
+                <p>IT工程师</p>
+
+            </div>
+        
+        
+            <div id="about-card-location">
+                <i class="fa fa-map-marker-alt"></i>
+                <br/>
+                中国
+            </div>
+        
+    </div>
+</div>
+
+        
+        
+<div id="cover" style="background-image:url('/assets/images/cover.png');"></div>
+        <!--SCRIPTS-->
+
+<script src="/assets/js/jquery.js"></script>
+
+
+<script src="/assets/js/jquery.fancybox.js"></script>
+
+
+<script src="/assets/js/thumbs.js"></script>
+
+
+<script src="/assets/js/tranquilpeak.js"></script>
+
+<!--SCRIPTS END-->
+
+
+
+
+
+
+  <script src="https://cdn.jsdelivr.net/npm/tocbot@4.25.0/dist/tocbot.min.js"></script> 
+  <script type="text/javascript">
+      tocbot.init({
+        tocSelector: '#post-toc', // 目录容器的 ID 或 class
+        contentSelector: '.post-content', // 内容容器的 ID 或 class
+        headingSelector: 'h2,h3', // 你想要包含在目录中的标题级别
+        collapseDepth: 3,
+        scrollSmooth: true, 
+        activeClass: 'active', 
+        orderedList: false
+    });
+  </script> 
+
+
+    </body>
+</html>
diff --git a/tags/python/index.html b/tags/python/index.html
new file mode 100644
index 0000000..c128ccd
--- /dev/null
+++ b/tags/python/index.html
@@ -0,0 +1,389 @@
+
+<!DOCTYPE html>
+<html lang="zh-cn">
+    
+<head>
+    <meta charset="UTF-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="千里之行，始于足下">
+    <title>标签: python - 千里之行，始于足下</title>
+    <meta name="author" content="一瓢清浅">
+    
+        <meta name="keywords" content="python,AI,安全,算法,编程,">
+    
+    
+    
+    <script type="application/ld+json">{}</script>
+    <meta name="description" content="个人技术博客，涉及编程(python，c++)、安全测试、Web开发、AI算法等IT领域">
+<meta property="og:type" content="blog">
+<meta property="og:title" content="千里之行，始于足下">
+<meta property="og:url" content="https://jiliguluss.github.io/tags/python/index.html">
+<meta property="og:site_name" content="千里之行，始于足下">
+<meta property="og:description" content="个人技术博客，涉及编程(python，c++)、安全测试、Web开发、AI算法等IT领域">
+<meta property="og:locale" content="zh_CN">
+<meta property="article:author" content="一瓢清浅">
+<meta property="article:tag" content="python">
+<meta property="article:tag" content="AI">
+<meta property="article:tag" content="安全">
+<meta property="article:tag" content="算法">
+<meta property="article:tag" content="编程">
+<meta name="twitter:card" content="summary">
+    
+    
+        
+    
+    
+        <meta property="og:image" content="https://jiliguluss.github.io/assets/images/photo.jpg"/>
+    
+    
+    
+    
+    <!--STYLES-->
+    
+<link rel="stylesheet" href="/assets/css/all.css">
+
+    
+<link rel="stylesheet" href="/assets/css/jquery.fancybox.css">
+
+    
+<link rel="stylesheet" href="/assets/css/thumbs.css">
+
+    
+<link rel="stylesheet" href="/assets/css/tranquilpeak.css">
+
+    <!--STYLES END-->
+    
+
+    
+
+    
+</head>
+
+    <body>
+        <div id="blog">
+            <!-- Define author's picture -->
+
+
+<header id="header" data-behavior="2">
+    <i id="btn-open-sidebar" class="fa fa-lg fa-bars"></i>
+    <div class="header-title">
+        <a
+            class="header-title-link"
+            href="/"
+            aria-label=""
+        >
+            千里之行，始于足下
+        </a>
+    </div>
+    
+        
+            <a
+                class="header-right-icon "
+                href="#about"
+                aria-label="打开链接: /#about"
+            >
+        
+        
+            <i class="fa fa-question fa-lg"></i>
+        
+        </a>
+    
+</header>
+
+            <!-- Define author's picture -->
+
+
+
+        
+    
+
+<nav id="sidebar" data-behavior="2">
+    <div class="sidebar-container">
+        
+            <div class="sidebar-profile">
+                <a
+                    href="/#about"
+                    aria-label="阅读有关作者的更多信息"
+                >
+                    <img class="sidebar-profile-picture" src="/assets/images/photo.jpg" alt="作者的图片"/>
+                </a>
+                <h4 class="sidebar-profile-name">一瓢清浅</h4>
+                
+                    <h5 class="sidebar-profile-bio"><p>个人技术博客<br />涉猎开发、测试、数据、算法、安全等领域</p>
+</h5>
+                
+            </div>
+        
+        
+            <ul class="sidebar-buttons">
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/"
+                            
+                            rel="noopener"
+                            title="首页"
+                        >
+                        <i class="sidebar-button-icon fa fa-home" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">首页</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-categories"
+                            
+                            rel="noopener"
+                            title="分类"
+                        >
+                        <i class="sidebar-button-icon fa fa-bookmark" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">分类</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-tags"
+                            
+                            rel="noopener"
+                            title="标签"
+                        >
+                        <i class="sidebar-button-icon fa fa-tags" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">标签</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-archives"
+                            
+                            rel="noopener"
+                            title="归档"
+                        >
+                        <i class="sidebar-button-icon fa fa-archive" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">归档</span>
+                    </a>
+            </li>
+            
+        </ul>
+        
+            <ul class="sidebar-buttons">
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="#about"
+                            
+                            rel="noopener"
+                            title="关于"
+                        >
+                        <i class="sidebar-button-icon fa fa-question" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">关于</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="https://github.com/"
+                            
+                                target="_blank"
+                            
+                            rel="noopener"
+                            title="GitHub"
+                        >
+                        <i class="sidebar-button-icon fab fa-github" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">GitHub</span>
+                    </a>
+            </li>
+            
+        </ul>
+        
+    </div>
+</nav>
+
+            
+            <div id="main" data-behavior="2"
+                 class="
+                        hasCoverMetaIn
+                        ">
+                
+    <link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/tocbot/4.25.0/tocbot.css">
+    <style>
+        #post-toc {
+            position: fixed !important;
+            top: 80px;
+            padding: 10px;
+            z-index: 100;
+            background-color: rgba(255,255,255,0);
+            transform: translateX(0);
+            right: 4%;
+            width: 240px;
+            height: auto;
+            padding-top: 10px;
+            padding-bottom: 10px;
+        }
+    </style>
+    <div id="post-toc" class="toc"></div>
+
+                
+    <section class="postShorten-group main-content-wrap">
+    
+    
+    <article class="postShorten postShorten--thumbnailimg-right">
+        <div class="postShorten-wrap">
+            
+            <div class="postShorten-header">
+                <h1 class="postShorten-title">
+                    
+                        <a
+                            class="link-unstyled"
+                            href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/"
+                            aria-label=": 零基础爬虫入门"
+                        >
+                            零基础爬虫入门
+                        </a>
+                    
+                </h1>
+                <div class="postShorten-meta">
+    <time datetime="2023-01-08T14:05:37+08:00">
+	
+		    2023 年 1 月 8 日
+    	
+    </time>
+    
+        <span>发布在 </span>
+        
+    <a class="category-link" href="/categories/%E5%BC%80%E5%8F%91/">开发</a>, <a class="category-link" href="/categories/%E5%BC%80%E5%8F%91/%E7%88%AC%E8%99%AB/">爬虫</a>
+
+
+    
+</div>
+
+            </div>
+            
+                <div class="postShorten-excerpt">
+                    <p>从零开始学爬虫</p>
+                    
+                        <a
+                            href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/"
+                            class="postShorten-excerpt_link link"
+                            aria-label=": 零基础爬虫入门"
+                        >
+                            阅读全文
+                        </a>
+                        
+                    
+                </div>
+            
+        </div>
+        
+    </article>
+    
+    <div class="pagination-bar">
+    <ul class="pagination">
+        
+        
+        <li class="pagination-number">第 1 页 共 1 页</li>
+    </ul>
+</div>
+
+</section>
+
+
+                <footer id="footer" class="main-content-wrap">
+    <span class="copyrights">
+        Copyrights &copy; 2024 一瓢清浅. All Rights Reserved.
+    </span>
+</footer>
+
+            </div>
+            
+        </div>
+        
+
+
+    
+        
+    
+
+<div id="about">
+    <div id="about-card">
+        <div id="about-btn-close">
+            <i class="fa fa-times"></i>
+        </div>
+        
+            <img id="about-card-picture" src="/assets/images/photo.jpg" alt="作者的图片"/>
+        
+            <h4 id="about-card-name">一瓢清浅</h4>
+        
+            <div id="about-card-bio"><p>个人技术博客<br />涉猎开发、测试、数据、算法、安全等领域</p>
+</div>
+        
+        
+            <div id="about-card-job">
+                <i class="fa fa-briefcase"></i>
+                <br/>
+                <p>IT工程师</p>
+
+            </div>
+        
+        
+            <div id="about-card-location">
+                <i class="fa fa-map-marker-alt"></i>
+                <br/>
+                中国
+            </div>
+        
+    </div>
+</div>
+
+        
+        
+<div id="cover" style="background-image:url('/assets/images/cover.png');"></div>
+        <!--SCRIPTS-->
+
+<script src="/assets/js/jquery.js"></script>
+
+
+<script src="/assets/js/jquery.fancybox.js"></script>
+
+
+<script src="/assets/js/thumbs.js"></script>
+
+
+<script src="/assets/js/tranquilpeak.js"></script>
+
+<!--SCRIPTS END-->
+
+
+
+
+
+
+  <script src="https://cdn.jsdelivr.net/npm/tocbot@4.25.0/dist/tocbot.min.js"></script> 
+  <script type="text/javascript">
+      tocbot.init({
+        tocSelector: '#post-toc', // 目录容器的 ID 或 class
+        contentSelector: '.post-content', // 内容容器的 ID 或 class
+        headingSelector: 'h2,h3', // 你想要包含在目录中的标题级别
+        collapseDepth: 3,
+        scrollSmooth: true, 
+        activeClass: 'active', 
+        orderedList: false
+    });
+  </script> 
+
+
+    </body>
+</html>
diff --git "a/tags/\347\210\254\350\231\253/index.html" "b/tags/\347\210\254\350\231\253/index.html"
new file mode 100644
index 0000000..50c97cc
--- /dev/null
+++ "b/tags/\347\210\254\350\231\253/index.html"
@@ -0,0 +1,389 @@
+
+<!DOCTYPE html>
+<html lang="zh-cn">
+    
+<head>
+    <meta charset="UTF-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="千里之行，始于足下">
+    <title>标签: 爬虫 - 千里之行，始于足下</title>
+    <meta name="author" content="一瓢清浅">
+    
+        <meta name="keywords" content="python,AI,安全,算法,编程,">
+    
+    
+    
+    <script type="application/ld+json">{}</script>
+    <meta name="description" content="个人技术博客，涉及编程(python，c++)、安全测试、Web开发、AI算法等IT领域">
+<meta property="og:type" content="blog">
+<meta property="og:title" content="千里之行，始于足下">
+<meta property="og:url" content="https://jiliguluss.github.io/tags/%E7%88%AC%E8%99%AB/index.html">
+<meta property="og:site_name" content="千里之行，始于足下">
+<meta property="og:description" content="个人技术博客，涉及编程(python，c++)、安全测试、Web开发、AI算法等IT领域">
+<meta property="og:locale" content="zh_CN">
+<meta property="article:author" content="一瓢清浅">
+<meta property="article:tag" content="python">
+<meta property="article:tag" content="AI">
+<meta property="article:tag" content="安全">
+<meta property="article:tag" content="算法">
+<meta property="article:tag" content="编程">
+<meta name="twitter:card" content="summary">
+    
+    
+        
+    
+    
+        <meta property="og:image" content="https://jiliguluss.github.io/assets/images/photo.jpg"/>
+    
+    
+    
+    
+    <!--STYLES-->
+    
+<link rel="stylesheet" href="/assets/css/all.css">
+
+    
+<link rel="stylesheet" href="/assets/css/jquery.fancybox.css">
+
+    
+<link rel="stylesheet" href="/assets/css/thumbs.css">
+
+    
+<link rel="stylesheet" href="/assets/css/tranquilpeak.css">
+
+    <!--STYLES END-->
+    
+
+    
+
+    
+</head>
+
+    <body>
+        <div id="blog">
+            <!-- Define author's picture -->
+
+
+<header id="header" data-behavior="2">
+    <i id="btn-open-sidebar" class="fa fa-lg fa-bars"></i>
+    <div class="header-title">
+        <a
+            class="header-title-link"
+            href="/"
+            aria-label=""
+        >
+            千里之行，始于足下
+        </a>
+    </div>
+    
+        
+            <a
+                class="header-right-icon "
+                href="#about"
+                aria-label="打开链接: /#about"
+            >
+        
+        
+            <i class="fa fa-question fa-lg"></i>
+        
+        </a>
+    
+</header>
+
+            <!-- Define author's picture -->
+
+
+
+        
+    
+
+<nav id="sidebar" data-behavior="2">
+    <div class="sidebar-container">
+        
+            <div class="sidebar-profile">
+                <a
+                    href="/#about"
+                    aria-label="阅读有关作者的更多信息"
+                >
+                    <img class="sidebar-profile-picture" src="/assets/images/photo.jpg" alt="作者的图片"/>
+                </a>
+                <h4 class="sidebar-profile-name">一瓢清浅</h4>
+                
+                    <h5 class="sidebar-profile-bio"><p>个人技术博客<br />涉猎开发、测试、数据、算法、安全等领域</p>
+</h5>
+                
+            </div>
+        
+        
+            <ul class="sidebar-buttons">
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/"
+                            
+                            rel="noopener"
+                            title="首页"
+                        >
+                        <i class="sidebar-button-icon fa fa-home" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">首页</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-categories"
+                            
+                            rel="noopener"
+                            title="分类"
+                        >
+                        <i class="sidebar-button-icon fa fa-bookmark" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">分类</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-tags"
+                            
+                            rel="noopener"
+                            title="标签"
+                        >
+                        <i class="sidebar-button-icon fa fa-tags" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">标签</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="/all-archives"
+                            
+                            rel="noopener"
+                            title="归档"
+                        >
+                        <i class="sidebar-button-icon fa fa-archive" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">归档</span>
+                    </a>
+            </li>
+            
+        </ul>
+        
+            <ul class="sidebar-buttons">
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="#about"
+                            
+                            rel="noopener"
+                            title="关于"
+                        >
+                        <i class="sidebar-button-icon fa fa-question" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">关于</span>
+                    </a>
+            </li>
+            
+                <li class="sidebar-button">
+                    
+                        <a
+                            class="sidebar-button-link "
+                            href="https://github.com/"
+                            
+                                target="_blank"
+                            
+                            rel="noopener"
+                            title="GitHub"
+                        >
+                        <i class="sidebar-button-icon fab fa-github" aria-hidden="true"></i>
+                        <span class="sidebar-button-desc">GitHub</span>
+                    </a>
+            </li>
+            
+        </ul>
+        
+    </div>
+</nav>
+
+            
+            <div id="main" data-behavior="2"
+                 class="
+                        hasCoverMetaIn
+                        ">
+                
+    <link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/tocbot/4.25.0/tocbot.css">
+    <style>
+        #post-toc {
+            position: fixed !important;
+            top: 80px;
+            padding: 10px;
+            z-index: 100;
+            background-color: rgba(255,255,255,0);
+            transform: translateX(0);
+            right: 4%;
+            width: 240px;
+            height: auto;
+            padding-top: 10px;
+            padding-bottom: 10px;
+        }
+    </style>
+    <div id="post-toc" class="toc"></div>
+
+                
+    <section class="postShorten-group main-content-wrap">
+    
+    
+    <article class="postShorten postShorten--thumbnailimg-right">
+        <div class="postShorten-wrap">
+            
+            <div class="postShorten-header">
+                <h1 class="postShorten-title">
+                    
+                        <a
+                            class="link-unstyled"
+                            href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/"
+                            aria-label=": 零基础爬虫入门"
+                        >
+                            零基础爬虫入门
+                        </a>
+                    
+                </h1>
+                <div class="postShorten-meta">
+    <time datetime="2023-01-08T14:05:37+08:00">
+	
+		    2023 年 1 月 8 日
+    	
+    </time>
+    
+        <span>发布在 </span>
+        
+    <a class="category-link" href="/categories/%E5%BC%80%E5%8F%91/">开发</a>, <a class="category-link" href="/categories/%E5%BC%80%E5%8F%91/%E7%88%AC%E8%99%AB/">爬虫</a>
+
+
+    
+</div>
+
+            </div>
+            
+                <div class="postShorten-excerpt">
+                    <p>从零开始学爬虫</p>
+                    
+                        <a
+                            href="/2023/01/08/%E9%9B%B6%E5%9F%BA%E7%A1%80%E7%88%AC%E8%99%AB%E5%85%A5%E9%97%A8/"
+                            class="postShorten-excerpt_link link"
+                            aria-label=": 零基础爬虫入门"
+                        >
+                            阅读全文
+                        </a>
+                        
+                    
+                </div>
+            
+        </div>
+        
+    </article>
+    
+    <div class="pagination-bar">
+    <ul class="pagination">
+        
+        
+        <li class="pagination-number">第 1 页 共 1 页</li>
+    </ul>
+</div>
+
+</section>
+
+
+                <footer id="footer" class="main-content-wrap">
+    <span class="copyrights">
+        Copyrights &copy; 2024 一瓢清浅. All Rights Reserved.
+    </span>
+</footer>
+
+            </div>
+            
+        </div>
+        
+
+
+    
+        
+    
+
+<div id="about">
+    <div id="about-card">
+        <div id="about-btn-close">
+            <i class="fa fa-times"></i>
+        </div>
+        
+            <img id="about-card-picture" src="/assets/images/photo.jpg" alt="作者的图片"/>
+        
+            <h4 id="about-card-name">一瓢清浅</h4>
+        
+            <div id="about-card-bio"><p>个人技术博客<br />涉猎开发、测试、数据、算法、安全等领域</p>
+</div>
+        
+        
+            <div id="about-card-job">
+                <i class="fa fa-briefcase"></i>
+                <br/>
+                <p>IT工程师</p>
+
+            </div>
+        
+        
+            <div id="about-card-location">
+                <i class="fa fa-map-marker-alt"></i>
+                <br/>
+                中国
+            </div>
+        
+    </div>
+</div>
+
+        
+        
+<div id="cover" style="background-image:url('/assets/images/cover.png');"></div>
+        <!--SCRIPTS-->
+
+<script src="/assets/js/jquery.js"></script>
+
+
+<script src="/assets/js/jquery.fancybox.js"></script>
+
+
+<script src="/assets/js/thumbs.js"></script>
+
+
+<script src="/assets/js/tranquilpeak.js"></script>
+
+<!--SCRIPTS END-->
+
+
+
+
+
+
+  <script src="https://cdn.jsdelivr.net/npm/tocbot@4.25.0/dist/tocbot.min.js"></script> 
+  <script type="text/javascript">
+      tocbot.init({
+        tocSelector: '#post-toc', // 目录容器的 ID 或 class
+        contentSelector: '.post-content', // 内容容器的 ID 或 class
+        headingSelector: 'h2,h3', // 你想要包含在目录中的标题级别
+        collapseDepth: 3,
+        scrollSmooth: true, 
+        activeClass: 'active', 
+        orderedList: false
+    });
+  </script> 
+
+
+    </body>
+</html>