Skip to content

GuoRong-X/YuQue_Book_Download

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 

Repository files navigation

yuque-spider-plus-max

该项目基于https://github.com/Spritualkb/yuque-spider-plus/项目进行修改

语雀文档抓取工具(爬虫) 可以保存任意用户整个语雀知识库为Markdown格式 (包含完整目录结构和索引) 修复文件名特殊字符,导致路径不存在的问题。

使用: 安装 python3

https://www.python.org/downloads/

执行安装运行模块

pip install requests tqdm urllib3

执行抓取:

python3 main.py 语雀文档地址

demo: python3 main.py https://www.yuque.com/burpheart/phpaudit

2024/07/03

增加需要密码需要设置cookie功能爬取

在没有登录语雀的情况下:
    复制别人知识库时,查看cookie
在登录语雀的情况下:
    直接复制所有cookie

image-20240621112212019

命令行

示例 1:提供 URL 和 Cookie

python main.py "https://www.yuque.com/burpheart/phpaudit" --cookie "verified_books=****"

示例 2:提供 URL、Cookie 和输出路径

python main.py "https://www.yuque.com/burpheart/phpaudit" --cookie "verified_books=****" --output "download"

示例 3:仅提供 URL

python main.py "https://www.yuque.com/burpheart/phpaudit"

示例 4:提供 URL 和输出路径

python main.py "https://www.yuque.com/burpheart/phpaudit" --output "download"

示例 5:使用默认参数(显示帮助信息)

python main.py

2024/07/04

网络图片本地观看

修复出现部分图片无法本地加载的情况,把网络图片下载下来并把markdown对应的图片路径替换为相对路径的./assets路径下

About

语雀知识库下载,有密码无密码都可以。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages