CSDN博客文章批量导出
脚本依赖环境安装指南 以下是为运行 CSDN 博客导出脚本(如 export_csdn_cf.py)而准备 Linux 系统环境所执行的一系列有效命令。这些命令主要用于安装 运行时、及其依赖库。 # 1. 安装 Python 包管理工具 pip3 apt install python3-pip -y # 2. 安装文件传输和解压工具 apt -y install lrzsz # 提供 rz/sz 命令,用于终端文件上传下载 apt -y install zip unzip # 用于处理 zip 和 unzip 格式的压缩包 # 3. 安装重命名工具 apt install rename # 强大的 Perl 脚本,用于批量重命名文件 # 4. 配置 Google Chrome 浏览器安装源 (使用清华镜像加速) # 下载并添加 Google 的 GPG 公钥以验证软件包完整性 wget -q -O - https://dl-ssl.google.com/linux/linux_signing_key.pub | sudo apt-key add - #或者上传执行如下的命令 # cat linux_signing_key.pub |sudo apt-key add - Warning: apt-key is deprecated. Manage keyring files in trusted.gpg.d instead (see apt-key(8)). OK # 将清华镜像的 Chrome 源写入 APT 源列表 echo "deb [arch=amd64] https://mirrors.tuna.tsinghua.edu.cn/google-chrome/deb/ stable main" > /etc/apt/sources.list.d/google-chrome.list # 5. 更新软件包索引并安装 Chrome 及其系统依赖 apt update # 同步最新的软件包列表 # 安装稳定版 Google Chrome # 下载 && dpkg -i去安装 https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb # 修复相关的依赖 apt --fix-broken install -y # 6. 安装 Chrome 运行所需的底层库 (确保 headless 模式正常工作) apt install -y \ wget \ unzip \ libxss1 \ libappindicator1 \ libindicator7 \ fonts-liberation \ libasound2 \ libatk-bridge2.0-0 \ libgtk-3-0 \ libdrm-common # 7. (可选)修复可能存在的依赖问题 apt --fix-broken install -y # 如果之前的安装出现中断或依赖错误,此命令可尝试自动修复 说明: 虽然核心抓取脚本export_csdn_cf.py使用的是cloudscraper,它不直接依赖浏览器,但如果您后续计划使用selenium或playwright等基于真实浏览器的自动化工具来应对更复杂的反爬机制(如 Turnstile 验证码),那么安装 Chrome 是必需的。 此处列出的lib*库是 Chrome 在无头(headless)模式下运行时常见的依赖项,能避免因缺少图形或音频库而导致的启动失败。 使用清华(TUNA)镜像可以显著加快在境内网络环境下下载 Chrome 的速度。 步骤一:安装 pip3 依赖 在开始编写和执行脚本之前,我们需要先配置好运行环境并安装必要的第三方库。 ...