金色财经

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 493|回复: 0

写代码

[复制链接]

738

主题

844

帖子

4579

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4579
QQ
发表于 2023-5-5 07:21:14 来自手机 | 显示全部楼层 |阅读模式
用 Python 写了一个小工具,相当于 Python 版本的 SingleFile,能够将网页变成单页 HTML 离线保存,底层基于 Playwright。样式自然是接近 100% 还原原网页。如图1,图2,能分出哪个是李鬼吗?[哈哈]

这个工具还在开发中,后续会开源,并作为开源库发布到 PyPI,供大家使用。

Q&A

Q1. SingleFile 浏览器插件不香吗?为什么要用 Python 另搞一套

A:自然是搞一些自动化的事情,这个库可作为三方库形式集成进其它项目中,大家可以使用 Playwright 搞自己的事情,最后使用这个库咔嚓,快照一下完事。

Q2:为什么用单页 HTML?MHTML、WARC、…… 它们不香吗?

A:单页 HTML 对于用户来说是最友好的,兼容性也是最强的,文件在手,在任何 W3C 浏览器上都可以直接打开。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|金色财经

GMT+8, 2026-2-9 06:16 , Processed in 0.013672 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表