提取kindle笔记
首先在Kindle上通过邮件把笔记分享到自己的邮箱,然后把html下载到本地,执行下面的脚本:
#!/usr/bin/env python
import os
import sys
from lxml import html
def extract_notes(s):
etree = html.fromstring(s)
for i in etree.find_class("noteText"):
yield i.text
if __name__ == "__main__":
notes = []
with open(sys.argv[1]) as f:
s = f.read()
for i in extract_notes(s):
notes.append(i)
print("".join(notes))
执行之后,就会输出提取之后的文档。
$ python kindle.py 读书笔记.html
2019.11.12注:
网页版已经移除,请使用脚本。先安装Python3,然后pip安装lxml,之后即可执行此脚本。
更多文章
本站热门
- socks5 协议详解
- zerotier简明教程
- 搞定面试中的系统设计题
- 用peewee代替SQLAlchemy
- frp 源码阅读与分析(一):流程和概念
- Golang(Go语言)中实现典型的fork调用
- DNSCrypt简明教程
- 一个Gunicorn worker数量引发的血案
- Golang validator使用教程
- Docker组件介绍(一):runc和containerd
- Docker组件介绍(二):shim, docker-init和docker-proxy
- 使用Go语言实现一个异步任务框架
- 协程(coroutine)简介 - 什么是协程?
- SQLAlchemy简明教程
- Go Module 简明教程