优阅
GoodReader
本软件基于python,专注于PDF电子书阅读,本质是想要提升利用PDF电子书工作和阅读时的效率。所以我们首先要实现基本的PDF文件的阅读功能,我们利用python的PyMuPDF来实现这一点。
之后我们需要满足用户对PDF阅读中想要记录的关键内容进行记录保存,并在后期进行结构性的调整以及内容的修改。为实现这一点,我们需要保证内容数据的保存,以及利用文字区域检测,OCR(光学字符识别)来进行图片中文字的识别,我们利用sqlite3数据库来进行数据存储,采用OpenVc以及ocrmypdf和terseract实现图片中文字区域的检测和识别。
除了用户自己手动添加关键内容记录,我们将提供自动电子书目录识别并构建书签和思维导图来方便用户在清晰的框架内实现内容添加。为实现这一点,除了采用之前提到的文字识别技术,我们还将利用python进行网上资源的爬取相关内容的知识点并基于此利用基于python的xmind SDK来创建思维导图。
考虑到用户的英语阅读需求,我们也将内置查词翻译,划词翻译,截图翻译,在之前所使用的OCR识别基础上,结合谷歌翻译的接口来实现实时翻译。
除此之外,为了实现更高效的PDF阅读工具,我们将进一步扩展工具的功能,以此提升用户的使用舒适度和依赖性,提高用户粘性。