Halo博客文章数据导出工具

之前写了「CSDN 文章数据导出工具」,当时就说要写一下 「Halo博客文章数据导出工具」,本文就来介绍一下这个工具开发和使用。

效果展示

首先来看下导出的效果,与 CSDN 导出的数据类似,关于 CSDN 导出可查看「CSDN文章数据导出工具」。

开发

Halo 博客开源项目地址:https://github.com/halo-dev/halo

1、Halo 后台管理

Halo 博客的后台管理是有文章相关数据的,如下图所示,但是跟 CSDN 类似,不能导出,一页一页查看满足不了我的需求,所以我就想着把文章数据导出来。

2、Halo 版本问题

截止到发文时,Halo 的最新版本是「1.3.1」,我自己用的还是「0.4.3」,由于是大版本升级,数据需要迁移,并且部分页面的路径发生了变化,所以我暂时还没升级。

鉴于以上情况,我做了两个版本的兼容,1.X 和 0.4.X,但是只测试了 1.3.1、1.2.0 和 0.4.3,其他版本使用过程中有任何问题,欢迎随时反馈。

工具使用

说了这么多,这个工具到底怎么使用呢?

1、查看博客版本

登陆你的 Halo 博客管理后台,找到博客的版本。

1.X

如果你的版本是 1.X,可以通过点击「系统--关于」查看版本号,如下图所示:

0.4.X

如果你的版本是 0.4.X,那版本号应该在页面的右下键,如下图所示:

2、开启 API 访问

登陆你的 Halo 博客管理后台,开启 API。

1.X

如果你的版本是 1.X,点击「系统--博客设置--API 设置」,开启 API 服务,设置 Access key 并保存。

如果按照上面步骤没找到「API 设置」,那么点击「系统--博客设置」之后,右下键应该有个闪电的按钮,点击即可发现「API 设置」。

0.4.X

如果你的版本是 0.4.X,点击「设置--博客设置--其他设置」,启用 API 服务,设置 Api token 并保存。

3、访问工具

打开「Halo 博客文章数据导出工具」,依次选择博客版本、填写博客地址和 Access key 或 Api token,然后点击导出,稍等片刻,即可下载文章数据为 Excel。

例如我的 Halo 博客版本是 0.4.3,博客版本就选择「0.4.X」,博客地址填「https://juemuren4449.com」,然后再填入我从后台管理设置的 Api token,点击导出即可下载文件。

说明

Halo 博客的 0.4.X 和 1.X 版本,接口和数据结构都做出了改变,前者使用的是 api/archives/all 接口,一次即可获取所有文章的数据,后者使用的是 api/content/posts 接口,需要根据页数分页调用数据。

通过文章的数据的分析,可以看到不同类型题材的阅读量差异,可以一定程度上确定自己的题材和写作风格,但是数据也是次要的,更重要的是写出「言之有物」的文章。

使用过程中有任何问题,欢迎沟通交流,与君共勉。

相关阅读:

CSDN文章数据导出工具

欢迎访问的个人博客:掘墓人的小铲子

原文地址:https://www.cnblogs.com/juemuren4449/p/12684816.html

时间: 2024-10-09 04:41:37

Halo博客文章数据导出工具的相关文章

Flask之十——博客文章

1. 提交和显示博客文章 app/models.py: 博客文章模型 class Post(db.Model): __tablename__ = 'posts' id = db.Column(db.Integer, primary_key=True) body = db.Column(db.Text) timestamp = db.Column(db.DateTime, index=True, default=datetime.utcnow) author_id = db.Column(db.I

要批量下载的博客文章太多,又不想全部下载怎么办---豆约翰博客备份专家新增选择导出博客功能

有的时候,我们要下载的博主比较高产,发表了数以千计的博文,要批量下载的博客文章太多,又不想全部下载怎么办? 针对这种需求,新版本的博客备份专家开发了博客的部分导出功能. 与以往只能导出全部博文不同,新版博客备份专家,让用户可以通过先按分类或标题进行筛选,然后勾选想导出的部分博客进行导出. 首先,我们可以对已经下载下来的博文按文章标题或文章分类进行筛选,比如这里我们按分类筛选:如下图所示: 以上,我们在分类筛选框中录入了[IT人生涯],可以看到文章列表自动显示出来属于该分类的文章,不属于该分类的文

Sybase数据库技术,数据库恢复---分享Sybase数据库知识(博客文章索引@51cto)

Sybase数据库技术,数据库恢复分享Sybase数据库知识 博客文章列表,更新时间:2014-12-14 Sybase数据库技术,数据库恢复 站点地图 最新文章 ASE使用with ignore_dup_row删除重复数据  (评论 0   阅读 50) ASE 16静默方式安装并创建服务器  (评论 0   阅读 80) ASE执行sp_remotesql报错:Msg 11224, Level 16, State 2  (评论 0   阅读 72) Sybase支持浪潮天梭K1系统  (评论

跟大佬学django-发布博客文章

发布博客文章 我们先用最简单的方式实现博客文章的发布,使用django默认的管理功能就可以发布文章.要使用此功能,必须先创建超级管理员.下面是创建超级管理员的方法,请记住自己使用的用户名和密码. 创建超级用户 [[email protected] mysite]# python3 manage.py createsuperuser Username (leave blank to use 'root'): admin Email address: [email protected] Passwo

字典树的学习(剪辑的博客文章)

字典树(讲解+模版) 又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种.典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计.它的优点是:利用字符串的公共前缀来节约存储空间,最大限度地减少无谓的字符串比较,查询效率比哈希表高. 字典树与字典很相似,当你要查一个单词是不是在字典树中,首先看单词的第一个字母是不是在字典的第一层,如果不在,说明字典树里没有该单词,如果在 就在该字母的孩子节点里找是不是有单词的第二个字母,没有说明没有该单词

使用IntelliJ IDEA开发SpringMVC网站(五)博客文章管理

原文:使用IntelliJ IDEA开发SpringMVC网站(五)博客文章管理 摘要 通过对博客文章的管理,实现外键操作. 目录[-] 八.博客文章管理 1.查看文章 2.添加博客? ? ? ? 3.查看博文详情 4.修改博客内容 5.删除博客文章 九.尾声? ? ? ?? 1.如何部署 2.进一步的学习 3.ENDING 转载请注明出处:Gaussic(一个致力于AI研究却不得不兼顾项目的研究生) . 注:在阅读本文前,请先阅读: 使用IntelliJ IDEA开发SpringMVC网站(一

Java EE 学习(9):IDEA + maven + spring 搭建 web(5)- 博客文章管理

转载:Gaussic(一个致力于AI研究却不得不兼顾项目的研究生) . 注:在阅读本文前,请先阅读: Java EE 学习(5):IDEA + maven + spring 搭建 web(1) Java EE 学习(6):IDEA + maven + spring 搭建 web(2)- 配置 Spring Java EE 学习(7):IDEA + maven + spring 搭建 web(3)- 配置数据库 Java EE 学习(8):IDEA + maven + spring 搭建 web(

[Python学习] 简单网络爬虫抓取博客文章及思想介绍

        前面一直强调Python运用到网络爬虫方面非常有效,这篇文章也是结合学习的Python视频知识及我研究生数据挖掘方向的知识.从而简单介绍下Python是如何爬去网络数据的,文章知识非常简单,但是也分享给大家,就当简单入门吧!同时只分享知识,希望大家不要去做破坏网络的知识或侵犯别人的原创型文章.主要包括: 1.介绍爬取CSDN自己博客文章的简单思想及过程 2.实现Python源码爬取新浪韩寒博客的316篇文章 一.爬虫的简单思想      最近看刘兵的<Web数据挖掘>知道,在研

在Web微信应用中使用博客园RSS以及Quartz.NET实现博客文章内容的定期推送功能

本篇随笔介绍在Web微信应用中使用博客园RSS以及Quartz.NET实现博客文章内容的定期推送功能,首先对Quartz.NET进行一个简单的介绍和代码分析,掌握对作业调度的处理,然后对博客园RSS内容的处理如何获取,并结合微信消息的群发接口进行内容的发送,从而构建了一个在Web应用中利用作业调度来进行消息发送的业务模型. Quartz.NET是一个开源的作业调度框架,非常适合在平时的工作中,定时轮询数据库同步,定时邮件通知,定时处理数据等. Quartz.NET允许开发人员根据时间间隔(或天)