Nodejs写的搬家工具知识分享

这篇文章 主要学习这两个模块的使用:

request-promise-native : https://github.com/request/request-promise-native

cheerio :https://github.com/cheeriojs/cheerio

nodejs有个request模块,专门处理这些网络请求方面的。 就像.NET也有request,webclient,httpclient啥的。。。

nodejs的request使用方法在这,自己查一下: https://github.com/request/request

而我喜欢用async和await的写法,因此我还引入了request-promise-native 模块, https://github.com/request/request-promise-native  ,这个就相当于.NET中httpclient吧。

好了背景就讲这么多,我们就开始简单的使用request-promise-native,进行模拟提交。

我用淘宝镜像安装模块,会比较快比较快一些,注册淘宝镜像方式:

npm install -g cnpm --registry=https://registry.npm.taobao.org

然安装模块:

cnpm install --save request
cnpm install --save request-promise-native

我们登陆后 ,尝试发一篇文章,然我们分析一下提交的东西:

主要是 Cookie以及 FormData。

好了,然后我们写一个 cnblogs,来处理提交,代码:

const request = require(‘request-promise-native‘);
// const proxy = ‘http://127.0.0.1:8888‘;
const url = ‘https://i.cnblogs.com/EditPosts.aspx?opt=1‘;
class Cnblogs {
  static async save({ title, content, postdate }) {
    let response = await request({
      url: url,
      method: ‘POST‘,
      headers: {
        Cookie: ‘[隐私隐私隐私]‘,
      },
      form: {
        __VIEWSTATE: ‘===========‘,
        __VIEWSTATEGENERATOR: ‘FE27D343‘,
        Editor$Edit$txbTitle: title,
        Editor$Edit$EditorBody: `<p style="color: red; font-weight: bold;">原文发布时间为:${postdate} —— 来源于本人的百度文章 [由搬家工具导入]</p>${content}`,
        Editor$Edit$APOptions$Advancedpanel1$cklCategories$0: ‘1031596‘,
        Editor$Edit$Advanced$ckbPublished: ‘on‘,
        Editor$Edit$Advanced$chkDisplayHomePage: ‘on‘,
        Editor$Edit$Advanced$chkComments: ‘on‘,
        Editor$Edit$Advanced$chkMainSyndication: ‘on‘,
        Editor$Edit$lkbPost: ‘发布‘
      }
    });
    return response;
  }
}

module.exports = Cnblogs;

嗯,我们建立一个 app.js 调用一下测试吧:

const cnblogs = require(‘./cnblogs‘);

const main = async () => {
  try {
    let response = await cnblogs.save(‘测试‘,‘测试内容‘,‘2018-01-01‘);
    console.log(response);
  } catch (err) {
    console.error(‘[ERROR]‘, err);
  }
};

main();

执行node app,我们发现, 导入成功了。。。。

我用类似的方法 从自己百度文章抓取文章,然后调用 cnblogs.save(); 进行导入:

抓取文章也是很简单的,为了方便从response查找dom,我们可以用这个模块 cheerio : https://github.com/cheeriojs/cheerio , 就类似于我们做.NET的时候会用 HtmlAgilityPack 来查找dom一样。

cheerio 可以去看看,他的语法跟jquery一样,使用起来很方便。

时间: 2024-11-10 14:08:40

Nodejs写的搬家工具知识分享的相关文章

NodeJS写个爬虫,把文章放到kindle中阅读

这两天看了好几篇不错的文章,有的时候想把好的文章 down 下来放到 kindle 上看,便写了个爬虫脚本,因为最近都在搞 node,所以就很自然的选择 node 来爬咯- 本文地址:http://www.cnblogs.com/hustskyking/p/spider-with-node.html,转载请注明源地址. 所谓爬虫,可以简单理解为利用程序操作文件,只是这些文件不在本地,需要我们拉取过来. 一. 爬虫代码解析 1. 拿到目标页码源码 Node 提供了很多接口来获取远程地址代码,就拿

手机游戏渠道SDK接入工具项目分享(三)拨开云雾是个坑

一直在纠结是先写框架设计还是先写掉过的坑,最后本这娱乐大众的态度先写掉过的坑让大家乐呵下. 项目开发过程中遇问题无数,回顾下8个大坑照成了项目一定程度上延期甚至返工. 1.  项目一开始几个人把现有3家主流的产品(1接,棱镜,AnySDK)研究了一遍.没想先在这里就进坑了.在研究了几天后发现这3家虽推出有一定时间,但都是以第三方服务角度设计和开发的产品,与需求不符. 2.  版本管理.和流程管理等内容因为运营人员更替一直在调整,直到我提出需要加价才做吧.需求上快把打包工具做成OA系统了,删除了于

手机游戏渠道SDK接入工具项目分享(二)万事开头难

一般接到任务后程序员们通常都开始着手进行技术调研了,但我这活是项目负责人.还有一大堆事情要先期准备,没人能帮忙. 一.人力配置 考虑的之前已经有一波人搞了大半年,但没有起色,先期也没有太大人力需求,所以不指望这批人了.因为是外包收钱按人头工时算,所以拉几个自己兄弟填坑. 初期人力配置 服务端x 1.Android x 1 二.开发需求 自己手机游戏CP作了3年,需求直接写完后让对方确认,一次通过. 1.      公司多款游戏都需要使用这套工具,需要作适配兼容,还好都是Unity3D项目.之后我

SCOM 2012知识分享-1:理解代理

Operations Manager"代理"是安装在计算机上的一项服务. 代理会收集数据.将采样数据与预定义的值进行比较.创建警报并运行响应. 管理服务器会接收配置并将配置分发到受监视的计算机上的代理. 所有代理均要向管理组中的一个管理服务器报告. 此管理服务器称为代理的主管理服务器. 代理根据管理服务器发送的配置观察受监视的计算机上的数据源并收集信息. 此代理还计算监视的计算机以及监视的计算机上的对象的运行状况状态,并向管理服务器报告. 监视的对象的运行状况变化或其他条件满足时,代理

UWP 手绘视频创作工具技术分享系列

开篇先来说一下写这篇文章的初衷. 初到来画,通读了来画 UWP App 的代码,发现里面确实有很多比较高深的技术点,同时也是有很多问题的,扩展性,耦合,性能,功能等等.于是我们决定从头重构这个产品,做一个全新的 “来画Pro” 出来,历经三个月的世间,这个产品终于正式上架. (做个小广告,在 Windows 应用商店搜索 “来画Pro” 就可以找到,目前公司定位为收费应用,但是有一个月试用期,如果大家感兴趣,可以跟我要免费代码.这里是 IT之家的报道:https://www.ithome.com

(知识分享)软硬件调试九法:第九条规则 如果你不修复一个bug,它将永远 存在

1.查证问题确已被修复 如果遵循了“制造失败”这条规则,就知道如何验证你确实修复了问题.无论问题和修复看起来多么明显,你都无法保证修复是有效的,直到做了测试并验证. 2.查证确实你的修复措施解决了问题 如果你取消这个修复,系统再次出现失败,再应用这个修复,问题消失,才能够证明你确实修复了问题.这样做的原因是,在调试期间,往往会改变一些不属于修复的地方,有时这些改变会隐藏问题,如果没有意识到这一点,发现测试起作用了,就高高兴兴的回家了,因为你做的修复和问题消失毫无关系,因此修复方案到达客户后,可能

MemoryStream相关知识分享

一.简单介绍一下MemoryStream MemoryStream是内存流,为系统内存提供读写操作,由于MemoryStream是通过无符号字节数组组成的,可以说MemoryStream的性能可以算比较出色,所以它担当起了一些其他流进行数据交互安时的中间工作,同时可降低应用程序中对临时缓冲区和临时文件的需求,其实MemoryStream的重要性不亚于FileStream,在很多场合,我们必须使用它来提高性能 二.MemoryStream和FileStream的区别 前文中也提到了,FileStr

XML的相关基础知识分享(二)

前面我们讲了一下XML相关的基础知识(一),下面我们在加深一下,看一下XML高级方面. 一.命名空间 1.命名冲突 XML命名空间提供避免元素冲突的方法. 命名冲突:在XML中,元素名称是由开发者定义的,当两个不同的文档使用相同的原俗名时,就会发生命名冲突.例如:下面这个XML文档携带者某个表格中的信息: 1 <table> 2 <tr> 3 <td>Apples</td> 4 <td>Bananas</td> 5 </tr&g

基于jfinal3.2构建的知识分享网[ 2017年08月27日 更新 ]

知识分享网(51fenxiang.xyz),是基于JFinal3.2+eayui1.5.2等技术构建的一款知识共享服务平台,该平台有利于企业和团队构建碎片化的知识分享平台,充分利用闲暇时间记忆碎片化的知识,提升企业或团队整体技能和知识水平. 访问网址: http://51fenxiang.xyz  http://www.mxtt.cc  QQ:303629685 权限系统模块演示:http://pan.baidu.com/s/1nvBkth3