老男孩教育第三关课后实战考试题练习:请统计老男孩老师的博客 http://oldboy.blog.51cto.com/ 博客每小时所有用户访问的pv数量(统计样本5个小时以上)。
要求:老男孩20-21期的学生必答题(务必自己搞出来,能力才会提升),其他期可选。也欢迎linux初学网友们参与解答,高手请绕过。
考试题提示:
1、没思路的,可以VIP群里请群内导师们指导思路,或者自己憋出来。
2、PV(访问量):即Page View, 即页面浏览量或点击量,用户每完整加载一个页面即被计算一个PV
3、curl命令爬网页内容的方法及参数说明
curl --retry 10 --retry-delay 60 --retry-max-time 60 http://oldboy.blog.51cto.com/ -o oldboy_html
注: --retry表示重试次数; --retry-delay表示两次重试之间的时间间隔(秒为单位); --retry-max-time表示在此最大时间内只容许重试一次(一般与--retry-delay相同)
4、wget命令爬网页内容的方法及参数说明
wget -t 10 -w 60 -T 30 http://oldboy.blog.51cto.com/ -O oldboy_html2
注:-t(--tries)表示重试次数; -w表示两次重试之间的时间间隔(秒为单位); -T表示连接超时时间,如果超时则连接不成功,继续尝试下一次连接
重点说明:本题主要锻炼学生企业环境实战综合解决问题的能力,涉及知识点有PV知识,定时任务,守护进程,wget、curl、sed、awk、grep等诸多命令的组合应用能力。
大家可以评论给出答案!看谁最快,谁的最简单好用。
时间: 2024-11-05 19:00:16