1、首先是SSH语法的问题,一开始不懂SSH的语法,所以一直在装secureCRT之类的工具,但是后来学会用了,用过ssh 192.168.200.161 -p 42144 -l root 连接上了虚拟机,要访问到服务器,只要使用192.168这个ip就行,可以访问httpd默认80端口,你如果开了8080端口你就可以访问8080咯
2、部署环境是在虚拟机,192.168.200.161:42144,42144并不是他的虚拟机端口号,也就是说,你得到的虚拟机不只是一个端口(现在想想也不可能,这么多系统服务的端口,怎么可能只有一个端口),而是一台主机,只是说,这个端口42144是用来让你连接的,就好像vnc server一样,通过新开一个端口让你远程登陆的。
3、这次实践了scp命令,命令是scp ~/.ssh/id_rsa.pub [email protected]:~之类的,传输速度非常快,而且ssh保证了安全性
4、yum原来是一个python的模块,是通过python驱动的,你用不同的python版本去python setup.py install,你的第三方模块就会编译到不同的python版本,有pyenv的话会有多好啊。。
5、一般源代码安装的顺序是1 ./configure 2 make make 3 install
6、最重要是做!
7、tesseract是个好东西,但是识别准确率不太行。。
8、httpd的网页文件在/var/www/,日志文件在/var/log/httpd/里面,最好用tail命令查看
9、tar -xvf gunzip unzip
10、Makefile文件有你可以用的make 指令
11、setup tool不一定用ez_setup.py安装的,也可以用源代码安装(什么不可以用源代码安装?)
12、curl url>文件名
13、课程表分析:
有早上、中午、下午的tr要从第二个td开始算
有rowspan的td都有课
1357910的tr都不用考虑
tr的12一开始直接去掉,没有用信息
每个tr的第一个td都没用
取2-6个td来使用(对应星期1-7)
每个td可以根据br元素来分割,也可以用td.itertext(),这是一个绝妙的方法
巧妙运用while try except来实现自动识别每个td的课程数
结论是:做数据挖掘或者之类的分析工作,要逼自己去思考,先思考打草稿,再动手打代码