2015年8月总结

有时候,总想写点什么,可又不知道从何开始。每当要表达一些东西的时候,总会有一种语尽词穷的感觉,道不出那种振奋人心的话。“书到用时方恨少”大概就是这个意思吧。有时间,再回头学学语文,看看美文,涨涨知识吧。

下面来总结一下自已这几个月的学习成长吧。

以前总认为别人了不起,总感觉别人的知识面怎么会如此的宽泛,然后敬仰之心便犹如滔滔江水,连绵不绝。每次都会想着以后我也要好好充实自己的业余爱好,为生活增添一份乐趣,可事后往往又不了了之了。其实,学东西就好比爬山,起初精力充沛,步伐之神速令人刮目,很快就到了半山。可过了一阵子之后,精力值会达到了一个饱和点(或者说大脑的知识储藏量有限),会让你感觉怎么奋进都进步缓慢,看不到成功的灯塔,但当你再努力向前,到达山顶的时候,回首经历的一切,你会感觉,曾经的一切确实不过如此,一种“一览众山小”的感受油然而生,而这种感觉会让你心情舒畅,神清气爽,整个人都好了。

从某种角度上说,我应该算是个“技术宅”吧。能够连续待在实验室拼个好几个月,这大概算是我最自豪的事情了,没有之一。

从今年四月中旬开始,看paper,学习ML(DM)算法,然后跑实验,到现在大概整整四个月时间吧。能够写出一篇论文,确实不容易。期间也遇到了许多问题,比如自己做的数据没别人的好,数据正负样本不均衡、实验效果不理想等等,不过从中确实学到了很多的东西。现在,自己独立跑实验基本没有多大问题,至少自己能用Python实现常见的算法以及对文件的一些操作,唯一感觉会出问题的当属数据集这块。因为自己构造数据集,有些奇异点处理的不好,然后直接影响了最后模型的好坏。

五月上旬基本上玩过去了,五月下旬各类机器学习书籍接连到手,然后开始学习《机器学习实践》这本书,全书是用Python实现的代码,因为有源码参考,所以很容易理解,很适合算法学习入门。由于之前学习过数据挖掘算法的理论知识,所以这本书不到半个月就把相应的知识点理解的差不多了。关于算法理论,清华大学出版社李航的《统计学习方法》确实不错,全书纯理论知识,分析独特,通俗易懂,很全面,适合想深入研究算法的人。这本书我还没完全看完,接下来可以好好学习下。

六月,上旬的时候,在Leetcode上面刷了一个星期的算法题,做了60几个题目,后来感觉还是做实验重要,然后就接着去做数据了。数据处理期间,碰到了一些专业性问题,尤其是在计算结合位点的时候,导师当时也不在,而我对于生物上的一些专业知识不是很了解,所以进度卡住了一个星期左右。还有就是在计算一个特征的时候,停留了好几天。不过还好,六月底,数据的每个特征算是做出来了,但当时喉咙开始发炎了,然后又引起感冒,整个日子都不好过,整个人也都不好了。

到了七月,开始整理自己的数据集,跑实验,然后从分析结果。这段时间碰到的问题也让人抓狂。首先是数据集不均衡,跑出来的效果很差,很不理想。不过这个问题还是比较容易解决,最常用的就是抽样了,下抽样还是上抽样就看结果好不好了。最后我选择的是下抽样,构造新的平衡数据,但是最后跑出来的效果不理想,使用别人的方法,跑出来的效果比别人差了将近8个百分点,这显然不合逻辑。到了七月下旬的时候,没办法了,还是使用别人的数据集吧。然后接着在别人数据集的基础上,加特征,构造新的数据集,然后使用不同算法来跑实验,比较效果等。最后得到的效果和别人的差不多,但是相对于另外一篇论文,似乎要差点。因为该论文没有说明自己的结果是在独立测试上的结果还是交叉验证得到的结果。所以,继续跑实验吧。

八月的第一个星期,实验总算做出来了,最后比较了下,效果提升不多,因为本来原来的实验就做的比较好了,AUC达到了0.923,确实难以超越。接下来就开始赶paper,没日没夜的赶呀,终于在8月中旬将paper赶出来了。对于APBC2016能不能中,30%的接受率,就看运气了,因为整篇论文的效果确实不是很明显。

总的来说,整个实验下来,学到了不少东西。以前是看中文论文容易,看英文paper难,现在感觉是看英文paper明显简单了,而写paper困难了。接下来好好努力,加油学英语、学算法、学理论、做实验吧,其他的事情都是浮云。

版权声明:本文为博主原创文章,转载请注明来源。

时间: 2024-08-02 10:57:34

2015年8月总结的相关文章

WINDOWS 10 企业版LTSB 2015年11月补丁更新情况

WINDOWS 10 企业版LTSB 2015年11月补丁与其他WINDOWS 10版本自动更新KB3105213,按微软对LTSB的规划,LTSB不会轻易增加新功能,所以不会收到其他版本推送的1511更新包,安装这个KB3105213不会改变LTSB内部版本号,LTSB目前内部版本号还是10240, 不会更新到10586版本. LTSB的内部版本按以前的官方说明,一年只会升级一次

传智播客_2015年Java基础视频-深入浅出精华版 笔记(2015年9月14日23:11:11)

本笔记是个人笔记+摘录笔记相结合,非完全原创 day01 win 7系统打开DOS有趣方法:按住shift+右键,单击“在此处打开命令窗口”(注意:在此处可以是任何的文件夹,不一定是桌面) 用DOS删除的文件不可以在回收站恢复?!! 常用DOS命令d: 回车 盘符切换dir(directory):列出当前目录下的文件以及文件夹md (make directory) : 创建目录(创建文件夹)rd (remove directory): 删除目录(删除文件夹,注意:前提是文件夹必须是空的!!)如果

2015年8月27日课程作业(文件权限管理及grep正则和扩展正则表达式)-JY1506402-19+liuhui880818

学习内容:文件权限管理及grep正则和扩展正则表达式 系统环境:CentOS 6.7/7 x86_64 一.作业(练习)内容: 1.总结本此课程中所涉及命令的使用方法及相关示例展示: 2.总结基本正则表达式及扩展正则表达式 3.显示/etc/passwd文件中以bash结尾的行 4.显示/etc/passwd文件中的两位数或三位数 5.显示`netstat -tan`命令结果中以'LISTEN'后跟0个.1个或者多个空白字符结尾的行 6.添加用户bash.testbash.basher以及nol

linux运维实战练习-2015年8月30日课程作业(练习)安排

一.作业(练习)内容: 1.总结文本编辑工具vim的使用方法: 2.总结文件查找命令find的使用方法: 3.总结bash环境变量的相关内容: 4.总结Linux文件系统上的特殊权限(SUID.SGID.Sticky)的知识点: 5.总结Linux磁盘管理.文件系统相关知识点及其相关命令的使用方法: 6.复制/etc/grub.cfg配置文件至/tmp目录,用查找替换命令删除/tmp/grub.cfg文件中的行首的空白字符: 7.复制/etc/rc.d/init.d/functions文件至/t

雷米 - 心理罪:暗河(2015年8月9日)

<心理罪:暗河> 作 者:雷米译 者:系 列:出 版:重庆出版社字 数:290千字阅读完成:2015年8月9日

雷米 - 心理罪:教化场(2015年8月8日)

<心理罪:教化场> 作 者:雷米译 者:系 列:出 版:重庆出版社字 数:270千字阅读完成:2015年8月8日

雷米 - 心理罪:城市之光(2015年8月11日)

<心理罪:城市之光> 作 者:雷米译 者:系 列:出 版:重庆出版社字 数:374千字阅读完成:2015年8月9日

阿西莫夫 - 神们自己(2015年6月23日)

<神们自己> 作 者:阿西莫夫译 者:崔正男系 列:出 版:江苏凤凰文艺出版社字 数:230千字阅读完成:2015年6月23日

李宁-2015年7月13日-个人文档

姓名 李宁 日期 2015年7月13日 主要工作及心得 由于我负责服务器端的编写工作,而各部分的客户端的操作都要与服务器端通信,所以在今天的调试中,我贯穿于各部分模块的调试和检测,主要负责在出现问题时查找问题所属是客户端还是服务器端,针对服务器端出现的问题进行查找和修改. 上午我们的工作重心在于服务器端连接数据库,由于连接数据库是我们的项目中的一个核心部分,如果无法连接数据库,所有工作将无法继续展开,在此项目之前,我们接触Java连接数据库只在网页程序中接触过,并没有接触过普通的Java项目连接

2015年7月13日 项目开发记录

日期 2015年7月13日 星期 星期一 位置 中蓝公寓蓝芳园D507 主要工作 1)         解决服务器端连接数据库的问题(寻找驱动.驱动放置的位置及相关问题) 2)         代码合并及调试 操作员代码部分调试 提供者代码部分调试 经理代码部分调试 遇到的问题 1)         服务器端无法连接上数据库 2)         调试过程中遇到各种问题,例如 3)         JAVA中的日期类和数据库中的日期类转化问题 4)         字符串和日期的转化 解决方法