毕业设计-6-3

连续几天做实验,有种一波未平一波又起的赶脚,今天也是,想想还是记录一下下吧。

1.

首先,跑GPS(Graph Processing System)的时候,因为输入文件增大导致昨天运行正常的流程出问题,显示heap
size~~~~。所以毛病锁定在输入规模上面!也就是所谓的scalablity
issue。由于GPS的资料非常的少,基本没有。我大概搜了一下,有人说要增大堆栈空间,巴拉巴拉,都不好使(http://stackoverflow.com/questions/1596009/java-lang-outofmemoryerror-java-heap-space)。后来去了GPS的讨论组,GPS之父告诉我们,应该这样做:

参见:https://groups.google.com/forum/#!topic/stanfordgpsusers/62FeHpZijU0

Hi, Semih.

I am using GPS to process
twitter graph. I got a critical problem. Twitter has a very skewed graph. Some
users may have more than 100k followers. Such vertex will trigger huge number
of messages.
GPS generates "java heap overflow" exceptions. I thought that
was because the messages are buffered in the memory before sending
out.

I don‘t think this is really do to the skew in the data. 100k is still a
very small amount of messages. It just means that, that vertex will likely
generate or receive 100k * 8 = 800k bytes = 0.8 MB more data. How much memory
are you giving to your java virtual machine? How much memory do your machines
have. I have about 4GB on each of my machines so I give the following flags to
my java scripts: -Xmx3000M. You should change the script file here: https://www.assembla.com/code/phd-projects/subversion/nodes/gps/trunk/scripts/start_gps_node.sh?rev=95 There
are two jvm flags XMX_SIZE and
XMS_SIZE, which you should adjust.

  于是乎我就跑过去修改了一下,分别增大XMX_SIZE
和 XMS_SIZE,然后又出现新的问题:连接不上端口,于是重新修改端口号,在传到hdfs上面去。

  好了!

2.

第二个问题,下午跑RDFlib的时候(我主要用它来使得解析RDF文件,使其变成图数据)。一开始使用 easy_install
rdflib来安装的时候总是显示有错误(可能这几天网络有问题,梯子不够长,嘿嘿)。后来急了,直接下载源文件,本地手动安装!可是找了半天,居然没有找到怎么手动安装!!
剁手~~~其实,进去文件目录后,prthon
setup.py install就可以了。

安装好了,尝试跑数据了,小数据跑得呼呼爽,后来准备跑真实数据了,300M 左右,结果就怂了。

No handlers could be found for logger "rdflib.term"

后来搜了一下,这个网址里面有解决方案
http://stackoverflow.com/questions/17393664/no-handlers-could-be-found-for-logger-rdflib-term

import logging
import rdflib

logging.basicConfig()# now load your graph
g = rdflib.Graph()
g.load("life_the_universe_everything.rdf")



3.

跑rdflib的时候,遇到问题:
WARNING:rdflib.term:http://www.w3.org/1999/02/22-rdf-syntax-ns# first  does not look like a valid URI, trying to serialize this will break.

然后会直接导致不能运行,郁闷啊!况且我的代码怎么能有Warning!于是乎去改,搜索了一下啊,有人说把URL里面的空格岁百纳用什么替代就好了,瞬间就笑开颜了,哈哈,果然好用!
当然了,我这么操作是因为我不在意具体的URL是什么,我只是把它当作一串字符而已!

毕业设计-6-3

时间: 2024-12-19 05:34:18

毕业设计-6-3的相关文章

毕业设计准备篇一——环境搭建

毕业设计准备篇一--环境搭建 经过四年的学习和实战经验,打算做一个可以融合大多数学习的知识的毕业设计,所以就给自己的毕设取名:(分布式)桌面化多媒体网站系统.系统采用的构架如图1所示. 图1 系统架构 其中数据库集群目前采用mysql集群,为什么呢,因为目前mysql使用率还是很大的,而且mysql官方文档详细,最大的原因是因为自己笔记本配置不够高,不能搭建oracle集群.业务集群和WEB集群使用dubbo来实现远程调用及服务治理. 本篇文档的主要内容是记录毕设准备工作--环境搭建. 环境搭建

第一次毕业设计任务书

一.毕业设计安排进度 计划安排时间 计划完成内容 是否完成 2017.3.1---2017.3.7 了解系统需求 是 2017.3.8-2017.3.21 了解算法.数据库以及相关概念 待完成 2017.3.23-2017.5.9 初步毕设,以及完成毕业论文初稿 待完成 2017.5.10-5.28 完善毕业论文和毕业设计,准备答辩 待完成 二.本周研究内容 关联规则 关联规则是由 Agrawal 等人在 1993 年首次提出的,是挖掘数据之间关联知识最常用的方法.关联规则的目的在于在一个数据集

毕业设计随录-3

由于昨晚的疯狂,导致今天起床较晚,吃了个饭都一点了,然后下午去办公室帮妈妈缝补衣服到五点,回来搞搞,煲个汤打个球吃个饭都九点多了,回到房间,搞了下毕业设计,就弄好了可以继承httpservlet类,创建servlet,不过需要导个servlet包,吗的,害我搞这么久,我记得我学servlet的时候都不用导就可以直接继承httpservlet,不知道那时的httpservlet应该是自己编写的,然后继承的,应该是这样.  就这样一天又没了,时间过得真快,然而毕业设计却冰山一角未动,从明天开始计算,

2016届毕业设计(论文) 基本规范及档案袋封面填写要求

  一.论文册要求及装订顺序:(注:1-6装订成一册,7-10单独存放档案材料中) (1)论文册外封面(使用全校统一的封面,论文用毕业论文封面,设计说明书用毕业设计封面). (2)原创性声明及论文使用授权声明. (3)立题卡. (4)任务书. (5)开题报告. (6)毕业论文或毕业设计. (7)中期检查表. (8)成绩评定表. (9)中英文翻译. (10)答辩记录. 二.毕业设计材料日期填写: (1)立题卡.任务书填写时间:2016年1月15日 (2)开题报告填写时间:      2016年3月

从高级软件工程角度分析本科毕业设计

本人是15级计算机科学与技术专业的周娜,在学习<高级软件工程>这门课程的过程中,老师交代给我们的第一次任务便是从软件工程角度去分析自己的本科毕业设计. 我的本科毕业设计题目是“基于Android的移动办公系统的设计与实现”,此课题的主要背景是随着网络技术的不断发展和移动终端的不断成熟,以及这两者之间的结合,移动办公方式逐渐引起更多人的关注和使用,方便了用户的工作使用户的工作场所不再拘泥于单一的办公室中.其使用的开发平台是Android平台,应用开发工具是Eclipse,编程语言为Java. 本

从软件工程的视角,回顾本科毕业设计,探视设计中存在的不足

本科毕业设计题目:江西省宜黄县东源银多金属矿普查设计 本普查设计是针对江西省宜黄县东源银多金属矿进行的.在收集前人工作的地质资料和矿区预查成果的基础上进行地质调查,部署一定的工程用来探索含矿破碎带的形态.产状.延伸.延深.蚀变.含矿性及矿化规律. 软件工程是一门强调采用工程的概念.原理. 技术和方法来开发软件系统的科学.主要包括: 需求分析.总体设计.详细设计和系统实现几个部分.结合对软件工程的学习,我发现我的毕业设计存在以下几点不足: 一.在野外地质工作中,我们主要是通过定点投图和野外地质记录

代做毕设,代做GIS毕业设计,GIS项目,GIS二次开发

代做毕设,代做GIS毕业设计,GIS项目等: 常年从事桌面GIS,ArcGIS数据处理分析等: ArcMap插件开发(.Net,Python): QQ:624030189 您是不是还在为做GIS毕业设计苦恼? 没有思路,数据不会处理,不会编程? 软件环境不会安装? 您是不是还在为科研项目中用到GIS而头疼? 图像不会处理,不会制图? 不会写脚本(Net,Python),不会用工具箱进行批处理? 这些东西,在我们这儿,不在话下:让您从GIS中解脱出来,是我们的目标! 我们能够为您提供解决方案.技术

关于写毕业设计网页代码写后感

哎,心累! 开始      本次本着自己养活自己的原则,接了三个学姐的毕业设计,都是是把她们的设计图编写成网页.实际都是一些布局规整,页面简介的网页.虽然一份网页有15页,但其实以正常速度大约两天就可以写完.所以毫无顾虑,接了三份,时间比较赶,差不多都三天之类要(不是同时接的). 过程     第一个学姐的设计是关于美食方面的网页,十五张网页大概只有五种样式.一共是三个人做,但第一次经验不足,在分配任务时非常随意,没有按照网页样式来分配,本来里面有八张样式一样的网页,硬是我们三人一人两三张给做完

第一次毕业设计任务

一. 毕业设计安排进度 计划安排时间 计划完成内容 是否完成 2017.3.1---2017.3.7 了解系统需求 是 2017.3.8---2017.4.1 整理项目需要制作的细节 2017.4.2-2017.5.1 具体代码实现到最后完工 2017.5.2---2017.5.22 完成论文部分内容,并且为答辩做好准备 二.本周研究内容. 1.理清思路,整理出项目的需求,包括确定游戏的类型决定做横版ARPG游戏(参考游戏<冒险岛>).游戏中涉及到的场景设想等. 2.对unity中需要使用的C

毕业设计随录-7

今天毕业设计主要完成了二个方面.一:跳转新闻类别页面的导航菜单,上下页的功能实现.  二:新闻页面的实现,导航,标题,内容,上下篇,阅读次数的实现.         新闻页面的实现,通过为主页的每个新闻标题添加一个跳转到servlet的链接.一点击就会进入新闻页面.   导航,标题,内容,上下篇,上下页等,都是操作路数基本一样,从dao--->util其它-->servlet-->jsp. 后期想改代码,可以从代码字符的不同,数据的不同,增添功能,优化界面四个方面入手. 重难点:1.上下