众推项目的最近讨论

openKM

想问下有没有这样的开源文件管理系统,所有人都可以上传文件,只有有权限的管理员才可以下载他人的文件?

不知道openkm能不能做到。

OpenKM是一个开放源代码的电子文档管理系统,它的特点是可用于大型公司或是中小企业, 适应性比较强。 并且在知识管理方面的加工,提供了更加灵活和成本较低的替代应用。

界面如下:

zongtui项目

项目地址:    
(分布式爬虫)http://git.oschina.net/zongtui/zongtui-webcrawler    
(去重过滤器)https://git.oschina.net/zongtui/zongtui-filter    
(文本分类器)https://git.oschina.net/zongtui/zongtui-classifier    
(文档目录)https://git.oschina.net/zongtui/zongtui-doc

然后再推荐一篇文章:(深度学习 vs 机器学习 vs 模式识别)

http://www.itd4j.com/cloudcomputing/15538.html

自动化部署

请问 有Java的自动化部署工具推荐不?

有时候修改几个文件就要重新打包发布重启,太麻烦了,请问有什么更好的办法么?

Jenkins是一个开源软件项目,旨在提供一个开放易用的软件平台,使持续集成变成可能经济界。

云爬取

就是有一个客户端要爬取一千个商品,他可以提交给服务器,然后有服务器在分配给其它客户端来爬取。这样搞性能比较高,还能逃过IP限制。

那就是用户要爬什么资料。你就让用户自己去爬取。服务端只负责,接收任务,分配任务,返回任务。

等于是免费的ip池而已。。

项目新架构

经过讨论,目前的项目新架构已经修改如下:

这样,问题的集中点就在如何接入爬虫上了,因为现在各种爬虫已经太多,没必要在搞一个什么新鲜的东西!

core部分的思路参考:

下一步的处理

1.通过设定规则抓取页面;

2.设定页面存储方案;

3.通过页面材料分析出内容属性;

4.通过内容属性生成结果;

5.通过结果进行学习;

6.通过结果生成内容;

说一下为什么接入其它的,我举两个例子

1、webmagic

就我知道,这哥们写了2年,基本上各种问题都遇到过。没必要再走一遍它的路,如果有问题可以通过它预留的接口帮它完善,或者直接用自己的实现。比如有性能问题,就我知道现在国内没有一个比较权威的对各种爬虫做比较。

2、Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。

Nutch的创始人是Doug Cutting,他同时也是Lucene、Hadoop和Avro开源项目的创始人。

说它有问题我觉得只有这么几种可能:

1、场景不适合。

2、没理解,没用明白。

所以我觉得没必要非得造个轮子。

个性化推荐

用户端就是数据呈现了,我的理解是内容方主要的工作是:采集、整理、推荐、打TAG、分值(多个)、推荐、赞、踩、回复数、类型(图文、视频、文本、微信、微博等);

用户这边的东西就确实高级很多:单体关系画像,不同社交圈关系画像,主要人群划分TAG得分,年龄、性别、职业、特别事件、喜欢内容TAG得分、收藏内容TAG得分、分享内容TAG得分、不感兴趣内容TAG得分(负值或其他分数)    
推荐引擎主要的工作:按照用户的tag得分匹配内容,结合地理位置(当前的和常用的)、当前时间段(早、中、下、晚)、当前日期(节日、周末)、热点实时注册的时候选择标签这个是SNS的做法了,头条现在基本上都是从用户关系拿了关联用户数据再来推。

众推只要完成了初步的推荐功能,其他的基本上都是靠运营的人来积累数据。没有足够的数据肯定精准度要差点。比如一点资讯,现在内容差不多已经全搬过来了,但是推荐还是很烂,主要靠套用头条的编辑推荐那块,人工加了点分值。要不然感觉推荐会更加不准。

时间: 2024-10-13 22:20:19

众推项目的最近讨论的相关文章

Python不能用于大型项目?人们对Python的十大误解

Python 类型系统的特点是拥有强大.灵活的类型操作. 维基百科上对此作出的阐述. 而存在一个不争而有趣的事实是, Python 是比Java更加强类型的. Java 对于原生类型和对象区分了类型系统,它让null存在于一个灰色地带. 另一方面,现代的 Python 拥有一个统一的强类型系统, 其中什么都没有(None) 的类型是明确指定的. 更进一步的,JVM自身也是动态类型的,因为可以把它的 根源 追溯到由Sun所收购的Smalltalk VM的一个实现. Python的类型系统 很棒,但

猿团众包平台“项目保”让软件外包更靠谱

近日,猿团科技联合Testbird.权大师.红帽法律,共同推出“项目保”服务,为企业提供全程有保障的创业服务. Testbird是国内首个手游自动化云测试和移动APP测试平台,致力于为客户提供优质的测试服务,此次与猿团携手共推“项目保”,可在项目开发完成后提供专业测试. 同时,知识产权移动服务平台权大师加盟“项目保”,有力地保障雇主商标,知识产权.安全等问题. 红帽法律作为创业企业的法律卫士,在项目开发出现纠纷时,也将提供有力的法律服务. 什么是“项目保”? “项目保”是猿团为规范交易市场,打造

2016年4月6日作业 风险管理、项目收尾、知识产权管理

一.风险管理1.风险管理包括哪六个过程?(记)风险管理规划.风险识别.定性风险分析.定量风险分析.应对计划编制.风险监控. 2.什么是应急计划?请举例.   应急计划是指当一项可能的风险事件实际发生时项目团队将采取的预先确定的措施.例如,当项目经理根据一个新的软件产品开发的实际进展情况,预计到该软件开发成果将不能及时集成到正在按合同进行的信息系统项目中时,他们就会启动应急计划,例如采用对现有版本的软件产品进行少量的必要更动的措施. 3.什么是应急储备?请举例.    应急储备.是指根据项目发起人

软考中高项学员:2016年4月6日作业 风险管理、项目收尾管理、知识产权管理

软考中高项学员:2016年4月6日作业 风险管理.项目收尾管理.知识产权管理 一.风险管理 1.风险管理包括哪六个过程?(记) 风险规划.风险识别.定性风险分析.定量风险分析.应对计划编制.风险监控 2.什么是应急计划?请举例. 应急计划是指当一项可能的风险事件实际发生时项目团队将采取的预先确定的措施.例如当项目经理根据一个新的软件产品开发的实际进展情况,预计到该软件开发成果奖不能及时集成到正在按合同进行的信息系统项目中时,他们就会自动应急计划. 3.什么是应急储备?请举例. 应急储备是指根据项

16--论信息系统项目的范围管理

摘要 2013 年 8 月,笔者作为项目经理参与XX省电子政务网一期工程的建设工作.作为该单位的重点战略项目,该项目总投资为3200万人民币,项目周期为26个月,共有7个单位参与建设.该项目采用 B/S 结构,系统基于ORACLE数据库的JAVA/JAVA EE多层体系结构,以LINUX为主的作为操作系统, 应用面向对象设计.面向服务(SOA).面向接口技术.组件式开发技术,采用MVC.ORM.Web Service.AJAX技术. 该项目按照统一组织领导.统一规划建设.统一数据标准.统一外网平

信管师培训之第十节课作业(风险管理+项目收尾管理+知识产权管理)

第18章 风险管理 1.风险管理包括哪六个过程?(记) 项目风险管理过程包括如下内容: (1).风险管理规划. (2).风险识别. (3).定性风险分析. (4).定量风险分析. (5).应对计划编制. (6).风险监控. 2.什么是应急计划?请举例.应急计划,是指当一项可能的风险事件实际发生时项目团队将采取的预先确定的措施.例如,当项目经理根据一个新的软件产品开发的实际进展情况,预计到该软件开发成果将不能及时集成到正在按合同进行的信息系统项目中时,他们就会启动应急计划,例如采用对现有版本的软件

20151020项目沟通管理和项目合同管理

一.项目沟通管理: 1.项目沟通管理包括哪些过程(4点): 沟通计划编制: 信息分发: 绩效报告: 项目干系人管理 2.沟通管理计划的主要内容(8点): 项目干系人沟通要求: 对要发布信息的描述,包括格式.内容和详尽程度: 信息接收的个人或组织: 传达信息所需的技术或方法,如备忘录.电子邮件或新闻发布等: 沟通频率,如每周沟通等: 上报过程,对下层无法解决的问题,确定问题上报的时间要求和管理链(名称): 随项目的进展对沟通管理计划更新与细化的方法: 通用词汇表. 3.项目干系人管理的方法(12.

项目沟通管理总结

一.沟通管理的过程 项目沟通管理包括:编制沟通管理计划:信息发布:绩效报告:干系人管理 1)编制沟通管理计划作为项目沟通管理的第一步,其目的就是了解项目干系人的需求,制定项目沟通管理计划,该计划是整个项目管理的一部分.每个项目都需要交流项目的信息,但对信息的需求和分发方式差异很大.通过沟通计划来确定项目干系人的信息和沟通需求,包括确定哪些人是项目干系人是项目干系人,他们对项目收益水平的影响如何.谁需要信息.需要什么样的信息.何时需要信息,以及如何传递给他们. 2)信息发布是向项目干系人及时提供所

第七次课作业(项目沟通管理、合同管理)

一.项目沟通管理 1.项目沟通管理包括哪些过程?(记) (1)沟通计划编制 (2)信息分发 (3)绩效报告 (4)项目干系人管理 2.阻碍有效沟通的因素有哪些? (1)沟通双方的物理距离 (2)沟通的环境因素 (3)缺乏清晰的沟通渠道 (4)复杂的组织结构 (5)复杂的技术术语 (6)有害的态度 3.沟通计划编制的第一步是什么?目的是什么? 沟通计划编制的第一步是干系人分析.其目的是得出项目中沟通的需求和方式,进而形成较为准确的沟通需求表,然后再针对需求进行计划编制. 4.沟通管理计划包括哪些内