Mining of Massive Dataset----PageRank的两种问题spider traps和dead ends

PageRank的两种问题

  •   spider traps(蛛网陷阱)

      在几个网页的节点之间跳转,经过一段很长的时间之后,只能在节点n来回跳转(也就是说不嫩访问到其他的网页,只能点击访问节点n这个网页)。

  解决方法:

    在访问节点n的几率接近于1的时候,让他随机的跳转到任意一个网页(唉网页可以不在这些几点网页中)。

  • dead ends

    在几个网页的节点之间跳转,经过一段很长的时间之后,没有出路了,连几点n这个网页也不能访问。

  解决方法:

    判断网页节点矩阵M中是否有一列全部是0,如果有,则将这一列的值全部替换成1/n。

    

  

注释:

  设有n个网页作为节点,这些网页之间的链接作为线,构成的图是一个有向图。矩阵M表示这些点和线之间的关系。

  拿第一个例子来说,点y可以到达点y自己和点a,不能到达点m,所以第一列的值是1/2,1/2,0。点a可以到达点y和点m,不嫩到达点a自己,所以第二列的值是1/2, 0 ,1/2。而点m的出度是0,所以第三列的值全部是0。(是按照列来看的,不知道为什么要这样~)

  

  如下是一个dead ends的例子.

  下面是一个spider traps的例子。

时间: 2024-08-07 06:16:37

Mining of Massive Dataset----PageRank的两种问题spider traps和dead ends的相关文章

vb.net访问sql server数据库(SqlDataReader和DataSet两种方式)

.net访问数据库的三个基本步骤: 一.连接数据库: 要使用sqlclient命名空间中的sqlconnection类: 定义一个sqlconnection对象: Dim sqlCon As New SqlConnection 要进行的设置有: 1.sqlCon .ConnectionString="server=服务器ip;database=数据库名称;integrated security=ture/false(是否有登录账号密码);uid=用户名 (默认:sa);pwd:登录密码"

#测试两种不同的SVM,rbf的核真是太棒了(一种会拐弯的边界)

from sklearn import datasets import numpy as np X, y = datasets.make_blobs(n_features=2, centers=2) from sklearn.svm import LinearSVC from sklearn.svm import SVC #测试两种不同的SVM,rbf的核真是太棒了 #svm = LinearSVC() svm = SVC(kernel='rbf') svm.fit(X, y) ''' >>&

细说java中Map的两种迭代方式

以前对java中迭代方式总是迷迷糊糊的,今天总算弄懂了,特意的总结了一下,基本是算是理解透彻了. 1.再说Map之前先说下Iterator: Iterator主要用于遍历(即迭代访问)Collection集合中的元素,Iterator也称为迭代器.它仅仅只有三个方法:hasNext(),next()和remove() hasNext():如果仍有元素可以迭代,则返回 true.(换句话说,如果 next 返回了元素而不是 抛出异常,则返回 true). next():返回迭代的下一个元素. re

DropdownList绑定的两种方法

动态绑定方法一:动态绑定数据库中的字段. SqlConnection conn = UtilitySqlClass.OperateDataBase.ReturnConn();string strSQL = "select * from CompanyType";SqlDataAdapter ada = new SqlDataAdapter(strSQL, conn);DataSet ds = new DataSet();ada.Fill(ds, "CompanyType&qu

(转)DataRow的各种状态和DataView的两种过滤属性

DataRow的各种状态 http://www.cnblogs.com/zxjyuan/archive/2008/08/20/1271987.html 一个DataRow对象刚被创建之后(DataTable.NewRow())其状态是Detached,是孤立的一个存在. 所以建立了DataRow之后在DataRow中的单元填充了数据后还要通过DataTable.Rows.Add(DataRow)方法将此DataRow添加到DataTable,DataRow添加到DataTable后, 这个Dat

两种方法连接MySql数据库

1.用MySQLDriverCS连接MySQL数据库 先下载和安装MySQLDriverCS,在安装文件夹下面找到MySQLDriver.dll,然后将MySQLDriver.dll添加引用到项目中. using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Data.Odbc; using System.Drawing; using S

JFreeChart与AJAX+JSON+ECharts两种处理方式生成热词统计可视化图表

本篇的思想:对HDFS获取的数据进行两种不同的可视化图表处理方式.第一种JFreeChar可视化处理生成图片文件查看.第二种AJAX+JSON+ECharts实现可视化图表,并呈现于浏览器上.   对此,给出代码示例,通过网络爬虫技术,将上传到HDFS的新浪网新闻信息实现热词统计功能,通过图表的柱状图来显示出来. ------> 目录: 1.JFreeChart可视化处理(生成本地图片) [1]HDFS文件读取 [2]JDFreeChart库应用 2.AJAX+JSON+EChart生成可视化图

KbmMW两种查询结果集通讯方式

KbmMW本身可以用QueryService的方式进行远程数据查询,但是SmpileService同样具有很强的扩展性可以实现数据查询,下面展示两种基于SmpileService的远程数据查询方法,其原理都是利用TkbmMWSimpleService实现流的传输. 直接上代码了: 一.利用KbmMemTable: 服务端: ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 3

在下拉列表中显示多个字段的两种方法

首先,我们需要从数据库中取到我们的数据 Class1: 1 string sqlcon = "Data Source=.;Initial Catalog=Test;User ID=sa;Password=******"; 2 3 public List<ModelClass> FindAll() 4 { 5 try 6 { 7 List<ModelClass> modList = new List<ModelClass>(); 8 using (Sq