WFilter的网页分类技术简介

一个有效的网址库是上网行为管理产品进行网页过滤的基本条件。现在市场上的大部分上网行为管理产品,都自带了网址库功能,但是各家的实现方式差别挺大的。大部分厂商都着重于宣传自己的“大”,动辄号称几千万网址库,殊不知相对于数以亿计(2015年网站总数已经超过3亿)的互联网而言,千万级的网址库也只是覆盖了一小部分而已。

WFilter系列上网行为管理产品,在”网址库“方面,采用了如下三种技术:

  1. 自带基本百万级网址库;涵盖alex排名前百万的网站列表。
  2. 本地自动分类技术;对于未知的网站类型,可以基于网站的内容,实时进行自动分类。
  3. 云主机分类技术;对于未知的网址类型,可以发送到我们的网站分类云主机进行查询,由主机进行分类后返回。

具体配置页面如下图:

请注意:

  1. 默认启用的是”发送到云主机进行分类“,大部分用户采用该选项即可。
  2. ”云主机分类”和“本地自动分类”都需要监控主机可以访问互联网才可以。
  3. 如果要启用“本地定时自动分类”,建议将本地定时自动分类建议设置在不繁忙的时间段。

WFilter系列上网行为管理产品,采用了”网址库“加上”自动网页分类“的技术,既不需要携带一个庞大的网址库,造成资源浪费,又可以满足各局域网的个性化需要;为上网行为管理提供了一个重要的网页过滤解决方案。

时间: 2024-12-04 19:11:03

WFilter的网页分类技术简介的相关文章

如何自定义网页分类?

网址库是网页过滤的基础.网页分类就是根据网站的内容,将网站分为什么类型,比如门户网站.购物类.信息类.技术类等等等.这样的产品早在N年前,Websence,surfcontrol就有号称千万级的网址库,甚至有些国内的行为管理硬件,动辄需要1T的内存空间,都是因为网址库不够精简的原因.但是互联网的网址就跟汪洋大海的海水一样,数不过来. 实际使用过程中,尤其是工作局域网环境,只会访问到网址库中1%的网址,其余的99%网址库几乎不用.这样大型网址库的优点仅有一个就是"大型"而这样的"

AJAX技术简介及入门实例

最近在学校参加暑期实习,参与的是一个社交网站项目,学长那边分配给的任务是前端开发,需要学习AJAX技术. 对于一个像我一样刚刚接触Web开发且无多少实际项目经验的新手而言,AJAX技术显得复杂而又深奥.经过两天的baidu.google,我对AJAX的基本原理有了一个大致的认识,在此总结一下. 1. 什么是AJAX? AJAX全称是异步的JavaScript和XML,是Asynchronous JavaScript and XML的缩写.AJAX技术用于创建交互式网页应用的网站开发,至于何为异步

IP寻址技术简介

1969年仅有四节点的ARPA网在美国实验成功,有谁能想到由此演化的互联网会成为世界 最大的数据网呢.随着计算机的普及,上网人数的不断增加,越来越多的企业把目光投 向互联网.支撑Internet运转的关键是IP技术,在此详细讲解其基本概念及IP的寻址过 程. MAC地址(位于数据链路层) 介质访问控制(Media Access Control)地址一般位于网卡中,用于标识网络设备,控制 对网络介质的访问.例如,网络设备要访问传输电缆(网线,位于物理层),必须具备一 个MAC地址,发送的数据要到达

[深度学习概念]·声纹识别技术简介

声纹识别技术简介 声纹识别,也称作说话人识别,是一种通过声音判别说话人身份的技术.从直觉上来说,声纹虽然不像人脸.指纹的个体差异那样直观可见,但由于每个人的声道.口腔和鼻腔也具有个体的差异性,因此反映到声音上也具有差异性.如果说将口腔看作声音的发射器,那作为接收器的人耳生来也具备辨别声音的能力. 最直观的是当我们打电话给家里的时候,通过一声“喂?”就能准确地分辨出接电话的是爸妈或是兄弟姐妹,这种语音中承载的说话人身份信息的唯一性使得声纹也可以像人脸.指纹那样作为生物信息识别技术的生力军,辅助甚至

静态网页开发技术-HTML

今天我重新复习了一下静态网页开发技术,概括如下. 一 .HTML文档结构与基本语法 :放置了标签的文本文档,可供浏览器解释执行的网页文件 1.注释标记 2.标记 3.属性 二.基本标记与使用 1.网页基本结构与标记 2.文本与段落标记 3.列表标签 4.超链接标签 5.图片标记 6.定时刷新或跳转 7.表格 三 HTML表单标签与表单设计 1.<FORM>标记及其属性 2  <INPUT>标记及其属性 3 <下拉列表框<SELECT>,<OPTION>

北大ACM题库习题分类与简介(转载)

在百度文库上找到的,不知是哪位大牛整理的,真的很不错! zz题 目分类 Posted by fishhead at 2007-01-13 12:44:58.0 -------------------------------------------------------------------------------- acm.pku.edu.cn 1. 排序 1423, 1694, 1723, 1727, 1763, 1788, 1828, 1838, 1840, 2201, 2376, 23

Docker原生网络技术简介

Docker原生网络技术简介 默认网络 在宿主机部署好Docker Engine后会默认创建三种网络:Bridge.Host和None,如下: docker network ls NETWORK ID NAME DRIVER SCOPE 93dab79cdb5a bridge bridge local c920c9c10e62 host host local d2a11ea1c70a none null local Bridge 默认的Bridge网络是我们比较熟悉的docker0,它在安装完E

PGM学习之二 PGM模型的分类与简介

废话:和上一次的文章确实隔了太久,希望趁暑期打酱油的时间,将之前学习的东西深入理解一下,同时尝试用Python写相关的机器学习代码. 一 PGM模型的分类 通过上一篇文章的介绍,相信大家对PGM的定义和大致应用场景有了粗略的了解.那么接下来我们来深入了解下PGM. 首先要介绍的是Probabilistic models(概率模型),常用来描述不同的随机变量之前的关系,主要针对变量或变量间的相互不确定性的概率关系建模.总的来说,概率模型分为两类: 一类是参数模型-可以用有限个参数进行准确定义 参数

Html5版本的全套股票行情图开源了,附带实现技术简介

Html5版本的全套股票行情图开源了,附带实现技术简介