相关度等概念计算总结

假设X和Y均为含有n项的向量,

X = Vector(n)
Y = Vector(n)

则相关度计算如下

Rou(x, y) = Cov(X, Y)/sqrt(D(X)*D(Y))                                                            (1)
      = (E(XY)-E(X)E(Y))/sqrt((E(X^2)-(E(X)^2))*(E(Y^2)-(E(X)^2)))                                           (2)
      = (Sigma(XY)/n - Sigma(X)*Sigma(Y)/n^2)/sqrt((Sigma(X^2)/n - (Sigma(X)/n)^2)*(Sigma(Y^2)/n - (Sigma(Y)/n)^2))    // *n
      = (Sigma(XY) - Sigma(X)*Sigma(Y)/n)
        /
        sqrt((Sigma(X^2) - Sigma(X)^2/n) * (Sigma(Y^2) - (Sigma(Y)^2/n)))

(1)和(2)的推断可以参考概率论和数理统计相关的书。

时间: 2024-08-29 23:30:52

相关度等概念计算总结的相关文章

[Elasticsearch] 全文搜索 (一) - 基础概念和match查询

全文搜索(Full Text Search) 现在我们已经讨论了搜索结构化数据的一些简单用例,是时候开始探索全文搜索了 - 如何在全文字段中搜索来找到最相关的文档. 对于全文搜索而言,最重要的两个方面是: 相关度(Relevance) 查询的结果按照它们对查询本身的相关度进行排序的能力,相关度可以通过TF/IDF,参见什么是相关度,地理位置的邻近程度(Proximity to a Geo-location),模糊相似性(Fuzzy Similarity)或者其它算法进行计算. 解析(Analys

Swift计算属性

一.计算属性的概念 计算属性本身不存储数据,而是从其它存储属性中计算得到数据,与存储属性不同,类.结构体.和枚举都可以定义计算属性 计算属性提供了一个getter来获取值,以及一个可选的setter来间接设置其它属性或变量的值,计算属性的语法如下: 面向对象类型 类型名{ 存储属性... var 计算属性名:属性数据类型{ get { return 计算后属性值 } set 新属性值{ } } 示例: class Employee {             var no:Int = 0    

算法 (一) 概念

前言 Algorithms +  Data Structures = Programs //N.Wirth 1976 虽然大一大二学了数据结构和很多算法,但是一到用的时候就经常想不起来...,而且明年就要考研了,为了能让自己更系统的掌握,决定要全面的学习一下,为以后打好基础!!! 一.概念 计算 = 信息处理 借助某种工具,遵照一定规则,以明确而机械的形式进行 计算模型 = 计算机 = 信息处理工具 算法:即特定计算模型下,旨在解决特定问题的指令序列 二.特征 输入:待处理的信息(问题) 输出:

Elasticsearch基础教程

http://blog.csdn.net/cnweike/article/details/33736429 基础概念 Elasticsearch有几个核心概念.从一開始理解这些概念会对整个学习过程有莫大的帮助. 接近实时(NRT) Elasticsearch是一个接近实时的搜索平台.这意味着,从索引一个文档直到这个文档可以被搜索到有一个轻微的延迟(一般是1秒). 集群(cluster) 一个集群就是由一个或多个节点组织在一起.它们共同持有你整个的数据.并一起提供索引和搜索功能.一个集群由一个唯一

最完整的Elasticsearch 基础教程

基础概念 Elasticsearch有几个核心概念.从一开始理解这些概念会对整个学习过程有莫大的帮助. 接近实时(NRT)        Elasticsearch是一个接近实时的搜索平台.这意味着,从索引一个文档直到这个文档能够被搜索到有一个轻微的延迟(通常是1秒).           集群(cluster)        一个集群就是由一个或多个节点组织在一起,它们共同持有你整个的数据,并一起提供索引和搜索功能.一个集群由一个唯一的名字标识,这个名字默认就是 "elasticsearch&

(转载)Elasticsearch基础教程

转自 http://blog.csdn.net/cnweike/article/details/33736429 基础概念 Elasticsearch有几个核心概念.从一开始理解这些概念会对整个学习过程有莫大的帮助. 接近实时(NRT)        Elasticsearch是一个接近实时的搜索平台.这意味着,从索引一个文档直到这个文档能够被搜索到有一个轻微的延迟(通常是1秒).           集群(cluster)        一个集群就是由一个或多个节点组织在一起,它们共同持有你整

Elasticsearch入门基础(1)

基础概念 Elasticsearch有几个核心概念.从一开始理解这些概念会对整个学习过程有莫大的帮助. 接近实时(NRT) Elasticsearch是一个接近实时的搜索平台.这意味着,从索引一个文档直到这个文档能够被搜索到有一个轻微的延迟(通常是1秒). 集群(cluster) 一个集群就是由一个或多个节点组织在一起,它们共同持有你整个的数据,并一起提供索引和搜索功能.一个集群由一个唯一的名字标识,这个名字默认就是 "elasticsearch".这个名字是重要的,因为一个节点只能通

重温Elasticsearch

什么是 Elasticsearch ? Elasticsearch (ES) 是一个基于 Lucene 构建的开源.分布式.RESTful 接口全文搜索引擎.还是一个分布式文档数据库,其中每个字段均是被索引的数据且可被搜索,它能够扩展至数以百计的服务器存储以及处理PB级的数据.它可以在很短的时间内在储.搜索和分析大量的数据.它通常作为具有复杂搜索场景情况下的核心发动机. 官网:https://www.elastic.co/downloads/elasticsearch中文社区:https://e

Python学习之旅—面向对象进阶知识:类的命名空间,类的组合与继承

前言 上篇博客笔者带领大家初步梳理了Python面向对象的基础知识,本篇博客将专注于解决三个知识点:类的命名空间,类的组合以及面向对象的三大特性之一继承,一起跟随笔者老看看今天的内容吧. 1.类的命名空间 在上一篇博客中,我们提到过对象可以动态添加属性,一起来回忆下昨天的知识点,看如下的代码: class A: pass a = A() a.name = 'alex' print(a.name) 这里我们手动为a对象添加了一个属性name,然后直接打印可以得到a对象的名称.通过这个例子,我们可以