组合部分标签向量并累加成完整向量

<strong><span style="font-size:18px;">/***
 * @author YangXin
 * @info K-Means算法会对向量元素进行多次顺序的遍历,上次表示最适合于这种访问模式。
 * 利用Mapper输出的部分向量,Reducer通过简单的拼接得到一个完整的向量。
 */
package unitTwelve;

import java.io.IOException;

import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.mahout.math.NamedVector;
import org.apache.mahout.math.Vector;
import org.apache.mahout.math.VectorWritable;

public class VectorReducer extends Reducer<Text, VectorWritable, Text, VectorWritable>{
	private VectorWritable writer = new VectorWritable();
	protected void reduce(Text tag, Iterable<VectorWritable> values, Context context) throws IOException, InterruptedException{
		Vector vector = null;
		for(VectorWritable partialVector : values){
			if(vector == null){
				vector = partialVector.get().like();
			}
			partialVector.get().addTo(vector);
		}
		NamedVector namedVector = new NamedVector(vector, tag.toString());
		writer.set(namedVector);
		context.write(tag, writer);
	}

}
</span></strong>

时间: 2024-10-09 14:34:32

组合部分标签向量并累加成完整向量的相关文章

Jsp开发自定义标签,自定义标签将字符串转成指定的时间格式显示

本例以将 字符串格式的时间转成指定的时间格式显示. 第一步.定义一个标签处理程序类,需要集成javax.servlet.jsp.tagext.TagSupport,代码如下: import java.io.IOException; import java.text.SimpleDateFormat; import java.util.Calendar; import javax.servlet.jsp.JspException; import javax.servlet.jsp.tagext.T

九. 常用类库、向量与哈希5.向量及其应用

Vector(向量)是 java.util 包中的一个类,该类实现了类似动态数组的功能. 向量和数组相似,都可以保存一组数据(数据列表).但是数组的大小是固定的,一旦指定,就不能改变,而向量却提供了一种类似于"动态数组"的功能,向量与数组的重要区别之一就是向量的容量是可变的. 可以在向量的任意位置插入不同类型的对象,无需考虑对象的类型,也无需考虑向量的容量. 向量和数组分别适用于不同的场合,一般来说,下列场合更适合于使用向量: 如果需要频繁进行对象的插入和删除工作,或者因为需要处理的对

机器学习中的矩阵向量求导(三) 矩阵向量求导之微分法

在机器学习中的矩阵向量求导(二) 矩阵向量求导之定义法中,我们讨论了定义法求解矩阵向量求导的方法,但是这个方法对于比较复杂的求导式子,中间运算会很复杂,同时排列求导出的结果也很麻烦.因此我们需要其他的一些求导方法.本文我们讨论使用微分法来求解标量对向量的求导,以及标量对矩阵的求导. 本文的标量对向量的求导,以及标量对矩阵的求导使用分母布局.如果遇到其他资料求导结果不同,请先确认布局是否一样. 1. 矩阵微分 在高数里面我们学习过标量的导数和微分,他们之间有这样的关系:$df =f'(x)dx$.

词向量与ELMo模型 词向量漫谈

目录: 基础部分回顾(词向量.语言模型) NLP的核心:学习不同语境下的语义表示 基于LSTM的词向量学习 深度学习中的层次表示以及Deep BI-LSTM ELMo模型 总结 1. 基础部分回顾(词向量.语言模型) 1.1 独热编码-词的表示 1.2 词向量-词的表示 我们为什么需要词向量?(One-hot向量的缺点?) 基于One-hot能否表示单词之间语义相似度? 1.2.1 基于One-hot能否表示单词之间语义相似度? 答:不可以.因为,我们不管是通过欧式距离还是通过余弦相似度,计算用

自定义tag标签-实现long类型转换成Date类型

数据库里存储的是bigint型的时间,entity实体中存放的是long类型的标签,现在想输出到jsp页面,由于使用的是jstl标签,而要显示的是可读的时间类型,找来找去有个 fmt:formatDate可以转化,但是只能将String类型的转成date型,long型则不可以,思考了好久,又不想破环jsp页面这种标签结构,参考网上jstl标签编写方法,如下:第一步 写一个类继承TagSupport,实现doStartTag() 方法. package com.pp.yxx.util.tags;

算法初级面试题08——递归和动态规划的精髓、阶乘、汉诺塔、子序列和全排列、母牛问题、逆序栈、最小的路径和、数组累加成指定整数、背包问题

第八课主要介绍递归和动态规划 介绍递归和动态规划 暴力递归: 1,把问题转化为规模缩小了的同类问题的子问题 2,有明确的不需要继续进行递归的条件(base case) 3,有当得到了子问题的结果之后的决策过程 4,不记录每一个子问题的解 动态规划 1,从暴力递归中来 2,将每一个子问题的解记录下来,避免重复计算 3,把暴力递归的过程,抽象成了状态表达 4,并且存在化简状态表达,使其更加简洁的可能 图灵引入的是:我不知道怎么算,但是我知道怎么试.知道怎么暴力破解出来. 要学会,练习懂得怎么尝试.

简单的介绍a标签点击个成

<head> <style type="text/css"> a{ font-family:"宋体"; font-size:12px; color:pink; }设置a标签字体大小颜色形体 a:link{ font-family:"宋体"; font-size:52px; color:black; }设置了link属性,在打开文件(设置a标签字体大小颜色形体[无效果]) a:visited{ font-family:&qu

sklearn.preprocessing.LabelEncoder_标准化标签,将标签值统一转换成range(标签值个数-1)范围内

. LabelEncode(),标签值编码用在将一些类别型的列进行编码,方便用于训练 原文地址:https://www.cnblogs.com/shadow1/p/10915197.html

js动态新增组合Input标签

var x = 1; function addlink() { var linkdiv = document.getElementById("add1_0"); if (linkdiv.attributes.currentindex.value) { var tmp = linkdiv.attributes.currentindex.value; x = parseInt(tmp) + 1; } linkdiv.setAttribute('currentindex', x); var