第四十期百度技术沙龙笔记整理

本期的技术沙龙主题内容是LBS技术,虽然LBS应用最近这两年在业内炒得风生水起,但是我感觉离广泛应用好像还是有一定距离。

本期的讲座主讲讲师是百度定位服务负责人张传明、陌陌的CTO李志威、北邮邓中亮教授,覆盖了技术实现原理、实际应用经验、学术发展前沿三个方面。

张传明工程师的讲座分析了目前手机定位技术现状和使用前景,以及百度定位服务API在解决目前定位技术的弱势方面所做的工作和一些业界目前解决这方面问题的先进做法:

目前的定位技术从数据源方面主要由两个方面:基于GPS定位导航卫星技术的定位和基于手机基站和Wifi的定位。标准GPS定位方式存在耗电大、地理形势峡谷效应、信号反射、室内无法定位等方面的缺憾,同时基于手机基站和Wifi也存在方方面面的缺憾,百度的LBS服务主要通过对多种传感期信号源的信息综合分析处理来得到相对比较精确的定位结果.张传明工程师所做的工作不但对信号源的信息使用了EZ算法、基于最大似然的位置估计、旋转定位等业界新的分析方法,而且对多种信号源信息采用了KNN等数据挖掘机器学习的方式,整体提高信号源信息的利用效率。

陌陌CTO主要讲了两个问题:一个是国内不同坐标系的位置偏移,其中尤以国测坐标系的随机偏移为甚,他们采用自己取样总结规律的方式对这个偏移进行纠正.第二个问题是快速空间检索技术,这方面,陌陌使用的MongoDB采用的是GeoHash,它是将将经度(longitude)和纬度(latitude)值转换为一个基于base32编码的串一元索引,经纬度两个维度数据存储的二元索引相对粗暴缓慢被pass,在这方面,PostgreSQL上的PosyGIS空间数据库支持R-tree-over-GiST树形索引数据结构的方式。相对来讲GeoHash的速度表现更好一点。

北邮的邓中亮教授是学界这方面的大牛,参与国家很多这方面的基础项目和建设项目,作为一个学术领头人物,他的棋下的很大,更想从国家层面为整个产业做一些事情,同时由于其官方身份,它能够更好地得到和融合各种位置信息资源,为军用、公共机构、明用商用提供各种层次的定位信息服务。

时间: 2024-10-13 14:41:50

第四十期百度技术沙龙笔记整理的相关文章

三十三期百度技术沙龙笔记整理

此次技术沙龙是由百度的高级架构师陈天健和豆瓣首席科学家王守崑为主讲,大主题是推荐系统. 陈天健的主要话题是百度推荐引擎计算平台架构中的流式计算架构.中间有一种因为几个短信有点错过,等视频出来再听一遍,这个笔记基本没啥整理,主要是个备档,感兴趣的同学可以直接去InfoQ看视频.下面把记的笔记抄上来: NLP---当前分析热点: 传统架构以Hadoop为主,流式计算加速数据处理: QueueWorker: 流式计算系统,拓扑S4.DAG: 多样索引 及时计算获得用户访问成倍增长. 整个工程引擎化--

百度技术沙龙第48期回顾:大规模机器学习(含资料下载)

原文:http://www.infoq.com/cn/news/2014/03/baidu-salon48-summary 2014年3月15日,在由@百度主办.@InfoQ负责策划组织和实施的第48期百度技术沙龙活动上,来自百度联盟大数据机器学习技术负责人夏粉,和搜狗精准广告研发部技术经理王晓博,各自分享了其在机器学习方面的实战经验.他们的话题涉及“广告数据上的大规模机器学习”和“大数据场景下主题检索应用”这两个方面,本文将对讲师各自的分享做简单的回顾,同时提供相关资料的下载. 主题一:广告数

百度技术沙龙 - 大数据场景下主题检索应用

第48期百度技术沙龙上的<大数据场景下主题检索应用>讲座介绍了很多训练大规模主题模型的技术细节.讲座回来后,我粗略整理了下讲座上涉及的主题模型和训练大规模模型相关的资料和文献. 1. 主题模型的发展历史 a. 布尔模型 Boolean model b. 向量空间模型 VSM (Vector space model) c. 潜在语义索引 LSI (Latent semantics index) - 首先作为一种降维技术, 对doc-word矩阵进行SVD分解 d. 概率潜在语义分析pLSA e.

百度技术沙龙&amp;InfoQ笔记

百度技术沙龙&InfoQ笔记 by 伍雪颖 百度技术沙龙&InfoQ 弹窗 1,弹窗影响是可控的,白文件的弹窗 防御,是为了拦截未知的病毒木马,状态,病毒库,未知行为,采用的api, 黑白的集合样本,加快状态,目标,归类 3个监控点:对api的拦截,数据挖掘来的api,监控点,危险行为,高危和低危,提取特征,软件推广,沙龙广告,改变签名 安装包,释放文件,云防御模式 对抗(安全), 第一部分是一个做技术哥们讲的 云端处理,速度比较快,云规则,云防御模式 绿盟,张彦 2000,系统集成,企业

百度技术沙龙 - 广告数据上的大规模机器学习

上个月,参加了百度技术沙龙, 夏粉的<广告数据上的大规模机器学习>讲座介绍了大规模机器学习中的若干重要问题.遗憾的是,百度的相关算法没有公开的论文. 1.  数据处理 目标: 获取信息, 去除噪音 机器学习技术点: 选择对点击概率分布 预估足够多样本 解决方法: a. 不可见和不完整样本过滤; b. 样本采样; c. 异常样本检测 算法:a. 百度 SA算法; b. Google (KDD 2013) 2. 特征处理 问题:大量的类型型特征和ont-hot特征导致海量特征 目标: 选择尽可能少

Android第十期 - 百度地图

已经把每个功能都独立出来了,idkey在百度云地图开发官网去自己申请就可以了 效果图如下: Android第十期 - 百度地图

百度技术沙龙-自然语言处理技术及应用笔记整理

第一场由百度这方面的大拿吴华分享: NLP技术支持大多数百度产品 搜索引擎从关键词到语义理解搜索 应用未来趋势:1.知识语义搜索;2.对话式搜索;3.主动推荐,不搜即得;4.精准个性化服务. NLP的挑战:需求识别.知识挖掘.用户引导.结果组织和展现. 理解文本的目标是理解用户.用户建模.用户行为预测 百度翻译免费API 实体名词挖掘:分类.需求.ontology建设 query理解. DNN用于软聚类 Parser技术用于复杂query理解. 基于shift-reduce的依存决策分析算法--

Android Studio第四十期 - 上传头像功能支持权限管理

代码已经整理好,加了权限管理和SP保存上传服务器的方法,希望能够帮到大家~效果如下图: 地址:https://github.com/geeklx/MyApplication/tree/master/p025_upload_img 附:这里借鉴了翔神(http://blog.csdn.net/lmj623565791/article/details/72859156)的写法,大家可以好好学习一下~哈哈~

时速云企业级容器PaaS技术沙龙 第九期【深圳站】

Docker容器技术的出现改变了企业应用从开发.构建到发布.运行的整个生命周期,而Kubernetes经历近4年的发展也已成为容器集群管理领域的事实标准,基于容器 + Kubernetes 的新型 PaaS 逐渐成为云计算的主流. 越来越多的企业开始使用基于 Kubernetes 技术构建企业级容器 PaaS 平台,从而加速业务应用的交付.提高运维效率.实现微服务架构升级.可以预见,未来几年企业级容器PaaS将会迎来爆发式增长. 时速云是国内首个基于Kubernetes 的企业级容器PaaS平台