搜索广告与广告网络Demand技术-搜索广告

搜索广告

搜索广告就是一个典型的Ad Network,但是搜索广告非常重要,它的收入非常高,所以它有其独特之处,复杂度也比展示广告要高。它与展示广告在点击率预测,检索部分差不多,它的特点:1. 用户定向标签f(u):远远弱于上下文影响,一般可以忽略,但是因为搜索广告中query的信息已经很强了,用query已经足够了。2. Sesion内的短时用户搜索行为作用很重要,3. 上下文定向标签f(c):关键词。

搜索广告是一种很典型的位置竞价模式,而展示广告一般只有一个位置,但偶尔也有多位置拍卖的时候,比如淘宝多标签的创意。我们一般将广告位分为北,南,东三个广告区块,根据各位置的reference ctr决定各位置在竞价系统中的位次,reference ctr可以通过小流量较准确地测出。

查询词扩展(Query Expansion)

虽然查询词已经非常精准了,但它还是需要扩展。从缺点来讲,是搜索广告的运营商希望通过查询词扩展以攫取更多的利润,举例说明,如果查询词是家具,如果不做任何扩展,那么投“家具”关键词广告的转化率是最高的,如果把“家具”扩展为“家具店”,甚至“搬家”,那么所投放的广告的转化率是要比“家具”关键词广告是要低的,换言之,做查询扩展后的广告点击的价值是要低于不做查询扩展的点击价值,但如果扩展的关键词相关的广告如果出价更高或一样高,那么对搜索广告运营商做扩展是会收入更多的。另一点从宏观上讲,通过做查询扩展,使得每一个广告主的竞价范围变大了,再以上例说明,不做扩展,那么广告主只对“家具”进行竞价,做了扩展后,它对三个词进行竞价,那么广告主相互竞争冲突的可能性就大大增加了,使得市场更容易达到充分竞争的局面,这也有利于整个市场的盘子做大,营收增加。

查询扩展有很多的方法,也很难有完整的体系将其描述。我这里列出常见三个思路。以前在Yahoo!进行查询词扩展的项目有几十个之多。1,基于推荐的方法,它是挖掘(session,query)矩阵找到相关query,session就是用户在一次查询序列中输入的查询词,可以用推荐技术中挖掘(user, item)的算法进行挖掘,这种方法利用的是搜索数据。2,基于语义的方法,用topic model或概念化的方法中找语义相关query,对相同主题的词用topic model进行聚类,并认为它们的相似的查询意图,经过一些选择,可以将它们列到查询扩展集合中。Topic model是分析潜在语义的模型,也可以一些明确语义分析方法,它是将一些词或词组抽象成数目相对少的概念,每个概念中的词可以认为它们有相似的意图。语义分析的方法利用的是其它文档的数据。3,基于收益的方法,这种方法在实际中效果是很好的,它不进行语义的分析,也不进行推荐分析,仅看一个查询词在历史上哪些查询词对它的eCPM变现高,但它的分析出来的数据量是很少的,一些新词和长尾的词它就无能为力了,但它是不会漏掉一些真正有经济价值的词,历史上发现“家具”和“搬家”这两个词强相关,且“搬家”eCPM很高,那么在搜索“家具”的时候,出“搬家”的广告是可以增加收益的。它是利用广告数据进行分析。

用户相关的搜索广告决策

用户相关的搜索广告决策是分析哪些因素是可能和用户有关系的。

1,  结果个性化对于搜索广告作用有限,前面提到过f(u)直接做audience 兴趣的targeting的意义并不大,因为上下文信息(c)太强,个人兴趣可以忽略。另一个有争议的话题是搜索是否需要做个性化,大的搜索公司都做过个性化,有很多用户是不满意的,因为用户可能发现他的搜索结果和周围的人的搜索结果不一样,就会质疑搜索引擎的权威性,并且也无法告诉别人,可以通过搜索某词得到什么结果。所以搜索引擎是不适合做特别深入的个性化。搜索广告可以个性化一些,但仍然需要保证主题上的某种一致性。

2,  广告展示的条数可以深度个性化,即参与position auction的位置的个数。它有着非常大的调整空间。因为用户常常无法区分广告和正常的搜索结果的,就是在美国这种教育程度较高的国家,也有一半的用户无法区别搜索结果和广告,他们的行为就是对搜索结果从上向下点击,对于这些用户,放多少广告都无所谓,只要不要让结果太差,但对于阅读本文的读者而言,基本上是一个广告都不应该出的,出了广告我们也不会去点。但对于无法区别广告的用户,如果出的广告太多,就会遇到1里所提到的一致性问题,也会给用户不好的体验。这里的一个可以做的点就是在平均广告数不变的条件下,对每个用户的广告数进行变化,以使得全局营收最大化。这又是一个约束优化问题,与我们前面的Allocation类似,它们的解法都很相似。顺便提一下,广告的结果和搜索的结果,在google中,广告的结果有淡黄色的背景,这是因为在美国是有这个判例的,有人投诉分不清搜索结果和广告结果,法官判决必须使广告结果和搜索结果是可区分的,中国法律并没有这个限制。

3,  可以根据同一session内的行为调整广告结果,比如:用户在第一页没有点击任何广告,用户点击第二页时,可以不再展示第一页展示过的广告。

短时用户行为反馈

短时内用户的几次连续搜索称之为一个session,session的行为可以更明确地标定他搜索的目标。在搜索广告中,它是一个非常有用的信息,对展示广告来讲也是一样的,但对于展示广告,比较困难,因为展示广告主要用f(u),而不是f(c),所以要得到它短时的行为,需要修改u上的标签,这比较困难。而对于搜索来讲,只需要收集前几个session。

短时用户行为在狭义上讲,是指用户在一个session内的行为,在广义上讲,它是指用户在短时间(一般为一到两天)内的行为。

在广告系统中,短时用户行为有两个作用,1. 短时的受众定向:根据短时行为为用户打上标签。因为短时的计算不太可能用Hadoop这样的平台进行计算,因为Hadoop平台有很长的延时,并且处理时间也不能确定。所以这个打标签的过程是与其它标签的过程是独立的。2. 短时点击反馈:根据短时广告交互计算的动态特征。

短时用户行为计算需要准实时(分钟级)对用户行为进行加工,不适合在Hadoop上进行,而这还有可能不够,因为对于session里的query,可能要做到几秒的级别,所以它不适合在Hadoop上进行,它可以利用流式计算(stream computing)平台,比如S4,Storm等进行计算。当时S4的开发的目标很明确,就是进行短时用户行为反馈的计算。

时间: 2024-08-24 11:01:02

搜索广告与广告网络Demand技术-搜索广告的相关文章

搜索广告与广告网络Demand技术-探索与利用

探索与利用(Explore and exploit) 点击率预测中还有一个重要的问题,就是探索与利用,它在工程中解决的并不好,我这章把现在论文中的常见的几种方法介绍一下.探索与利用它是所有互联网应用都要面对的一个问题,形式化一些,可以解释为:整体的效果是无法通过采样得到的,因为观察到的数据只是投放过的广告,而很多还没有投放的广告,想得到它们的效果,就很困难. 计算广告领域的探索与利用要解决的问题是:因为长尾(a,u,c)组合极大部分在系统中并没有出现过,所以没有这些长尾(a,u,c)的统计量,所

互联网DSP广告系统架构及关键技术解析

互联网DSP广告系统架构及关键技术解析 宿逆 关注 1.9 2017.10.09 17:05* 字数 8206 阅读 10271评论 2喜欢 60 广告和网络游戏是互联网企业主要的盈利模式 广告是广告主通过媒体以尽可能低成本的方式与用户达成接触的商业行为.也就是说按照某种市场意图接触相应人群,影响其中潜在用户,使其选择广告主产品的几率增加,或对广告主品牌产生认同,通过长期的影响逐步形成用户对品牌的转化. 一个好的DSP系统需要满足: 拥有强大的RTB(Real-Time Bidding)的基础设

网络空间大搜索技术

由于泛在网络空间.网络应用模式和大数据的发展,国内研究人员对网络空间搜索技术有了新的认识,逐渐形成了网络空间智慧搜索暨网络空间大搜索技术. 国家自然科学基金委员会第120期双清论坛于9月28日-29日在北京召开.本次论坛主题为网络空间智慧搜索基础研究,共邀请了国内外25所大学和科研机构的41位著名专家参会.本次论坛由信息科学部.管理科学部.地球科学部.数理科学部和政策局联合主办,论坛主席由方滨兴院士.吴曼青院士.贾焰教授和陈熙霖研究员共同担任. 论坛开幕式由信息二处刘克处长主持,信息科学部常务副

【点击模型学习笔记】广告点击率估算技术综述_华东师范大学学报2013

概要: 不是一篇高质量文章,不过是一篇还算不错的综述,而且时间够新(2013). 具体内容:按照文章原本内容顺序罗列 0. 介绍 * 赞助商广告:投放到搜索结果页面 * 情境广告:在网页某个位置上投放,一般由广告联盟介入 1. 广告点击率预测的应用背景 * 广告点击率一般比较低,能达到0.2%就已经是很好的投放了 * 大量的广告.查询都是很稀疏的 * 利用用户点击行为的,除了点击率预测,还有两个领域:搜索结果排序和推荐系统 * "Inferring Clickthrough Rates on A

爱奇艺广告技术沙龙---广告召回

爱奇艺技术沙龙——广告算法与架构设计-爱奇艺直播-爱奇艺 一.AI在视频广告中的应用: 1.广告的目的: 在一定周期,让尽可能多的人产生消费. 长周期:品牌广告(比如阿迪.nike等品牌),短周期:效果广告(比如平时打开网页出现在眼帘的广告). 消费行为:购买.激活.安装.下载.点击. 2.如何传达消费价值: 匹配需求:用户行为(搜索.浏览.点击等).统计特征(性别.年龄.地区等) 能够将用户想要看的广告适时地推到面前,让广告主的广告得到合理的投放. 展示价值:场景(点位)+效果(索引) 场景化

百度技术沙龙 - 广告数据上的大规模机器学习

上个月,参加了百度技术沙龙, 夏粉的<广告数据上的大规模机器学习>讲座介绍了大规模机器学习中的若干重要问题.遗憾的是,百度的相关算法没有公开的论文. 1.  数据处理 目标: 获取信息, 去除噪音 机器学习技术点: 选择对点击概率分布 预估足够多样本 解决方法: a. 不可见和不完整样本过滤; b. 样本采样; c. 异常样本检测 算法:a. 百度 SA算法; b. Google (KDD 2013) 2. 特征处理 问题:大量的类型型特征和ont-hot特征导致海量特征 目标: 选择尽可能少

网络挖掘技术——微博文本特征提取

文本特征向量 经典的向量空间模型(VSM: Vector Space Model)由Salton等人于60年代提出,并成功地应用于著名的SMART文本检索系统.VSM概念简单,把对文本内容的处理简化为向量空间中的向量运算,并且它以空间上的相似度表达语义的相似度,直观易懂.当文档被表示为文档空间的向量,就可以通过计算向量之间的相似性来度量文档间的相似性.文本处理中最常用的相似性度量方式是余弦距离.文本挖掘系统采用向量空间模型,用特征词条(T1 ,T2 ,-Tn) 及其权值Wi 代表目标信息,在进行

网络挖掘技术——text mining

一.中文分词:分词就是利用计算机识别出文本中词汇的过程. 1.典型应用:汉字处理:拼音输入法.手写识别.简繁转换 :信息检索:Google .Baidu :内容分析:机器翻译.广告推荐.内容监控 :语音处理:语音识别.语音合成 . 2.分词难点:歧义.新词等. 3.分词技术:机械分词(查词典FMM/BMM,全切分).统计分词(生成式/判别式).理解分词. a)生成式分词:建立学习样本的生成模型,再利用模型对预测结果进行间接推理.两个假设:马尔科夫性(第i个词只依赖于前面的i-1个词):输出独立性

20145311王亦徐 《网络对抗技术》 信息收集与漏洞扫描

20145311王亦徐 <网络对抗技术> 信息收集与漏洞扫描 实验内容 利用whois.nslookup.dig进行域名注册信息.ip信息查询 使用tracert进行路由信息查询 使用在线网站查询ip地理位置 使用nmap查询存活主机.目标主机开放的端口等 利用openvas扫描目标主机的漏洞 基础问题回答 1.哪些组织负责DNS,IP的管理 ICANN负责协调管理DNS各技术要素以确保普遍可解析性,使所有的互联网用户都能够找到有效的地址 地址支持组织(ASO)负责IP地址系统的管理 域名支持