当前位置:船长SEO优化公司 > SEO培训 > > 搜索竞价排名的自动出价算法

搜索竞价排名的自动出价算法

头像
创始人 船长SEO
2020-06-30 阅读 161 专题:
感谢王显生在繁忙的日程中完成了算法草案。
搜索引擎竞价排名广告,又称付费搜索,赞助搜索(SponsoredSearch),是与展示广告并列的巨大广告市场之一,从早期的GoogleAdwords,YahooSponsoredSearch,MicrosoftBingAds,到百度丰巢,阿里巴巴直通车等,所有有流量入口的搜索引擎都有自己的变现手段--竞价排名广告。与展示广告相比,SponsoredSearch直接从用户查询中产生定向流量。 因为用户查询代表了最强的用户意图,SponsoredSearch的变现能力更强,也是最早,最成熟的定向广告平台。 此外,搜索广告从一开始就具有原生广告的特点,因为它的商业结果与自然结果一样,都是由用户主动意图引发的,展示形式与自然结果没有太大区别。
在海绵宝宝搜索广告市场的设计中,有两个问题需要解决:
1.如何在广告场所分配合适的广告
二、广告的定价。
关于第一点,所有竞价搜索都使用类似的解决方案,无论是根据排名来确定广告位的显示方式,排名取决于两个因素:广告质量和广告商的出价。GoogleAdword之前曾披露,他们的排名是根据出价的产品和广告质量作为排名因素。微软的排名取决于广告点击率、相关性和广告商的出价,但它的计算方式并不公开。与展示广告ADX类似,SponsoredSearch大多使用广泛的第二次出价来竞标关键词,这些关键词由出价最高者和第二大广告商赢得。
SponsoredSearch的账户系统由三个层次组成:账户、促销计划活动和推广单位AdGroups。每个活动都有自己的预算和定位条件(地理、时间等),每个活动都由一个或多个AdGroup组成,AdGroup包含一组广告想法,以及一个引发这些广告的关键词列表。在GoogleAdword中,AdGroups也被称为LineItem。下图显示了通用的SponsoredSearch结构和广告创意。
本文首先讨论广告检索。通常,SponsoredSearch支持四种匹配类型:
1.完全匹配:在这种情况下,只有当用户输入的关键字与招标关键字完全相同时,才能显示广告。
二.短语匹配:这种匹配要求用户按与投标关键字相同的顺序输入关键字,但允许包含非投标关键字。例如,如果您查询"htc移动电话报价",可能命中的关键词是"htc","移动电话报价","htphone","htc价格"等等。
3.广义匹配:这种匹配要求用户查询所有包含广告商出价的关键词,也就是说,前者是后者的超集
4.负面匹配:这种匹配要求广告商对不能出现在用户查询中的关键字进行投标。
宽匹配是四种匹配类型中最常见的一种,因为它是最灵活的,使广告商能够吸引更多的流量。然而,精确匹配是不灵活的,如果广告商设置了大量的关键词,那么使用精确匹配可以吸引更精确的目标流量--由于语义差异问题,广泛的匹配有时会导致搜索和匹配广告之间的相关性很低,尽管它们重叠了一些关键词。
广告检索是一个与搜索引擎本身有关的问题:用户输入查询,查找相应的广告,然后排序。然而,与搜索引擎不同的是,广告检索需要支持广泛的匹配语义,如包含关键词A、B、C、D的用户查询,广告商在竞价过程中只针对一个关键词,则需要点击才能参与投标过程。相反,对于普通搜索引擎,用户查询包含关键字A、B、C、D,因此您需要返回包含这些关键字的文档(全部或部分)。从广泛的匹配检索过程中可以看出,广告检索类似于一种"触发器",每一种广告思想的关键词都是"触发"。
鉴于这种检索要求,最容易想到的是搜索和检索用户的查询,而返回的广告是对应于倒排索引链的所有关键字的联合集。使用通常的倒排表来构造索引会导致这样的检索性能太低。虽然在相交或快速压缩位图中引入了咆哮位图,但并行检索带来的另一个问题是排序压力太大,因为引入了大量相关性很低的广告,所以当广告数量大时,性能会严重下降,而垂直域的竞价搜索则会导致性能严重下降。这样的计划是一个快速而有效的选择,例如阿里直通车应该采用这种机制(根据公共幻灯片推断,须经内部学生确认)。
第二种方法是将相关性分析和检索结合起来。当用户进入查询时,首先确定用户的查询意图,然后将查询发送给分类器,然后将查询发送给分类器。
将查询重写,最终将广义匹配转化为精确匹配问题,因此最终的精确匹配过程只需一个哈希表,关键值为精确匹配查询,值为对应的AID列表。
此外,Microsoft Bing还提出了一种专门用于SponsoredSearch的索引结构,它也是类似于哈希表的一个变种。对于广泛的匹配语义,所有关键字的子集都被用作哈希表的键值,如图所示:
在搜索时,给定查询,生成所有关键字的组合,然后查找表,然后取出Ad列表。然而,随着查询长度的增加,空间将呈指数增长,从而导致由多个哈希表查询引起的性能开销,因此有必要减少查询的数量。如果两个广告a和B,如果a的投标关键字列表是B的子集,则B的值节点被移动到A的值节点A的值节点上。这个过程称为重映射。
在实际系统中,前两种方法因其简单和直接而得到更广泛的应用。
在大型的SponsoredSearch系统中,广告主经常面临的问题是,广告主竞价的关键词过于集中,用户的查询非常长尾,因此存在大量的广告主无法中标关键词,缺乏展示机会。因此,对于广义匹配来说,有时候触发的广告不仅需要用户查询点击一些关键词,而且往往会引入语义分析,让有相似度的查询会触发广告,这样可以给广告主带来更多的流量。 例如,搜索"HTC手机"可以触发"HTC智能手机报价"和"Android手机"。"简单的向量空间模型(如TF/IDF)是计算相似度的一种手段,但很可能造成较大的语义鸿沟,如查询"土豆网"。 一个简单的TF/IDF可能会触发诸如"土豆批发"之类的无关广告。 因此,寻找高度相关的触发关键词是大型SponsoredSearch系统中重要的挖掘任务之一。通常的方法是从搜索引擎的用户日志中进行挖掘,包括同一会话中的查询日志,查询后的点击日志等,具体包括二分网络图挖掘,关联规则,共现等方法生成语义相关的候选关键词对列表,然后发送给分类器,判断这些候选是否语义相关。
广告主给出了一个预算,那么它应该如何分配每个关键词上的竞价,才能使自己获得最大的收益,在数量较少的关键词上,广告主可以人工管理每个关键词的竞价,但是在拥有数量较多的关键词时,人工无法实现全局收益优化,所以引入自动竞价优化是必要的,既从系统上管理每个广告主的每个关键词在现实系统上,由于用户查询不断以数据流的形式到达,因此无法做出上述假设,即可转换性优化问题是一个在线背包问题:给定预算和T个关键字,假设每一项在T时刻都有一个得失,如果T时刻的损失远小于总预算,且得失之比可以确定上下界,那么就可以在线确定每一时刻的预算分配。SponsoredSearch另一个重要问题是竞价。如果系统知道所有广告主每时每刻的关键词竞价,那么在常规算法中,该问题就可以转化为背包问题。与展示广告不同,SponsoredSearch市场通常不是为实时竞价而设计的,因此在一定时间内,竞价策略相对稳定。
以上介绍了搜索引擎招投标广告所涉及的几个主要技术问题,我们可以看到,搜索引擎广告和展示广告所涉及的技术仍有很大的不同,因为搜索引擎只能占据流量入口的前提下才能存在,所以玩家只能局限于少数搜索引擎巨头,以上关键词的出价对于广告商来说是一个非常重要的环节,然后简要介绍了几种自动竞价算法。
投标问题通常被抽象为背包问题,需要解决的问题定义如下:
给定预算B,竞价N个关键字k1,k2,...kn,每个关键字出价b1,b2,…bn,每个关键字有M个广告位,已知每个广告位的cpc(costperclick)、ctr(clickthroughrate,点击率)以及关键字的展示量impression(根据之前的统计数据),求b1,b2,...bn,使w(k,b)之和小于B,且收益v(k,b)最大。 其中v(k,b)表示关键字k投标b的收益,它可以是广告净收入,也可以是简单数量的广告点击量(Clicks(k,b)*impr(k,b),w(k,b)表示相应的费用。 
平均价格算法:
让我们先考虑简化的情况,即只竞投一个关键词的情况。
 假设有M个广告位,点击率I,广告位是CTR(I),点击率CPC(I)预计将花费成本(I)*(I)。 以成本为横坐标,以ctr为纵坐标,得到二维坐标系中的一系列点(成本效益图),得到这些点的凸包。 单点击预算B画一条直线x=B,与凸包上边界相交的两个端点为所需出价,按线段比随机出价。 例如,下表所示的广告位
成本效益图表如下:
虚线框表示凸包,红线表示预算为0.70美元时的出价,与上界相交的边缘两端为标书。
如果出价是多个关键字,但出价是相同的,你也可以使用这个算法,此时这个数字是由每个关键字的广告位<;成本,点击>。
遗传算法:
如果多个关键字被出价,每个关键字都有多个广告位,那么它是一个典型的具有O(K^M)时间复杂度的多选择背包问题,其中K是关键字的个数,M是每个关键字的广告位数,算法复杂度是指数的。当K和M非常小时,可以通过简单的组合算法获得最优解;如果预算B很小,可以通过动态规则来求解。但是,如果K、M和B是大的,则需要使用近似算法。遗传算法就是其中之一。
遗传算法(GeneticAlgorithm)是一种模拟达尔文生物进化理论的自然选择和生物进化的遗传机制的计算模型。它是一种通过模拟自然进化过程来寻找最优解的方法。经过多次的进化迭代,适者生存逐渐接近最优解。它主要包括以下步骤:
INIT:随机生成几组投标,每组都称为个体,每组都是投标问题的一组解决方案,例如<;b1,b2,.bn>是一个个体。个人的优缺点由适应度(适应度)函数计算,该函数通常是上述收益v(k,b)的总和。这些个体构成了最初的第一代群体。
选择:从上一代中随机选择交配个体,选择算法通常使用WeightedRouletteWheelSelection(WeightedRWS)或StochasticUniversalSample(SUS)算法,这些算法为优秀个体提供了更多被选择的机会。
杂交:每两个人交配一次,并采取一些价值(出价比)来产生两个新的个体。这些新个体构成下一代种群,并继续进化。
为了确保特别好的个体解决方案不被稀释,精英主义:给予它直接添加到下一代种群而不交配的特权,这通常是最好的一对个体。
新一代突变个体:种群按一定概率变化(如1%),并随机改变一些出价,以防止局部优化。
当几代或两代迭代的收入不再改进时,算法就结束了,并且使用输出适应度最高的个体作为出价。
在线算法:
本文介绍了一种更适用于流输入请求实时投标的在线实时投标算法。这里只考虑一个广告空间。
假设当前需要投标的关键字广告点击的收入为V,而所使用的预算比率为z(T),则t-time出价是在任何时候进行的:
 "b(t)=V/(1f(z)),其中f(z)、(U*e/x)、(x/e)、x是一个非常小的正数,是一个自然对数,是搜索平台规定的最小出价。 
从公式中可以看出,该投标只与目前使用的预算比率和广告收入有关,不需要了解CTR和其他投标人的出价,计算成本小,适合实时投标。可以证明,该投标具有较高的近似最优比率。具体的证明过程可以参考相关文件。
 
© 著作权归作者所有
课程介绍:
传统的营销成本太高,用户不精准,转化难度大,大部分营销属于主动寻求用户,而SEO优化,解决了传统营销的弊端。用户通过搜索关键词,找到企业网站,从而形成成交,为企业带来丰厚的利润。作为个人也可以通过SEO优化代理产品进行销售盈利,通过对SEO课程的学习,我们可以在一到二个月教会大家怎么做SEO,拿到一份不错的薪水。
网友评论
 昵称:
 验证码: 点击我更换图片
最新评论