随着人们物质生活水平的日益提高,生活方式和意识形态也趋向于多样化,个性化需求也日益明显,而且即使教育、收入等因素都相同的消费者,由于观念不同,对广告类型的需求也会呈现出离散的状态。所以,对于广告商来说,广告的投放要想得到预期的推广效果,其主要原因就是要在广告投放过程中满足受众群众的个性化需求。如果当用户在打开一个网站的页面时,铺天盖地的广告出现在视线内,用户不仅会对这些广告毫无兴趣,而且还会产生强烈的反感。这样的后果就是广告的点击率不仅没有得到提升,网站的点击率也会因此受影响,急剧下降。那么如果我们可以根据不同用户的特点而呈现不同的广告,就可以实现广告的针对性投放了。
目前,在网站广告投放分类这个问题上,国内外都有相应的网站做到了。
作为Google主要面向广告商的中小网站即AdSense,它利用网盟的方式帮助广告商进行广告投放。Google自动抓取网页的广告,分析网页的内容获得相关的网页关键词,然后投放于网页关键词相匹配的文字或者图片广告。AdSense是基于Google强大的内容网络下而产生的,可以投放内容广告、搜索广告和域名广告等,它可以自动投放根据网站和网站内容逐页进行精确定位的各类广告。AdSense的主要特点是可以投放多种多样的广告产品,而且竞价排名中对广告质量有严格定义,但是在网页内容繁杂时匹配度不高,只能保持大类一致性。
而在百度网站中,它是通过对用户PC浏览器的cookie文件对用户进行跟踪分析,对网络用户的上网行为进行深入的分析,按照网站的级别或者流量的排名投放。网站可以根据用户的浏览内容制定关键词,然后系统根据关键词查找相关网页进行投放,根据用户的浏览行为(比如点击过的网站或者检索过的关键字)锁定目标受众,当目标受众再次出现时向其展现推广信息等等多种广告投放方式。
广告投放分类技术已经引起了越来越广泛的研究,而作为分类算法中的特征提取算法也一直是广告投放分类的研究热点,同时它在机器学习领域的研究也备受关注。好的特征提取方法例如贝叶斯网络、关联规则等,可以明显提高广告投放与用户属性之间的关系,改善用户的搜索环境。在以往的研究中,人们提出了很多种特征提取方法和模型,但都有其优缺点,没有哪一种算法表现出明显的优势。目前,很多学者提出了自己的方法,但仍有很大的改进空间。因此,广告投放分类问题中的特征提取法的研究,有着其重要的意义。
使用计算机提取图像信息,找出图像中的每一个特征信息就是特征提取。特征提取只是图像处理过程中的初级算法,就是利用计算机算法提取出图像的特征。
有时,假如特征提取需要许多的计算时间,而可以使用的时间有限制,一个高层次算法可以用来控制特征提取阶层,这样仅图像的部分被用来寻找特征。
由于许多计算机图像算法使用特征提取作为其初级计算步骤,因此有大量特征提取算法被发展,其提取的特征各种各样,它们的计算复杂性和可重复性也非常不同。特征可用于建模,模型以机器挖掘算法能够理解的近似的方式来表示现实。特征选择优点在于降低真实世界的复杂度,模型比现实更容易操纵。简化要以数据挖掘应用的目标为核心。我们应该始终关注怎么用模型来表示现实,要多考虑数据挖掘的目标。
有时仅仅选择已有的特征是不够用于研究各种问题的。特征之间相关性很强或者特征冗余这些问题会增加算法处理难度,出于这些原因,创建特征则变得很有必要。 Python广告投放分类问题中的特征提取方法(2):http://www.youerw.com/jisuanji/lunwen_191827.html