计算百度关键词出现密度

        /// <summary>
        /// 获取百度关键词出现的密度
        /// </summary>
        /// <param name="keyWord">标题、关键词</param>
        /// <returns>如:10 (满为100)</returns>
        public static int GetBaiDuKeywordDensity(string keyWord)
        {
            //获取百度源码
            string HtmlCode = GetHttpData("http://www.baidu.com/s?wd=" + keyWord);
            //百度搜索出来的标题列表
            List<string> listTitle = new List<string>();
            //列表正则匹配规则
            string strrex = @"<h3[\s\S]*?>(?<url>.*?)</h3>";

            //进行正则匹配
            MatchCollection mc = Regex.Matches(HtmlCode, strrex);
            foreach (Match m in mc)
            {
                string content =HtmlDecodes(Environment.NewLine + m.Groups["url"].Value);
             content=   ReplaceHtml(content);
                listTitle.Add(RemoveHTML(content));
            }

            //只匹配第一条
            for (int i = 0; i < listTitle.Count; i++)
            {
                return Convert.ToInt32(Similarity(listTitle[0], keyWord) * 100);
            }

            //相似度列表
           // List<double> listSimilarity = new List<double>();
            //进行相似度计算
            //foreach (string strTitle in listTitle)
            //{
            //    listSimilarity.Add(Similarity(strTitle, keyWord));
            //}

            //进行密度计算
            //int dev = Convert.ToInt32(stdev(listSimilarity) * 100);
            //if (dev<=0 || dev > 100)
            //{
            //    dev = Convert.ToInt32(average(listSimilarity) * 100);
            //}
            //return dev ;
            return 0;
        }

  

时间: 2025-01-05 19:36:18

计算百度关键词出现密度的相关文章

一个完整推荐系统的设计实现-以百度关键词搜索推荐为例

在之前一篇博文中, 有同学在评论中问了个问题: 如何解决因式分解带来的推荐冷门关键词的问题. 在回答这个问题的时候, 想到了近几年在做搜索推荐系统的过程中, 学术界和工业界的一些区别. 正好最近正在做技术规划, 于是写偏文章说下工业界完整推荐系统的设计.结论是: 没有某种算法能够完全解决问题, 多重算法+交互设计, 才能解决特定场景的需求.下文也对之前的一些博文进行梳理,构成一个完整工业界推荐系统所具有的方方面面(主要以百度关键词搜索推荐系统为例) 完整的推荐系统肯定不会只用一种推荐算法 在学术

c#模仿百度关键词提示

1:from窗体环境:TextBox(关键词文本框).ListBox(提示框) 2:实现思路: 2.1:以输入的关键词为条件查询  数据库(在查询中以点击率排序就加一个order by 点击率 desc)返回多行单列数据结果集合.再一一赋值到listBox中显示. 2.2:在TextBox中如果侦听键盘 if(Down(小键盘向下)) 则先获取到ListBox选中的索引,如果返回-1 或者x+1的值大于ListBox.count()   则初始值=0; 否则为ListBox索引值为x+1 els

VC模拟发送数据包-百度关键词查找

VC模拟发送数据包-百度关键词查找 逗比汪星人2009-09-06上传 VC模拟发送数据包-百度关键词abcdef查找 详情 http://blog.csdn.net/wangningyu http://download.csdn.net/detail/wangningyu/1637723

从百度地图API中抠出来的一个js方法,计算百度地图坐标距离

从百度地图api(http://developer.baidu.com/map/jsdemo.htm#a6_1)中抠出来的一个js方法,计算百度地图坐标距离 可读行还没还原,能用就行~ function fD(a, b, c) { for (; a > c;) a -= c - b; for (; a < b;) a += c - b; return a; }; function jD(a, b, c) { b != null && (a = Math.max(a, b));

用python来个百度关键词刷排名脚本

目的:写个脚本来提升百度排名 我一个seo届前辈的朋友找我,他说,seo事无巨细,自己主观方面能做的几乎都能做了,提升百度等搜索引擎中的排名往往效果不佳或者起效周期慢.能不能人为去干预下呢? 获得排名一般有两种方式: 1.竞价,就是你给我钱,我就给你高排名,管你内容到底优质与否呢.这个,一般的医疗行业非常多,之前出事的莆田系医院就是这样的.这种一般是土豪才弄的,一般的私人医院,一年给百度的钱都是千万级的. 2.靠自身的硬实力.你的网站质量高,能给用户提供价值.就是说,搜索引擎会去综合判断你的页面

js 获取上一页所带的百度关键词

<div class="fswt"> <textarea type="text" id="fswt_nr" class="fl" placeholder="请输入您的问题" name="text"></textarea> <img id="dyfs" class="fl" src="./stati

百度关键词“随机性”排名分析

http://passport.baidu.com/?business&un=%E7%BB%B5%E7%AB%B9%E7%81%AB%E5%B0%8F%E5%A7%90%E8%BD%A6%E7%AB%99 http://passport.baidu.com/?business&un=%E8%BE%BE%E5%B7%9E%E7%81%AB%E5%B0%8F%E5%A7%90%E8%BD%A6%E7%AB%99 http://passport.baidu.com/?business&u

百度关键词排名迟迟没有任何起色该咋办

http://t.qq.com/nanjingxia6396 http://t.qq.com/p/t/462084121633873 http://t.qq.com/lishuixiaojiena http://t.qq.com/p/t/459572093385815 http://t.qq.com/wuxixiaojienayou http://t.qq.com/p/t/443989011498492 http://t.qq.com/jiangyinxi2014 http://t.qq.com

如何不给花一分钱,关键词怎么霸屏百度首页?

如何不给花一分钱,关键词怎么霸屏百度首页?先不废话,上几个图给大家看看! 这是如何做到的呢? 第一招:搜狐自媒体 不论百度指数是几十还几百上千的关键词,都可以做到首页,不光收录快,而且还可带链接,百度指数100左右的基本上可以做到百度首页. 1.首先要申请一个搜狐自媒体,用公司营业执照申请比较容易,如果个人申请,如果在其它自媒体上有自己的帐号,申请也相对比较容易,如果没有自媒体卡号,可以在猪八戒网上找人写原创文章,然后建立QQ空间.博客等其它自媒体,然后再提交申请. 2.尽量写原创和伪原创文章,