ThinkPHP3.2.3扩展之自动分词获取关键字

ThinkPHP自动获取关键词调用在线discuz词库

先按照下图路径放好插件

        /**
     * 自动获取关键词(调用第三方插件)
     * @return [type] [description]
     * www.shouce.ren
     */
    public function keyword()
    {
        Vendor(‘autokeyword.AutoKeyword‘);
        $keyword = new \AutoKeyword();
        $str=‘自动获取关键词并发大数据我们大家好吃饭啦调用第三方插件‘;
        $title = trim($str);
        $keys=$keyword::discuz($title);
        var_dump($keys);
    }

插件源码:

AutoKeyword.php

<?php

/**
 * 分词
 * @author zhao jinhan <[email protected]>
 *
 */
class AutoKeyword
{

    /**
     * 使用discuz词库
     * @param unknown_type $title
     * @param unknown_type $content
     */
    public static function discuz ($title = ‘‘, $content = ‘‘)
    {
        $subjectenc = rawurlencode(strip_tags($title));
        $messageenc = rawurlencode(strip_tags(preg_replace("/\[.+?\]/U", ‘‘, $content)));
        $data = @implode(‘‘, file("http://keyword.discuz.com/related_kw.html?title=$subjectenc&content=$messageenc&ics=utf-8&ocs=utf-8"));

        if ($data) {
            $parser = xml_parser_create();
            xml_parser_set_option($parser, XML_OPTION_CASE_FOLDING, 0);
            xml_parser_set_option($parser, XML_OPTION_SKIP_WHITE, 1);
            xml_parse_into_struct($parser, $data, $values, $index);
            xml_parser_free($parser);
            $kws = array ();
            foreach ($values as $valuearray) {
                if ($valuearray[‘tag‘] == ‘kw‘ || $valuearray[‘tag‘] == ‘ekw‘)
                    $kws[] = trim($valuearray[‘value‘]);
            }
//             $return = ‘‘;
//             $dot=‘‘;
//             if ($kws) {
//                 foreach ($kws as $kw) {
//                     $kw = CHtml::encode(strip_tags($kw));
//                     $return .= $dot.$kw ;
//                     $dot = ‘,‘;
//                 }
//                 $return = trim($return);
//             }

            return $kws;
        }

    }
/**
     * 简易自定义获取关键词
     * @param string $title
     * @param string $content
     * @return JSON
     */
    public static function simple($title = ‘‘, $content=‘‘){
        $words = include_once dirname(__FILE__).DIRECTORY_SEPARATOR.‘words.php‘;
        $data = array();
        $max = 10; //最多匹配10个
        if($words){
            foreach((array)$words as $word){
                if(count($data) > $max){
                    break;
                }else{
                    if($title && preg_match(‘/‘.$word.‘/is‘, $title)){
                        array_push($data, $word);
                    }
                    if($content && preg_match(‘/‘.$word.‘/is‘, $content)){
                        if(!in_array($word, $data)){
                            array_push($data, $word);
                        }
                    }
                }
            }
        }
        return array_unique($data);
    }

}

word.php

<?php
/**
 * 词库(权重越高越靠前)
 */
return array(
    ‘php‘,
    ‘mysql‘,
    ‘web‘,
    ‘html‘,
    ‘js‘,
    ‘jquery‘,
    ‘sql‘,
    ‘myisam‘,
    ‘innodb‘,
    ‘apache‘,
    ‘nginx‘,
    ‘yii‘,
    ‘linux‘,
    ‘cms‘,
    ‘yiifcms‘,
    ‘redis‘,
    ‘memcache‘,
    ‘explain‘,
    ‘ueditor‘,
    ‘kindeditor‘,
    ‘api‘,
    ‘w3c‘,
    ‘高性能‘,
    ‘大数据‘,
    ‘存储过程‘,
    ‘事物‘,
    ‘触发器‘,
    ‘索引‘,
    ‘并发‘,
    ‘编程‘,
    ‘算法‘,
    ‘排序‘,
    ‘安装包‘,
    ‘下载‘,
    ‘服务器‘,
    ‘手册‘,
    ‘指南‘,
    ‘文章‘,
    ‘图集‘,
);
时间: 2024-08-07 21:17:38

ThinkPHP3.2.3扩展之自动分词获取关键字的相关文章

ThinkPHP3.2.3扩展之生成PDF文件(MPDF)

目前是PHP生成PDF文件最好的插件了,今天介绍下在ThinkPHP3.2.3里如何使用. 先安照路径放好如图. 下面是使用方法 public function pdf(){ //引入类库 Vendor('mpdf.mpdf'); //设置中文编码 $mpdf=new \mPDF('zh-cn','A4', 0, '宋体', 0, 0); //html内容 $html='<h1><a name="top"></a>一个PDF文件</h1>

C#.NET为List添加扩展方法:获取唯一值

public static class ListTools { /// <summary> /// 获取唯一值列表 /// </summary> /// <param name="strList">原始值</param> /// <returns>唯一值</returns> public static List<T> GetUniqueValue<T>(this List<T>

C#枚举扩展方法,获取枚举值的描述值以及获取一个枚举类下面所有的元素

/// <summary> /// 枚举扩展方法 /// </summary> public static class EnumExtension { private static Dictionary<string, Dictionary<string, string>> _enumCache; /// <summary> /// 缓存 /// </summary> private static Dictionary<stri

C#.NET为List加入扩展方法:获取唯一值

public static class ListTools { /// <summary> /// 获取唯一值列表 /// </summary> /// <param name="strList">原始值</param> /// <returns>唯一值</returns> public static List<T> GetUniqueValue<T>(this List<T>

WebAPI的AuthorizeAttribute扩展类中获取POST提交的数据

在WEBAPI中,AuthorizeAttribute类重写时,如何获取post数据是个难题,网上找资料也不好使,只能自己研究,通过研究发现,WEBAPI给了我们获取POST数据的可能,下面介绍一下: //将POST数据以字符串的形式读取,例如post的json数据,就可以以这种方式读取 actionContext.Request.Content.ReadAsStringAsync(); //将POST数据以内容流的形式读取 actionContext.Request.Content.ReadA

SQLServer中使用扩展事件获取Session级别的等待信息以及SQLServer 2016中Session级别等待信息的增强

本文出处:http://www.cnblogs.com/wy123/p/6835939.html 什么是等待 简单说明一下什么是等待:当应用程序对SQL Server发起一个Session请求的时候,这个Session请求在数据库中执行的过程中会申请其所需要的资源,比如可能会申请内存资源,表上的锁资源,物理IO资源,网络资源等等,如果当前Session运行过程中需要申请的某些资源无法立即得到满足,就会产生等待.SQL Server会以不用的方式来展现这个等待信息,比活动Session的等待信息,

获取文章中的关键字

最近在做关于搜索方面的程序,查阅了许多资料,写下了下面的代码,已做后备 jar包下载地址:http://download.csdn.net/detail/zwdsmileface/8678353 import java.io.IOException; import java.io.StringReader; import java.util.ArrayList; import java.util.Collections; import java.util.Comparator; import j

C#-this关键字的功能之扩展方法

扩展方法 简介 我们的方法都是与声明他的类的相关联(我们现在写的各个方法都是在类中定义,所以我们调用方法都是用该方法所属类的实体对象调用). 在C#3.0中的扩展方法的特征,允许声明的方法与不是声明该方法的类相关联. 简单实例 下面我们定义了一个Person类,这个类有三个字段,和相应的三个属性 同时有一个方法 IntroductGender(). public class Person { public Person(string name, int age, string gender) {

C语言学习笔记(一) 关键字

今天开始,准备重新学习下C语言.虽然自己了解C语言语法,但总觉得理解得很不够.由于各种原因,以前对C语言的研究总是不能坚持,但这次希望自己能够做得更好.这里推荐下<C语言深度剖析>这本书,如果有其他好书,也请各位推荐,不胜感谢! 本文主要总结C语言的关键字,并对一些特殊的关键字进行介绍,对于static.extern等比较复杂的关键字后面单独总结. 究竟有多少个关键字? C语言的关键字不像其他语言,关键字不是很固定.(关于C89和C99,以后会写文章总结)C89定义的关键字有以下32个: 关键