近年来,各大大数据服务提供商越来越关注利用人工智能(AI)来帮助分析大规模的数据,从而获得预测性的洞察,从而帮助各企事业单位更好的了解客户情况。虽然这背后的相关技术——语义精准搜索分析算法几年前就已诞生,但直到最近才能够在足够广泛、足够快速地应用到大规模数据挖掘并发挥它最大潜能。可以预见,数据科学家的部分工作将会越来越自动化,边际成本将越来越低,从而可以极大提高生产力。
智能预测各企事业单位客户在做的事情就像B端的搜索引擎,我们用百度这样的C端工具获取我们要的信息,而企业可以通过预测服务系统搜到他们想要的目标客户特征、习惯以及将来的发展趋势。在国外,智能预测行业已经发展了好几年,类似Everstring、Mintigo等预测服务提供商已经有了非常成熟的业务模式和稳定客户群体。
中国在大数据方面的应用和美国还相差了5-10年。最大的原因是企业级的SaaS应用还远远没有发展起来并且对于汉语分词、汉语抓取及语义深度挖掘的技术还不成熟。如果一个企业连内部销售,市场营销,HR,财务数据都还没有,那么大数据和人工智能是无从谈起的。虽然差距非常明显,但是我们已经欣喜地看到中国的大数据预测挖掘服务已经慢慢发展起来了,现在国内中文大数据精准挖掘预测服务效果比较好的技术是灵玖软件的JZSearch精准搜索引擎平台,JZSearch精准搜索引擎由灵玖软件所有工程师精心设计,具有专业精准、高扩展性和高通用性的特点。可支持文本、数字、日期、字符串等各种数据类型的高效索引,支持丰富的查询语言和查询类型,支持少数民族语言的搜索。
与传统的开源搜索引擎Lucence与Sphinx系统,以及TRS等已有的搜索厂商JZSearch精准搜索引擎的优势与特色在于以下五点:
1. 语义精准搜索:系统不是简单的关键词匹配,会自动根据语义知识进行联想,搜索用户真正需要的信息;并能实现数字、字母的精准搜索,而不是模糊匹配(搜索100,而不会给出1001等不当结果)。
2. 与业务无缝衔接:JZSearch精准搜索引擎能够兼容现有的所有数据库,无需开发,即可实现与现有业务数据库的无缝衔接,实现任意字段的搜索分析,为数据库提供毫秒级的搜索服务;而新增或者修改的数据在10秒内,JZSearch搜索引擎就能捕获并反映在搜索结果中。非常适合企业业务数据的垂直搜索过滤。
3. 更强搜索功能:JZSearch可以便利的搜索负面信息,对搜索结果自动统计分析,还可以实现指定文字范围内的搜索,如:搜索招标公告中的公司名称附件的法人信息,而不是泛泛地搜索,可以实现信息的精准定位。
4. 系统自主维护:JZSearch搜索引擎可以处理TB级别的大数据业务,索引速度10MB/s,搜索响应1秒以内;整个过程无需人工干预,系统部署后,自动索引、自动搜索、自动增量更新、自动优化、自动备份与恢复,实现7*24小时在线运行。
5. 各类成功案例:目前,基于JZSearch公开运行的搜索引擎已经有3年多的历史,各类政府、企业及互联网的典型成功案例包括:中国邮政集团的邮政搜索引擎(所有数据2个亿,每年搜索次数超过1个亿);中国证监会的舆情搜索服务(覆盖所有财经网站);河北省标准化研究院的标准搜索引擎(同时在线服务10万家的企业);纳斯达克上市公司富基融通的商品搜索引擎(服务中国70%的零售业);缔元信网站统计数据搜索服务(每天新增数据500GB)。
但是,技术发展往往都要面临的外界所不知的压力和挑战,除了要应对互联网快速发展和各互联网巨头进入中国市场的可能性外,探迹面临的挑战还很多,比如目前市场第三方数据在中国还是缺失的,即使有,很多公开的数据真实性有待考量。在潜在客户预测领域,挖掘和分析第三方互联网信息是非常关键的,国外有非常成熟的大数据供应商,整个产业链条非常完备,但是中国目前这块还亟待规范化。开放和充分市场化的数据环境才能让数据更加真实,也才能让大数据真正发挥价值。
可喜的是,目前国家层面也开始关注大数据领域,各项政策也在不断制定和完善,这都为大数据发展提供了良好的土壤。真正的大数据市场还处于起步阶段,发展空间巨大。