趣味分析系列 | 文胸品牌知多少(一)

一年一度的圣诞节马上就快到了,各位男神是不是又在劳神费力地给女神们准备圣诞节礼物?今年送啥呢?

送脑白金怎么样?NO,NO,NO!脑白金是送给大妈的!!!

直接给MONEY? NO,NO,NO!太俗气!!!

送鲜花与巧克力?NO,NO,NO!不实在!!!

按我说,直接送个文胸套装,有情调又贴心!!!说不定你的女神会给你个惊喜呢!

但是问题又来了,挑选哪个品牌的文胸好呢,总不能送一个层次太LOW的吧。因此,你需要对文胸的品牌有个大概的了解。简单讲,首先你得了解女生文胸品牌有多少?品牌的排名度是怎样的?为了减少各位男神上网的搜索时间,看我下面仔细分析给你看!

一、数据准备

打开浏览器上某东,祭出我们的F12神器,然后把如下网页代码复制下来(还不会?来找我,我当面告诉你,教到你会为止!)。

源码稍作处理如下:

二、分析过程

1、把数据上传到OpenFEA(请访问www.openfea.cn的下载专区,可以在互联网上搭建的在线试用环境中跟我一起分析),如下图:

2、加载数据到内存DF表

3、数据分析与处理

(1)数据行列转换

(2)字段重命名与数据打标签

(3)数据过滤

(4)数据提取

(5)数据合并

(6)存储结果数据

(7)结论

女生文胸品牌总共有1240个,各位男神慢慢了解吧,我只能帮你到这了。

三、分析脚本

#加载数据

df1 = load csv byjd_goods.txt with (encoding="gbk",sep="=",header=-1)

#行列互换

df2 = @udf df1 byudf0.df_T

rename df2 as(0:"content")

#数据打标签

df2.flag1 = strcontent by (contains("brand-"))

df2.flag2 = strcontent by (contains(u‘品牌‘))

df3 = filter df2 by(flag1==True)

df4 = filter df2 by(flag2==True)

#数据分析与提取

df3.brandno =strcontent by (findall("(\d+)"))

df3.brand_code=strbrandno by (get(0))

df4.brands = strcontent by (split("::"))

df4.brands_1=strbrands by (get(1))

df4.brand_name =str brands_1 by ([0:-8])

#数据合并

df3 = add idx1 by(range(df3.index.size))

df4 = add idx2 by(range(df4.index.size))

df5 = join(df3,df4) by (idx1,idx2)

df6 = loc df5 by(brand_name,brand_code)

#存储数据

store df6 to csv byjd_goods.csv

注:原创文章,转载请注明来自微信公众号“OpenFEA”

<烦请关注,下期内容更精彩!>

趣味分析系列  |  文胸纬度分析360度(罩杯、颜色......)(二)

趣味分析系列  |  女神在哪里(三)

更多文章,敬请期待......

时间: 2024-12-28 11:43:47

趣味分析系列 | 文胸品牌知多少(一)的相关文章

【常用算法思路分析系列】与二分搜索相关高频题

本文是[常用算法思路分析系列]的第五篇,总结二分搜索相关的高频题目和解题思路.本文分析如下几个问题:1.求数组局部最小值问题:2.元素最左出现的位置:3.循环有序数组求最小值:4.最左原位:5.完全二叉树计算结点数:6.快速N次方. 本系列前四篇导航: [常用算法思路分析系列]排序高频题集 [常用算法思路分析系列]字符串高频题集 [常用算法思路分析系列]栈和队列高频题集(修改版) [常用算法思路分析系列]链表相关高频题集 二分搜索的重要提醒: 一般我们选择中点进行搜索,会写成mid = (lef

SpringMVC源码分析系列

说到java的mvc框架,struts2和springmvc想必大家都知道,struts2的设计基本上完全脱离了Servlet容器,而springmvc是依托着Servlet容器元素来设计的,同时springmvc基于Spring框架,Spring框架想必搞java的同学都很熟悉. 一进Spring的官网就发现了这样一排醒目的文字, spring可以让我们构造简单的.便携的.又快又易于扩展的基于jvm的系统和应用程序. 没错,基于Spring的MVC框架SpringMVC同样也可以构造具有这些特

Cordova Android源码分析系列一(项目总览和CordovaActivity分析)

PhoneGap/Cordova是一个专业的移动应用开发框架,是一个全面的WEB APP开发的框架,提供了以WEB形式来访问终端设备的API的功能.这对于采用WEB APP进行开发者来说是个福音,这可以避免了原生开发的某些功能.Cordova 只是个原生外壳,app的内核是一个完整的webapp,需要调用的原生功能将以原生插件的形式实现,以暴露js接口的方式调用. Cordova Android项目是Cordova Android原生部分的Java代码实现,提供了Android原生代码和上层We

jQuery源码分析系列(33) : AJAX中的前置过滤器和请求分发器

jQuery1.5以后,AJAX模块提供了三个新的方法用于管理.扩展AJAX请求,分别是: 1.前置过滤器 jQuery. ajaxPrefilter 2.请求分发器 jQuery. ajaxTransport, 3.类型转换器 ajaxConvert 源码结构: jQuery.extend({ /** * 前置过滤器 * @type {[type]} */ ajaxPrefilter: addToPrefiltersOrTransports(prefilters), /** * 请求分发器 *

java执行程序的内存分析系列专栏二之static变量和方法内存分析

昨天写了简单的聊了下java执行程序时简单的内存划分,今天我们接着往下聊,聊聊static变量和方法的内存分析. 1.static变量和方法的第一个特性内存分析 statiic变量和方法的第一个特性能通过类名.static变量和类名.static方法的形式调用,而普通只能对象的形式调用.但具体为什么是这样的,这得分析static变量和方法他们在内存中怎样分配的,因此在这里我首先建立一个学生类,里面有一个普通成员变量和一个静态成员变量以及一个普通方法和一个成员方法,然后建立了一个测试学生的类. 1

jQuery源码分析系列(38) : 队列操作

Queue队列,如同data数据缓存与Deferred异步模型一样,都是jQuery库的内部实现的基础设施 Queue队列是animate动画依赖的基础设施,整个jQuery中队列仅供给动画使用 Queue队列 队列是一种特殊的线性表,只允许在表的前端(队头)进行删除操作(出队),在表的后端(队尾)进行插入操作(入队).队列的特点是先进先出(FIFO-first in first out),即最先插入的元素最先被删除. 为什么要引入队列? 我们知道代码的执行流有异步与同步之分,例如 var a

jQuery源码分析系列(36) : Ajax - 类型转化器

什么是类型转化器? jQuery支持不同格式的数据返回形式,比如dataType为 xml, json,jsonp,script, or html 但是浏览器的XMLHttpRequest对象对数据的响应只有 responseText与responseXML 二种 所以现在我要定义dataType为jsonp,那么所得的最终数据是一个json的键值对,所以jQuery内部就会默认帮你完成这个转化工作 jQuery为了处理这种执行后数据的转化,就引入了类型转化器,如果没有指定类型就依据响应头Con

房卡麻将分析系列之&quot;断线重连&quot;

"房卡"麻将研发技巧,尽在"红孩儿的游戏开发之路",欢迎关注公众号! 房卡麻将分析系列之"断线重连" 大家好,我是红孩儿,"房卡"麻将分析系列继续进行中. 在进行游戏的过程中,人们往往会遇到"断线"情况,比如坐公车,地铁下班路上玩一局,下车转站时往往先关机,过一会儿再上线继续完,如果没有自动"断线重连",则对于牌局的体验感影响会非常大,在"房卡"麻将中加入"

房卡麻将分析系列 &quot;牌局回放&quot; 之 播放处理

持续放出房卡麻将设计与研发讲解.敬请关注微信共众号:红孩儿的游戏开发之路 房卡麻将分析系列 "牌局回放" 之 播放处理 昨天红孩儿给大伙讲了讲"牌局回放"的数据记录处理,有了数据的存储,下面就是数据的显示了. 实话讲,好久没用过 SQL Server 来做数据库了, 网狐的服务器是基于WIN,IOCP,  SQL Server 这套路子.配置好后,可以在QPTreasureDB数据库中看到三个牌局相关的表. 其中dbo.PrivateGameRecord是存储当前游