一.站点的统一
一个站点可能有若干线路通过,因此首先要解决的问题是:将这些线通过的同一个站点视为一个站点,因为之前是按照线路来命名的,所以作出修改
实施方案:
- 将ic_line_dict_station_201508_9column.csv生成一个加上station name的ic_line_dict_station_201508_2.csv
- 修改项目GivenameToDict,将AFCGPS.csv与前一步生成的文件合并得到有name的busAfcDict_201508.csv
- 形成name和station_code的一对多的对应关系(难点是中文编码的问题),另外可以给name编个号
- 因为出行链中是未考虑这种情况的站点编号,所以,有两种选择:一是,不修改出行链,将name和station_code的一对多的对应关系存入缓存中,在计数的时候读取缓存。二是重新运行一遍出行链,将station_code变成我自己形成的编号。
二.统计下车人数
时间间隔半小时,统计在各站点下车的人数,按天还是按周还是按月??打听下作为CNN的输入,哪种比较好
时间: 2024-10-26 01:13:20