关于这个事件,来源于6月30号的一篇帖子,不过可能是之前没有提供demo数据的关系,直到7月3号才开始大范围传播。
从开放下载的demo数据来看,打包日期为2022-7-3的凌晨1:46,也就是之前大家其实都不太相信,直到提供了demo数据下载,这下大家才相信。
这个demo数据一共提供了3个数据源,其中,每个数据源的数据条数均为25w条
- address_merge_with_mobile_data.json:这个感觉像是通过大数据平台获取的第三方个人信息,因为有些数据可以明显看到是来自于某些购物app
- case_data_index.json:历史110报案数据,截至到2019年12月,最早日期为1995年7月,后面或更早的数据可能没有包含在demo数据里,也可能数据集仅截至到2019年。不过看起来是乱序数据,所以猜测应该就是从1995-2019的数据。
- person_info.json:应该是重点人员数据库,有些人员有备注,有些则没有
下面分析下case_data_index.json的数据结构
{ "_id":"null", "_index":"null", "_score":null, "_source":{ "ADDR_DETL":"{ "CASE":{ "BRIEF_CASE":"null", "CASE_TYPE":null, "CASE_STATE":null }, "ORGANIZER_POLICE_TYPE":null, "ORGANIZER":{ "ORGANIZER_NAME":null, "ORGANIZER_AREA":null } "TIME":{ "ACCEPTANCE_TIME":null, "REGISTER_TIME":null, "CLOSING_TIME":null, "PUNISH_TIME":null, "CASE_TIME":null, "REPORT_TIME":null } "ACCEPTANCE_UNIT_JSON":{ "ACCEPTANCE_UNIT_NUMBER":null, "ACCEPTANCE_UNIT_NAME":null }, "TABLE_SOURCE":"null", "CASE_ADDRESS":"null" } "ADDR_TYPE":"null", "BLOCK_L4":"null", "CASE_NUMBER":"null", "CITY_L2":"null", "COUNTY_L3":"null", "LOC_SOURCE":"null", "MCS_ID":"null", "NUMBER_L7":"null", "PROVINCE_L1":"null", "STD_ADDRESS":"null" }, "_type":"null", "sort":[null] }