关于这个事件,来源于6月30号的一篇帖子,不过可能是之前没有提供demo数据的关系,直到7月3号才开始大范围传播。
从开放下载的demo数据来看,打包日期为2022-7-3的凌晨1:46,也就是之前大家其实都不太相信,直到提供了demo数据下载,这下大家才相信。
这个demo数据一共提供了3个数据源,其中,每个数据源的数据条数均为25w条
- address_merge_with_mobile_data.json:这个感觉像是通过大数据平台获取的第三方个人信息,因为有些数据可以明显看到是来自于某些购物app
- case_data_index.json:历史110报案数据,截至到2019年12月,最早日期为1995年7月,后面或更早的数据可能没有包含在demo数据里,也可能数据集仅截至到2019年。不过看起来是乱序数据,所以猜测应该就是从1995-2019的数据。
- person_info.json:应该是重点人员数据库,有些人员有备注,有些则没有
下面分析下case_data_index.json的数据结构
{
"_id":"null",
"_index":"null",
"_score":null,
"_source":{
"ADDR_DETL":"{
"CASE":{
"BRIEF_CASE":"null",
"CASE_TYPE":null,
"CASE_STATE":null
},
"ORGANIZER_POLICE_TYPE":null,
"ORGANIZER":{
"ORGANIZER_NAME":null,
"ORGANIZER_AREA":null
}
"TIME":{
"ACCEPTANCE_TIME":null,
"REGISTER_TIME":null,
"CLOSING_TIME":null,
"PUNISH_TIME":null,
"CASE_TIME":null,
"REPORT_TIME":null
}
"ACCEPTANCE_UNIT_JSON":{
"ACCEPTANCE_UNIT_NUMBER":null,
"ACCEPTANCE_UNIT_NAME":null
},
"TABLE_SOURCE":"null",
"CASE_ADDRESS":"null"
}
"ADDR_TYPE":"null",
"BLOCK_L4":"null",
"CASE_NUMBER":"null",
"CITY_L2":"null",
"COUNTY_L3":"null",
"LOC_SOURCE":"null",
"MCS_ID":"null",
"NUMBER_L7":"null",
"PROVINCE_L1":"null",
"STD_ADDRESS":"null"
},
"_type":"null",
"sort":[null]
}