关于这个事件,来源于6月30号的一篇帖子,不过可能是之前没有提供demo数据的关系,直到7月3号才开始大范围传播。
从开放下载的demo数据来看,打包日期为2022-7-3的凌晨1:46,也就是之前大家其实都不太相信,直到提供了demo数据下载,这下大家才相信。
这个demo数据一共提供了3个数据源,其中,每个数据源的数据条数均为25w条
- address_merge_with_mobile_data.json:这个感觉像是通过大数据平台获取的第三方个人信息,因为有些数据可以明显看到是来自于某些购物app
- case_data_index.json:历史110报案数据,截至到2019年12月,最早日期为1995年7月,后面或更早的数据可能没有包含在demo数据里,也可能数据集仅截至到2019年。不过看起来是乱序数据,所以猜测应该就是从1995-2019的数据。
- person_info.json:应该是重点人员数据库,有些人员有备注,有些则没有
下面分析下case_data_index.json的数据结构
{
   "_id":"null",
   "_index":"null",
   "_score":null,
   "_source":{
      "ADDR_DETL":"{
         "CASE":{
            "BRIEF_CASE":"null",
            "CASE_TYPE":null,
            "CASE_STATE":null
         },
         "ORGANIZER_POLICE_TYPE":null,
         "ORGANIZER":{
            "ORGANIZER_NAME":null,
            "ORGANIZER_AREA":null
         }
         "TIME":{
            "ACCEPTANCE_TIME":null,
            "REGISTER_TIME":null,
            "CLOSING_TIME":null,
            "PUNISH_TIME":null,
            "CASE_TIME":null,
            "REPORT_TIME":null
         }
         "ACCEPTANCE_UNIT_JSON":{
            "ACCEPTANCE_UNIT_NUMBER":null,
            "ACCEPTANCE_UNIT_NAME":null
         },
         "TABLE_SOURCE":"null",
         "CASE_ADDRESS":"null"
      }
      "ADDR_TYPE":"null",
      "BLOCK_L4":"null",
      "CASE_NUMBER":"null",
      "CITY_L2":"null",
      "COUNTY_L3":"null",
      "LOC_SOURCE":"null",
      "MCS_ID":"null",
      "NUMBER_L7":"null",
      "PROVINCE_L1":"null",
      "STD_ADDRESS":"null"      
   },
   "_type":"null",
   "sort":[null]
}