关于这个事件,来源于6月30号的一篇帖子,不过可能是之前没有提供demo数据的关系,直到7月3号才开始大范围传播。
从开放下载的demo数据来看,打包日期为2022-7-3的凌晨1:46,也就是之前大家其实都不太相信,直到提供了demo数据下载,这下大家才相信。
这个demo数据一共提供了3个数据源,其中,每个数据源的数据条数均为25w条
- address_merge_with_mobile_data.json:这个感觉像是通过大数据平台获取的第三方个人信息,因为有些数据可以明显看到是来自于某些购物app
- case_data_index.json:历史110报案数据,截至到2019年12月,最早日期为1995年7月,后面或更早的数据可能没有包含在demo数据里,也可能数据集仅截至到2019年。不过看起来是乱序数据,所以猜测应该就是从1995-2019的数据。
- person_info.json:应该是重点人员数据库,有些人员有备注,有些则没有
下面分析下case_data_index.json的数据结构
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 |
{ "_id":"null", "_index":"null", "_score":null, "_source":{ "ADDR_DETL":"{ "CASE":{ "BRIEF_CASE":"null", "CASE_TYPE":null, "CASE_STATE":null }, "ORGANIZER_POLICE_TYPE":null, "ORGANIZER":{ "ORGANIZER_NAME":null, "ORGANIZER_AREA":null } "TIME":{ "ACCEPTANCE_TIME":null, "REGISTER_TIME":null, "CLOSING_TIME":null, "PUNISH_TIME":null, "CASE_TIME":null, "REPORT_TIME":null } "ACCEPTANCE_UNIT_JSON":{ "ACCEPTANCE_UNIT_NUMBER":null, "ACCEPTANCE_UNIT_NAME":null }, "TABLE_SOURCE":"null", "CASE_ADDRESS":"null" } "ADDR_TYPE":"null", "BLOCK_L4":"null", "CASE_NUMBER":"null", "CITY_L2":"null", "COUNTY_L3":"null", "LOC_SOURCE":"null", "MCS_ID":"null", "NUMBER_L7":"null", "PROVINCE_L1":"null", "STD_ADDRESS":"null" }, "_type":"null", "sort":[null] } |
主要数据主要在”BRIEF_CASE”字段内
从数据结构来看,有些类似于是后端api的返回值,感觉像是通过某个api接口获取的数据
一般来说,数据泄露到公开会有一个比较长的时间差,否则容易追查到泄露的源头,结合数据截止于2020年,推测应该是在2020年泄露的。
其实这个论坛还有挺多的数据在卖
比如这个1900w的数据集,卖1500USDT
There are no comments yet