2023年12月26日发(作者:斯巴鲁傲虎图片)

WORD格式整理

1. 政务数据标签

1.1. 数

1.1.1. 属性类

? 数据来源:委办局(住房城乡建设委、司法局、住房公积金管理中心、工商局、市城市管理委、民政局、安监局、水务局、公安局、质监局、城管执法局、文化局、地税局、交通委、通信管理局)、互联网、内部系统、第三方……

? 数据类别:经济、政治、军事、文化、资源、能源、生物、交通、旅游、环境、工业、农业、商业、教育、科技、质量、食品、医疗、就业、人力资源、社会民生、公共安全、信息技术

? 数据性质:状态类、明细类

? 开放性:无条件共享、有条件共享、不共享、开放

? 更新频率:实时、日、天、周、月、年、不定期、一次性

? 数据类型:数据库、文本、图片、音频、视频

专业知识分享

WORD格式整理

? 应用领域:反恐维稳、证照、信用、五证合一、政务审批、城市运行

? 主体:数、企、人、房、车、物

1.1.2. 特征类

? 数据质量:优、良、差

? 数据量:KB级别、MB级别、GB级别、TB级别、PB级别、ZB级别

? 敏感性:敏感、普通

? 数据日期:最早开始时间、最近更新时间

1.2. 企

1.2.1. 属性类

? 企业性质:国有企业、三资企业 (其中:中外合作企业、中外合资企业、 外商独资企业)、集体企业、私营企业

? 行业分类:

1.农、林、牧、渔业

2.采矿业

3.制造业

4.电力、热力、燃气及水的生产和供应业

5.环境和公共设施管理业

6.建筑业

专业知识分享

WORD格式整理

7.交通运输、仓储业和邮政业

8.信息传输、计算机服务和软件业

9.批发和零售业

10.住宿、餐饮业

11.金融、保险业

12.房地产业

13.租赁和商务服务业

14.科学研究、技术服务和地质勘查业

15.水利、环境和公共设施管理业

16.居民服务和其他服务业

17.教育

18.卫生、社会保障和社会服务业

19.文化、体育、娱乐业

20.综合(含投资类、主业不明显)

21.其它

? 是否集团企业:是、否

1.2.2. 特征类

? 环境影响分类:环保型、污染性

? 企业规模:大型、中型、小型、微型

专业知识分享

WORD格式整理

1.3. 人

1.3.1. 属性类

? 性别:男、女、未知的性别、未说明的性别(GB/T 2261.1-2003)

? 学历:小学、初中、中专/高中、专科、本科、硕士、博士

? 户籍:农业户口、非农业户口

? 职业:(GB/T 6565-2015)

第一大类:国家机关、党群组织、企业、事业单位负责人;

第二大类:专业技术人员;

第三大类:办事人员和有关人员;

第四大类:商业、服务业人员;

第五大类:农、林、牧、渔、水利业生产人员;

第六大类:生产、运输设备操作人员及有关人员;

第七大类:军人;

第八大类:不便分类的其他从业人员。

注:上班族、自由职业者、无业游民、其他

? 婚姻状况:未婚、已婚(初婚、再婚、复婚)、丧偶、离婚、未说明的婚姻状况。

专业知识分享

WORD格式整理

1.3.2. 特征类

? 年龄段:

1. 童年:0岁—6岁

(1)婴儿期0-3周月;

(2)小儿期4周月—2、5岁;

(3)幼儿期2、5岁后—6岁;

2. 少年:7岁—17岁

(1)启蒙期7岁—10岁;

(2)逆反期11岁—14岁;

(3)成长期15岁—17岁;

3. 青年:18岁—40岁

(1)青春期18—28岁;

(2)成熟期29—40岁;

4. 中年:41—65岁

(1)壮实期41—48岁;

(2)稳健期49—55岁;

(3)调整期56-65岁;

5. 老年:66岁以后

(1)初老期67—72岁;

(2)中老期73—84岁;

(3)年老期85岁以后;

? 收入水平:低、一般、中、高

专业知识分享

WORD格式整理

? 是否有车:有车、无车

? 是否有房:有房、无房

? 是否有孩子:有、无

? 孩子性别:男、女、未知的性别、未说明的性别(GB/T

2261.1-2003)

1.4. 房

1.4.1. 属性类

? 建设时间:具体年份

? 用途:商用、家用

? 产权:商品房、经济适用房、房改房

商品房:按照商品房性质购买的房屋

经济适用房:①按照经济适用住房性质购买的房屋②按照回迁房性质购买的房屋③部分通过集资建房性质购买的房屋

房改房:①按照房改政策购买的房屋(包括:成本价购买、标准价购买及标准价优惠产权购买)②部分通过集资建房性质购买的房屋

? 区域:(所在城市的区县,以北京为例)东城、西城、朝阳、海淀、丰台、石景山、通州、昌平、大兴、亦庄、开发区、顺义、房山、门头沟、平谷、怀柔、密云、延庆、燕郊、香河

? 地铁:1号线、2号线、4号线、5号线、6号线、7号线、8 专业知识分享

WORD格式整理

号线、9号线、10号线、13号线、14号线(东段)、14号线(西段)、15号线、16号线、八通线、亦庄线、昌平线、房山线、机场线

1.4.2. 特征类

? 面积范围:50平以下、50-70平、70-90平、90-110平、110平-130平、130-150平、150-200平、200平以上

? 户型:一室、二室、三室、四室、五室以上

1.5. 车

1.5.1. 属性类

? 排量:1.0L以下、1.0-1.2L、1.3-1.5L、1.6L、1.8-2.3L、2.4-3.0L、3.0L以上

? 品牌:奥迪、阿斯顿·马丁、阿尔法·罗密欧、艾康尼克、ABT、Alpina、宝马、奔驰、本田、别克、标致、比亚迪、宝骏、奔腾、宝沃、北京、北汽绅宝、北汽幻速、比速汽车、北汽新能源、北汽威旺、北汽制造、北汽道达、保时捷、宾利、巴博斯、长城、长安汽车、长安欧尚、长安轻型车、昌河、成功汽车、长江EV、大众、DS、东南、道奇、东风、东风风行、东风风神、东风启辰、东风风度、东风风光、东风小康、Datsun、Dacia、电咖汽车、丰田、福特、菲亚特、福田、法拉利、福迪、风诺、福汽启腾、Faraday Future、观致、广汽传祺、广汽吉奥、 专业知识分享

WORD格式整理

Genesis、GMC、哈弗、海马、华泰、华泰新能源、华颂、红旗、汉腾、哈飞、黄海、海格、华骐、Icona、吉利、江淮、Jeep、捷豹、金杯、江铃、江铃集团轻汽、江铃集团新能源、金龙、金旅、九龙、君马汽车、凯迪拉克、克莱斯勒、凯翼、开瑞、康迪全球鹰电动汽车、卡威、卡升、科尼赛克、KTM、雷克萨斯、铃木、雷诺、路虎、林肯、陆风、力帆、猎豹汽车、理念、领克、陆地方舟、雷丁、劳斯莱斯、兰博基尼、路特斯、领志、朗世、莲花汽车、Lucid Motors、马自达、MG、MINI、玛莎拉蒂、迈凯伦、明君汽车、摩根、纳智捷、讴歌、欧朗、帕加尼、起亚、奇瑞、前途、奇点汽车、日产、荣威、如虎、Rimac、斯柯达、三菱、斯巴鲁、smart、双龙、SWM斯威汽车、上汽大通、思铭、首望、世爵、TESLA、腾势汽车、泰克鲁斯·腾风、沃尔沃、五菱、五十铃、潍柴、WEY、蔚来、威兹曼、W Motors、瓦滋汽车、雪佛兰、现代、雪铁龙、西雅特、英菲尼迪、一汽、野马汽车、永源、依维柯、云度、御捷、众泰、中华、中兴汽车、知豆、之诺

? 车型:微型车、小型车、紧凑型车、中型车、中大型车、豪华车、SUV、跨界车、MPV、跑车

? 结构:两厢车、三厢车、旅行车、掀背车、软顶敞篷车、硬顶敞篷车

? 能源:汽油、柴油、油电混合、电动

? 进气:涡轮增压、机械增压、自然吸气

专业知识分享

WORD格式整理

? 变速箱:自动、手动

? 国别:德国、美国、韩国、中国、日本、法国、英国、意大利

1.5.2. 特征类

? 用途:家用、商用、其他

? 价格范围:5万以下、5-8万、8-12万、12-18万、18-25万、25-35万、35万以上

? 特色:只加93号油、ESP、导航、倒车影像、全景天窗、儿童乘坐、7人乘坐、四轮驱动、日行灯、非承载式车身

1.6. 物

1.6.1. 属性类

? 管理设备:

? 感知设备:(传感器)

? 位置:桥梁、道路、环境……

? 采集频率:毫秒级、秒级、分钟级、小时级、天级、不定期、其他

1.6.2. 特征类

? 设备状态:正常运行、未运行、已损坏、未知

2. 政务数据标签建设方案

专业知识分享

WORD格式整理

2.1. 标签库

ID 实体

1 数

2 数

3 数

标签类别 标签类型 类型描述

属性类 SJLY 数据来源

属性类 SJLY 数据来源

属性类

SJLY

数据来源

标签名称

委办局

住房城乡建设委

司法局

父ID

-1

1

1

2.2. 标签形成

标签作为大数据的根基,它完美地抽象出一个实体对象的信息全貌,从GLDM模型的整个分层机构来看,数据标签的形成主要在贴源层和整合层。

从贴源层形成“数据”的标签,这个主要对于来源数据表而言,从宏观角度轻而易懂对数据状况就行概述,形成数据层面的标签库。通过GLDM模型在原子层对数据进行最细粒度拆分、细化,通过数据校核、整理汇聚到整合层,形成数据较全、准性性较高、维度较细的实体信息数据(人、企、房、车、物),然后通过对实体进行标签运算,形成实体数据的标签库,从而为以后的数据挖掘或者分析奠定基础。

专业知识分享

更多推荐

数据,汽车,标签,购买,企业,东风,人员,性质