2023年12月26日发(作者:斯巴鲁傲虎图片)
WORD格式整理
1. 政务数据标签
1.1. 数
1.1.1. 属性类
? 数据来源:委办局(住房城乡建设委、司法局、住房公积金管理中心、工商局、市城市管理委、民政局、安监局、水务局、公安局、质监局、城管执法局、文化局、地税局、交通委、通信管理局)、互联网、内部系统、第三方……
? 数据类别:经济、政治、军事、文化、资源、能源、生物、交通、旅游、环境、工业、农业、商业、教育、科技、质量、食品、医疗、就业、人力资源、社会民生、公共安全、信息技术
? 数据性质:状态类、明细类
? 开放性:无条件共享、有条件共享、不共享、开放
? 更新频率:实时、日、天、周、月、年、不定期、一次性
? 数据类型:数据库、文本、图片、音频、视频
专业知识分享
WORD格式整理
? 应用领域:反恐维稳、证照、信用、五证合一、政务审批、城市运行
? 主体:数、企、人、房、车、物
1.1.2. 特征类
? 数据质量:优、良、差
? 数据量:KB级别、MB级别、GB级别、TB级别、PB级别、ZB级别
? 敏感性:敏感、普通
? 数据日期:最早开始时间、最近更新时间
1.2. 企
1.2.1. 属性类
? 企业性质:国有企业、三资企业 (其中:中外合作企业、中外合资企业、 外商独资企业)、集体企业、私营企业
? 行业分类:
1.农、林、牧、渔业
2.采矿业
3.制造业
4.电力、热力、燃气及水的生产和供应业
5.环境和公共设施管理业
6.建筑业
专业知识分享
WORD格式整理
7.交通运输、仓储业和邮政业
8.信息传输、计算机服务和软件业
9.批发和零售业
10.住宿、餐饮业
11.金融、保险业
12.房地产业
13.租赁和商务服务业
14.科学研究、技术服务和地质勘查业
15.水利、环境和公共设施管理业
16.居民服务和其他服务业
17.教育
18.卫生、社会保障和社会服务业
19.文化、体育、娱乐业
20.综合(含投资类、主业不明显)
21.其它
? 是否集团企业:是、否
1.2.2. 特征类
? 环境影响分类:环保型、污染性
? 企业规模:大型、中型、小型、微型
专业知识分享
WORD格式整理
1.3. 人
1.3.1. 属性类
? 性别:男、女、未知的性别、未说明的性别(GB/T 2261.1-2003)
? 学历:小学、初中、中专/高中、专科、本科、硕士、博士
? 户籍:农业户口、非农业户口
? 职业:(GB/T 6565-2015)
第一大类:国家机关、党群组织、企业、事业单位负责人;
第二大类:专业技术人员;
第三大类:办事人员和有关人员;
第四大类:商业、服务业人员;
第五大类:农、林、牧、渔、水利业生产人员;
第六大类:生产、运输设备操作人员及有关人员;
第七大类:军人;
第八大类:不便分类的其他从业人员。
注:上班族、自由职业者、无业游民、其他
? 婚姻状况:未婚、已婚(初婚、再婚、复婚)、丧偶、离婚、未说明的婚姻状况。
专业知识分享
WORD格式整理
1.3.2. 特征类
? 年龄段:
1. 童年:0岁—6岁
(1)婴儿期0-3周月;
(2)小儿期4周月—2、5岁;
(3)幼儿期2、5岁后—6岁;
2. 少年:7岁—17岁
(1)启蒙期7岁—10岁;
(2)逆反期11岁—14岁;
(3)成长期15岁—17岁;
3. 青年:18岁—40岁
(1)青春期18—28岁;
(2)成熟期29—40岁;
4. 中年:41—65岁
(1)壮实期41—48岁;
(2)稳健期49—55岁;
(3)调整期56-65岁;
5. 老年:66岁以后
(1)初老期67—72岁;
(2)中老期73—84岁;
(3)年老期85岁以后;
? 收入水平:低、一般、中、高
专业知识分享
WORD格式整理
? 是否有车:有车、无车
? 是否有房:有房、无房
? 是否有孩子:有、无
? 孩子性别:男、女、未知的性别、未说明的性别(GB/T
2261.1-2003)
1.4. 房
1.4.1. 属性类
? 建设时间:具体年份
? 用途:商用、家用
? 产权:商品房、经济适用房、房改房
商品房:按照商品房性质购买的房屋
经济适用房:①按照经济适用住房性质购买的房屋②按照回迁房性质购买的房屋③部分通过集资建房性质购买的房屋
房改房:①按照房改政策购买的房屋(包括:成本价购买、标准价购买及标准价优惠产权购买)②部分通过集资建房性质购买的房屋
? 区域:(所在城市的区县,以北京为例)东城、西城、朝阳、海淀、丰台、石景山、通州、昌平、大兴、亦庄、开发区、顺义、房山、门头沟、平谷、怀柔、密云、延庆、燕郊、香河
? 地铁:1号线、2号线、4号线、5号线、6号线、7号线、8 专业知识分享
WORD格式整理
号线、9号线、10号线、13号线、14号线(东段)、14号线(西段)、15号线、16号线、八通线、亦庄线、昌平线、房山线、机场线
1.4.2. 特征类
? 面积范围:50平以下、50-70平、70-90平、90-110平、110平-130平、130-150平、150-200平、200平以上
? 户型:一室、二室、三室、四室、五室以上
1.5. 车
1.5.1. 属性类
? 排量:1.0L以下、1.0-1.2L、1.3-1.5L、1.6L、1.8-2.3L、2.4-3.0L、3.0L以上
? 品牌:奥迪、阿斯顿·马丁、阿尔法·罗密欧、艾康尼克、ABT、Alpina、宝马、奔驰、本田、别克、标致、比亚迪、宝骏、奔腾、宝沃、北京、北汽绅宝、北汽幻速、比速汽车、北汽新能源、北汽威旺、北汽制造、北汽道达、保时捷、宾利、巴博斯、长城、长安汽车、长安欧尚、长安轻型车、昌河、成功汽车、长江EV、大众、DS、东南、道奇、东风、东风风行、东风风神、东风启辰、东风风度、东风风光、东风小康、Datsun、Dacia、电咖汽车、丰田、福特、菲亚特、福田、法拉利、福迪、风诺、福汽启腾、Faraday Future、观致、广汽传祺、广汽吉奥、 专业知识分享
WORD格式整理
Genesis、GMC、哈弗、海马、华泰、华泰新能源、华颂、红旗、汉腾、哈飞、黄海、海格、华骐、Icona、吉利、江淮、Jeep、捷豹、金杯、江铃、江铃集团轻汽、江铃集团新能源、金龙、金旅、九龙、君马汽车、凯迪拉克、克莱斯勒、凯翼、开瑞、康迪全球鹰电动汽车、卡威、卡升、科尼赛克、KTM、雷克萨斯、铃木、雷诺、路虎、林肯、陆风、力帆、猎豹汽车、理念、领克、陆地方舟、雷丁、劳斯莱斯、兰博基尼、路特斯、领志、朗世、莲花汽车、Lucid Motors、马自达、MG、MINI、玛莎拉蒂、迈凯伦、明君汽车、摩根、纳智捷、讴歌、欧朗、帕加尼、起亚、奇瑞、前途、奇点汽车、日产、荣威、如虎、Rimac、斯柯达、三菱、斯巴鲁、smart、双龙、SWM斯威汽车、上汽大通、思铭、首望、世爵、TESLA、腾势汽车、泰克鲁斯·腾风、沃尔沃、五菱、五十铃、潍柴、WEY、蔚来、威兹曼、W Motors、瓦滋汽车、雪佛兰、现代、雪铁龙、西雅特、英菲尼迪、一汽、野马汽车、永源、依维柯、云度、御捷、众泰、中华、中兴汽车、知豆、之诺
? 车型:微型车、小型车、紧凑型车、中型车、中大型车、豪华车、SUV、跨界车、MPV、跑车
? 结构:两厢车、三厢车、旅行车、掀背车、软顶敞篷车、硬顶敞篷车
? 能源:汽油、柴油、油电混合、电动
? 进气:涡轮增压、机械增压、自然吸气
专业知识分享
WORD格式整理
? 变速箱:自动、手动
? 国别:德国、美国、韩国、中国、日本、法国、英国、意大利
1.5.2. 特征类
? 用途:家用、商用、其他
? 价格范围:5万以下、5-8万、8-12万、12-18万、18-25万、25-35万、35万以上
? 特色:只加93号油、ESP、导航、倒车影像、全景天窗、儿童乘坐、7人乘坐、四轮驱动、日行灯、非承载式车身
1.6. 物
1.6.1. 属性类
? 管理设备:
? 感知设备:(传感器)
? 位置:桥梁、道路、环境……
? 采集频率:毫秒级、秒级、分钟级、小时级、天级、不定期、其他
1.6.2. 特征类
? 设备状态:正常运行、未运行、已损坏、未知
2. 政务数据标签建设方案
专业知识分享
WORD格式整理
2.1. 标签库
ID 实体
1 数
2 数
3 数
标签类别 标签类型 类型描述
属性类 SJLY 数据来源
属性类 SJLY 数据来源
属性类
SJLY
数据来源
标签名称
委办局
住房城乡建设委
司法局
父ID
-1
1
1
2.2. 标签形成
标签作为大数据的根基,它完美地抽象出一个实体对象的信息全貌,从GLDM模型的整个分层机构来看,数据标签的形成主要在贴源层和整合层。
从贴源层形成“数据”的标签,这个主要对于来源数据表而言,从宏观角度轻而易懂对数据状况就行概述,形成数据层面的标签库。通过GLDM模型在原子层对数据进行最细粒度拆分、细化,通过数据校核、整理汇聚到整合层,形成数据较全、准性性较高、维度较细的实体信息数据(人、企、房、车、物),然后通过对实体进行标签运算,形成实体数据的标签库,从而为以后的数据挖掘或者分析奠定基础。
专业知识分享
更多推荐
数据,汽车,标签,购买,企业,东风,人员,性质
发布评论