博客
关于我
ArcGIS数据编码
阅读量:153 次
发布时间:2019-02-28

本文共 960 字,大约阅读时间需要 3 分钟。

  • 前言

arcgis10.2及以前是 936编码

arcgis 10.3及以后是utf-8编码

cpg文件是arcgis自主的编码定义文件,例如:

 

arcgis软件在创建数据时,会将数据编码的格式自动写在dbf文件首行;

如果没有写,那么会在在cpg文件中指明。

  • 正确编码的数据:

  • 出现dbf乱码的情景,两种:

第一种:数据本身是utf-8编码,但是用户在cpg文件中却指定成了936,那么就会出现乱码。

解决办法:在cpg文件将编码格式改成utf-8即可;

第二种:数据本身是utf-8编码,但是用户在cpg文件中指定成了936格式,同时还将错误编码的数据导出了。

解决方法:无。用了错误的编码方式读了现有编码,然后重写出来,数据就损坏了,错上加错。如下图:

例如:

 

  • 测试

拿到一份数据可以用参考资料中Python来测试这个数据的编码格式,如果显示 的是“0,0x0”,在编码表中没有找到对应的编码格式,则说明这份数据在dbf文件的首行没有写入文件的编码格式。

arcgis软件会自动写上,但是有的gis厂商不会写上,由于dbf和shp数据都是开源的,其它gis厂商,也支持生成shp数据,但是并不是所有的gis厂商都会在dbf中写入文件编码类型。

(1)测试一

10.6的shp数据——拷贝到——>10.2中,加载能够显示,没有出现乱码情况

文件编码写在了cpg文件中

 

(2)测试二

10.2的shp文件——拷贝到——>10.6中,加载能够显示,没有出现乱码情况

文件编码写在了dbf文件的文件头

结论:不管是10.2的936文件编码,还是10.6的utf-8编码,只要给数据以正确的编码都能在不同的arcgis版本中加载显示而且不出现乱码情况;

如果将10.2的shp数据,在10.6中给它在创建的cpg文件中指定成了utf-8编码不会出现乱码情况;

——>因为10.2生成的shp文件在dbf中已经在文件头给它指定了正确的编码格式,哪怕在cpg中指定了错误的文件编码格式也不会报错,因为先读dbf头文件。

10.6的shp文件在10.2的软件中给它在创建的cpg文件中指定成了936编码会出现乱码情况。——>因为在cpg中指定了错误的文件编码格式。

 

 

  • 参考资料

  • 测试数据

链接:密码:ecqt

链接: 密码:it0k

 

 

 

你可能感兴趣的文章
NLog类库使用探索——详解配置
查看>>
NLP 基于kashgari和BERT实现中文命名实体识别(NER)
查看>>
NLP 模型中的偏差和公平性检测
查看>>
Vue3.0 性能提升主要是通过哪几方面体现的?
查看>>
NLP 项目:维基百科文章爬虫和分类【01】 - 语料库阅读器
查看>>
NLP_什么是统计语言模型_条件概率的链式法则_n元统计语言模型_马尔科夫链_数据稀疏(出现了词库中没有的词)_统计语言模型的平滑策略---人工智能工作笔记0035
查看>>
NLP、CV 很难入门?IBM 数据科学家带你梳理
查看>>
NLP三大特征抽取器:CNN、RNN与Transformer全面解析
查看>>
NLP入门(六)pyltp的介绍与使用
查看>>
NLP学习笔记:使用 Python 进行NLTK
查看>>
NLP度量指标BELU真的完美么?
查看>>
NLP的不同研究领域和最新发展的概述
查看>>
NLP的神经网络训练的新模式
查看>>
NLP采用Bert进行简单文本情感分类
查看>>
NLP问答系统:使用 Deepset SQUAD 和 SQuAD v2 度量评估
查看>>
NLP项目:维基百科文章爬虫和分类【02】 - 语料库转换管道
查看>>
NLP:从头开始的文本矢量化方法
查看>>
NLP:使用 SciKit Learn 的文本矢量化方法
查看>>
NLTK - 停用词下载
查看>>
nmap 使用总结
查看>>