西藏自治区气象局信息中心,西藏拉萨850000
摘要:首先G文件就是GAAF文件的缩写,是指高空全月探测数据文件,我区于2011年开始对我区5站高空资料形成G文件格式,并进行格式检查及质量检查。
关键词:G文件格式数据段质量错误分析质量
引言
随着全国高空观测采用“L”波段雷达观测为主流,高空数据也由过去较单一的数据随之转入较全面的高空气象资料垂直分层密,获取不同高度层资料的特点。基于对完整地收集高空探测资料,2010年中国气象局与相关省份开发相关质量检查软件并统一了归档格式。我区于2010年起对各站G文件进行格式检查及质量检查,并上报国家局。本文就审核过程中发现的格式错误及质量错误进行分析。
1G文件的格式及审核发现的问题解决
1.1G文件的结构
首先了解G文件袋结构是审核G文件首要条件
文件名
“高空全月观测数据文件”(简称G文件)为文本文件。文件名有如下两种命名方式:
1)固定站观测数据文件名由17个字符组成,其结构为:“GIIiii-YYYYMM.TXT”;
2)固定站平行观测或移动站观测数据文件名由19个字符组成,其结构为:“GIIiii-YYYYMM-X.TXT”。
文件名中字符表示的含义见表1。
表1文件名中字符表示的含义
文件命名是否正确主要取决于台站参数的录入是否正确,主要是区站号的录入(IIiii)其次是可选项(-X)如果不是移动数据文件可不命名-X
1.2文件结构
G文件由台站参数、观测数据、质量控制信息、附加信息4个部分构成。
a)台站参数部分是数据文件第一个部分,为必选部分,占一行。
b)观测数据部分是数据文件第二个部分,为必选部分,由多个数据段构成,结束符为“??????”。
c)质量控制信息部分是数据文件第三个部分,为可选部分,由多个数据段构成,结束符为“******”
d)附加信息部分是数据文件第四个部分,为必选部分,结束符为“######”。
文件中每条记录为一行,每行结束后在行尾不允许有空格,直接回车换行。
2.3台站参数
台站参数各组数据具体格式规定如下:
a)区站号(IIiii),由5位字母或数字组成:前2位为区号,后3位为站号;无区站号的移动观测站用“99999”代替。
b)纬度(QQQQQQD),由6位数字加1位字母组成:前6位为纬度,其中1~2位为度,3~4位为分,5~6位为秒,位数不足,高位补“0”;最后1位大写字母“S”、“N”分别表示南纬、北纬。移动站纬度为放球点的纬度。
c)经度(LLLLLLLD),由7位数字加1位字母组成:前7位为经度,其中1~3位为度,4~5位为分,6~7位为秒,位数不足,高位补“0”;最后1位大写字母“E”、“W”分别表示东经、西经。移动站经度为放球点的经度。
d)探空拔海高度(H1H1H1H1H1H1),即测站水银槽拔海高度,由6位数字组成:第1位为拔海高度参数,实测为“0”,约测为“1”;后2~6位为拔海高度,单位为“0.1米”,位数不足,高位补“0”。若测站位于海平面以下,第2位录入“-”号。
e)测风拔海高度(H2H2H2H2H2H2),即定向天线光电轴中心或经纬仪镜筒拔海高度,由6位数字组成:第1位为拔海高度参数,实测为“0”,约测为“1”;后2~6位为拔海高度,单位为“0.1米”,位数不足,高位补“0”。若测站位于海平面以下,第2位录入“-”号。
f)测站类别(x1),由1位数字组成:x1=1为探空站,x1=2为测风站,x1=3为移动观测站,x1=4为固定站平行观测。
g)观测项目标识(nny1……ynn),由nn+2个字符组成:nn表示观测数据部分的数据段个数,由2位数字组成,位数不足,高位补“0”;y1……ynn为各段数据状况,yi=0(i=1,……,nn)表示该段全月数据缺省,yi=1(i=1,……,nn)表示有该数据段,yi=9(i=1,……,nn)表示该段全月数据缺测。
若观测数据部分由11个数据段构成,且所有数据段均有数据,则观测项目标识为:“1111111111111”。
h)质量控制信息指示码(C),由1位数字组成:C=0表示文件无质量控制信息部分,C=1表示文件有质量控制信息部分。
i)年份(YYYY),由4位数字组成。
月份(MM),由2位数字组成,位数不足,高位补“0”
图1我区参数配置文件
正确配置参数文件是G文件格式检查第一步,参数配置未按要求格式录入,格式检查就不能通过,无法进入下部分检查工作。
2观测数据
2.1基本结构
观测数据部分包括了高空压、温、湿和高空风一个月的观测数据及相关观测信息,由台站参数部分观测项目标识中标识为“1”和“9”的数据段构成。观测数据最多由11个数据段构成,各数据段按照表2中的固定顺序排列。
表2数据段划分
根据此图显示AA段数2hp据极值超出范围。台站信息与参数配置项中,气温风速界限、规定高度界限、温度露点界限全国均统一使用了一个标准。由于全国地理环境的差异,各个台站对以上数据的界限值不能作为统一的标准,建议使用近30年的历史资料提取以上的项目作为配置使用。有些资料也出现地面气压或温度读错,这种疑误信息往往出现在近地高度,处理方法可采用地面自动站当时的数据作为参考,并根据相关规范处理。
图3质量检查错误提示
质量控制码数据组由三位质量控制码组成,依次表示台站级、省(地区)级和国家级所对应的质量控制码。如质量控制码数据组为“111”,表示该数据台站级、省(地区)级和国家级质量控制都认为是可疑值。台站形成本文件时,如果没有进行质量控制,所有数据的质量控制码均为“999”。
3.3基本结构
质量控制数据主要由观测数据的质量控制码数据组组成,其排列顺序与观测数据部分的数据段、段首标识、数据节、记录、数据组一一对应。
质量控制数据各段的段首标识是在观测数据部分的相应段首标识中段指示码前加大写字母“Q”。
观测数据部分AA数据段本月有08时和20时(北京时)两次观测,则AA段的质量控制数据段首标识为“QAA0820”。
质量控制数据各段组数与观测数据部分数据组数相等,除日期和观测层数(或记录条数)外,每组数据由一个质量控制码数据组构成,组间分隔符为1个空格;质量控制数据各段中的日期和观测层数(或记录条数)与观测数据中相应各段的日期和观测层数(或记录条数)一致。
质量控制数据各段中的日结束符与所对应的观测数据部分的日结束符相同。每节全月质量控制数据结束符为“=”,置于最后一天最后一组质量控制码数据组之后。
如果某数据段在台站、省(地区)、国家三级质量控制中均未做质量控制,应在该段首标识后直接输入“999=”,例如“QAA020820999=”,表示AA段数据未作质量控制。
图4质量错误显示图
根据图4可知图中显示的错误为QKK段观测行为的基本描述错误,观测项目标识(nny1……ynn),由nn+2个字符组成:nn表示观测数据部分的数据段个数,由2位数字组成,位数不足,高位补“0”;y1……ynn为各段数据状况,yi=0(i=1,……,nn)表示该段全月数据缺省,yi=1(i=1,……,nn)表示有该数据段,yi=9(i=1,……,nn)表示该段全月数据缺测。
若观测数据部分由11个数据段构成,且所有数据段均有数据,则观测项目标识为:“1111111111111”。
此份记录G文件基本结构显示如下:
55299312900N0900400E045080045130111111111101111201308
结构显示此份记录无HH段及QHH段,项数表达自然错误。处理方法:删减每一时次一段009
3.4更正数据
基本结构
更正数据是订正和修改数据更正情况记录。
更正数据段以段指示码作为开始标识,段指示码固定为大写字母“QM”,无更正数据时为“QM=”。更正数据记录个数不限,每个订正或修改数据为一条记录,不必考虑段顺序。
更正数据段结束符为“=”,置于最后一条订正或修改记录的最后一个数据之后。
3.5格式规定
每条订正或修改记录格式为:“更正数据标识段指示码节顺序数日期行数组数级别[原始值][订正(修改)值]”。
-更正数据标识由1位数字组成,“3”表示订正数据,“4”表示修改数据。
-段指示码由2位大写字母组成,段指示码见表2。
-节顺序数,为该条订正或修改数据在该数据段中所处的节数,由2位数字组成,位数不足,高位补“0”。
-日期由2位数字组成,位数不足,高位补“0”。
-行数为该条订正或修改数据在该数据段该数据节该日所处行数,由4位数字组成,位数不足,高位补“0”。
-组数为该条订正或修改数据在该数据段该数据节该日某行中所处列数,由2位数字组成,位数不足,高位补“0”。
-级别由1位数字组成,台站级为“1”,省或地区级为“2”,国家级为“3”。
-原始值和订正(修改)值用“[]”括起,数据格式按各段的数据技术规定,数据不足规定位数时,高位补“0”。
-各数据之间用1个空格作为分隔符。
示例:如台站上报的G文件中某站AA段第1节3日第2行第3组为“缺测”,省级通过内插方法计算数据为“100”。更正数据应写为:“3AA01030002032[/////][00100]”。
参考文献
[1]中国气象局.高空全月观测数据归档格式(G格式)2011
[2]中国气象局.常规高空气象观测业务规范.北京:气象出版社,2010
作者简介:尼玛次仁(1972-),男,藏族,西藏山南市人,本科学历,工程师,从事气象工作。