本文立足于集装箱厢号识别,以计算机程序处理图像,获得特征,切割出箱号字符,并使用Spark等大数据技术,加速字符识别,获得完整的集装箱箱号,减少了因人工抄录引起的错误,减少了进港时间,提高了工作效率。
1。2 相关知识简介
1。2。1 集装箱及箱号
集装箱(container),是指具有一定强度、刚度和规格专供周转使用的大型装货容器。使用集装箱转运货物,可直接在发货人的仓库装货,运到收货人的仓库卸货,中途更换车、船时,无须将货物从箱内取出换装。集装箱由于其产品的标准化以及由此建立的一整套运输体系,能够让一个载重几十吨的庞然大物实现标准化,并且以此为基础逐步实现船舶、港口、航线、公路、中转站、桥梁、隧道、多式联运相配套的物流系统,从而在全球范围内得到认可,成为当前船运大批次货物物流运输的首选。论文网
为了规范运输流程,明确物品的来源,便于沿途关口记录,每个集装箱都有唯一的集装箱箱号作为标示,并统一遵循ISO 6346这一国际标准。ISO 6346规定集装箱箱号主要由以下部分组成:
1 箱主代码(Owner Code):箱主代码由拉丁字母表中的三个大写字母组成,标志着集装箱的拥有者或者主要操作者。箱主代码必须在 Bureau International des Conteneurs(国际集装箱局,源自法国,亦简称为BIC)注册,以确保在全球范围内的唯一性。
图1。1 箱号例图
2 设备类别标识符(Equipment Category Identifier):设备类别标识符为以下三个大写字母的其中之一。
U:表示所有船运集装箱
J:表示集装箱所配置的挂装设备
Z:表示集装箱专用车和底盘车
本项目的研究对象主要是第一类标识符U
3 序列号(Serial Number):序列号6位数字组成,由集装箱箱主或操作者分配给每个集装箱,在箱主或操作者的船队中唯一标识此集装箱。
4 校验码(Check Digit):校验码是一个数字,用于验证箱主代码(Owner Code)和序列号(Serial Number)在传输和记录中是否准确。
5 尺寸和类型码(Size and Type Codes,可选):尺寸码以两个字符表示。第一个字符表示集装箱的长度,第二个字符表示高和宽。类型码可反映集装箱的用途和特征。类型代号原用2个阿拉伯数字表示,1995年改为用2个字符表示。其中第一个字符为拉丁字母,表示集装箱的类型;第二个字符为阿拉伯数字,表示某类型集装箱的特征。如“22G1”,表示长宽高分别为20m*8m*8。6m的货舱上部有被动排气孔的通用集装箱。
集装箱箱号一般会被写在集装箱的前后左右四个面上。
1。2。2 图像处理相关技术介绍
1 二值化
把白色与黑色之间按对数关系分为若干等级,称为灰度。灰度分为256阶,取值为0~255。用灰度表示的图像称作灰度图。
原始图像为三通道(RGB)的彩色图,转换成灰度图后,则变成单通道图,虽然在这个过程中会损失一些图像信息,但灰度图比较简单,利于后续处理。
二值化是一种特殊的灰度图,图像中所有像素点的像素值只有两种数值,常用的有0-255二值(便于查看二值化效果)、0-1二值(便于计算)。如下图所示,灰度值为0时为黑色,表示前景(即字符),灰度值为255时为白色,表示背景。
图1。2 彩色图像二值化示意图
当彩色图像变换为二值图像后,可以发现图中大部分多余信息被去掉了(如集装箱颜色、箱面纹理等),只留下需要的字符信息和少量杂质。 基于Spark的图像相似性比对加速算法(3):http://www.youerw.com/jisuanji/lunwen_84852.html