基于Spark的图像相似性比对加速算法(3)_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

基于Spark的图像相似性比对加速算法(3)

本文立足于集装箱厢号识别,以计算机程序处理图像,获得特征,切割出箱号字符,并使用Spark等大数据技术,加速字符识别,获得完整的集装箱箱号,减少了因人工抄录引起的错误,减少了进港时间,提高了工作效率。

1。2  相关知识简介

1。2。1  集装箱及箱号

集装箱(container),是指具有一定强度、刚度和规格专供周转使用的大型装货容器。使用集装箱转运货物,可直接在发货人的仓库装货,运到收货人的仓库卸货,中途更换车、船时,无须将货物从箱内取出换装。集装箱由于其产品的标准化以及由此建立的一整套运输体系,能够让一个载重几十吨的庞然大物实现标准化,并且以此为基础逐步实现船舶、港口、航线、公路、中转站、桥梁、隧道、多式联运相配套的物流系统,从而在全球范围内得到认可,成为当前船运大批次货物物流运输的首选。论文网

为了规范运输流程,明确物品的来源,便于沿途关口记录,每个集装箱都有唯一的集装箱箱号作为标示,并统一遵循ISO 6346这一国际标准。ISO 6346规定集装箱箱号主要由以下部分组成:

1  箱主代码(Owner Code):箱主代码由拉丁字母表中的三个大写字母组成,标志着集装箱的拥有者或者主要操作者。箱主代码必须在 Bureau International des Conteneurs(国际集装箱局,源自法国,亦简称为BIC)注册,以确保在全球范围内的唯一性。

                                            图1。1  箱号例图

2  设备类别标识符(Equipment Category Identifier):设备类别标识符为以下三个大写字母的其中之一。

U:表示所有船运集装箱

J:表示集装箱所配置的挂装设备

Z:表示集装箱专用车和底盘车

本项目的研究对象主要是第一类标识符U

3  序列号(Serial Number):序列号6位数字组成,由集装箱箱主或操作者分配给每个集装箱,在箱主或操作者的船队中唯一标识此集装箱。

4  校验码(Check Digit):校验码是一个数字,用于验证箱主代码(Owner Code)和序列号(Serial Number)在传输和记录中是否准确。

5  尺寸和类型码(Size and Type Codes,可选):尺寸码以两个字符表示。第一个字符表示集装箱的长度,第二个字符表示高和宽。类型码可反映集装箱的用途和特征。类型代号原用2个阿拉伯数字表示,1995年改为用2个字符表示。其中第一个字符为拉丁字母,表示集装箱的类型;第二个字符为阿拉伯数字,表示某类型集装箱的特征。如“22G1”,表示长宽高分别为20m*8m*8。6m的货舱上部有被动排气孔的通用集装箱。

集装箱箱号一般会被写在集装箱的前后左右四个面上。

1。2。2  图像处理相关技术介绍

1  二值化

 把白色与黑色之间按对数关系分为若干等级,称为灰度。灰度分为256阶,取值为0~255。用灰度表示的图像称作灰度图。

原始图像为三通道(RGB)的彩色图,转换成灰度图后,则变成单通道图,虽然在这个过程中会损失一些图像信息,但灰度图比较简单,利于后续处理。

二值化是一种特殊的灰度图,图像中所有像素点的像素值只有两种数值,常用的有0-255二值(便于查看二值化效果)、0-1二值(便于计算)。如下图所示,灰度值为0时为黑色,表示前景(即字符),灰度值为255时为白色,表示背景。

图1。2  彩色图像二值化示意图

当彩色图像变换为二值图像后,可以发现图中大部分多余信息被去掉了(如集装箱颜色、箱面纹理等),只留下需要的字符信息和少量杂质。 (责任编辑:qin)