基于Android平台的移动终端有声可定位图像采集方法
摘 要: 随着智能移动通信和物联网技术的快速进步,各种数据采集及处理逐步从PC端向移动端转移。以Android系统的移动终端做平台,进行图像数据采集及处理,对于有声可定位图像采集方法是集语音、图像及基本信息(包括时间、地点、属性、图片大小等)为一体的多元素数据采集方法,图像储存文件类型为EXIF格式,以键值的方式进行图像文件数据存储。研究内容相对PC端的图像采集不仅方便快捷,又能全面的进行非文字型数据记录,应用范围广。
关键词: 移动终端; 有声可定位图像; EXIF格式; 多元素数据; Android平台
中图分类号: TN911.73⁃34 文献标识码: A 文章编号: 1004⁃373X(2016)19⁃0053⁃03
Abstract: With the rapid advances of the intelligent mobile communication and Internet of Things technology, a variety of data acquisition and processing are transferred from the PC terminal to mobile terminal. In this paper, the mobile terminal of Android system is taken as the platform for image data acquisition and processing. The multi⁃element data acquisition method combining voice, image and basic information (time, place, attribute, picture size, etc) is used to acquire the voice locatable image. The image storage file type is EXIF format, and the image file data is stored in the key value mode. In comparison with the method of image acquisition at PC terminal, the method studied in this paper is more convenient and efficient, can record the non⁃text data comprehensively, and has wider application range.
Keywords: mobile terminal; voice locatable image; EXIF format; multi⁃element data; Android platform
0 引 言
Android系统是基于Linux的自由及开放源代码的操作系统,Android操作系统就是对Linux内核、Linux设备驱动及Linux初始化过程的移植应用。本文以Android移动终端作为平台也是从其内部特性及使用广度为基础来选择的。
有声可定位图像采集可以准确、详细的以图片或视频形式进行记录,而传统的数据采集主要采用图像要素分离储存及数据库关联管理的方法,这种采集手段不仅处理过程繁琐,而且采集后数据同步管理困难,容易造成图像文件关联失败、信息错误等现象。本文的有声可定位图像采集是基于Android系统下图像采样、IMA⁃ADPCM编码及EXIF格式存储的数据采集系统,并推广应用于智能移动终端设备上,实现图像的快速、便捷、详细的信息多方位采集[1]。
1 Android平台的有声可定位系统模型
1.1 基于Android系统优势分析
Android是以Linux为核心基础的开源移动终端应用软件平台。因其开放性高,各软件开发企业或终端设备制造公司都可以以Android系统为基础研发软件、开发设备系统功能[2];Android系统网络集成性好,所以对于一些需要网络的应用或者定位功能的软件都可以用以终端服务,本文的有声可定位图像采集即应用了Android系统的GPS定位功能;Android功能扩展非常灵活,不仅可以应用在手机产品上,也可以应用于多种屏幕式有线、无线终端设备。
1.2 有声可定位图像结构模型
有声可定位图像采集方法归根结底是属于数据收集与处理的过程,是对移动性的场景或事发区域进行综合性的图像收集,而大多数移动性数据采集方法采用XML文件对数据结构进行扫描,或者像传统方法的数据关联性储存,这些方法实质上都是将收集的数据通过关联处理后再进行有层次的分离并储存,因此这种数据收集方法在调用该数据时会出现调用数据缓慢,调用数据信息不同步或者错乱等现象,并且这种存储方法也不利于数据的组织管理。通过对传统数据采集方法的分析,提出了图像信息可以综合性储存调用的方式即有声可定位图像采集方法,有声可定位采集方法弥补了传统方法的缺陷,使采集的图像数据更加全面,调用更加快捷、准确、灵活。有声可定位图像模型由图像、图像元数据、图像属性和图像空间信息四部分组成[3⁃4]。
如图1所示,图像及图像元数据属于图像采集的骨架,即基本信息,比如图像分辨率、焦距大小、曝光度、光圈等级参数等,而图像属性及图像空间信息就属于高级信息,也属于有声可定位图像采集的特有信息,主要包括图像数据数值、场景语音植入、拍摄方位及GPS位置信息等。
有声可定位数据采集方法在数据处理上采用EXIF格式(可交换图像文件格式)处理储存,EXIF图像格式是一种专门为数码相机拍摄而制作的图像文件,在数据记录及处理存储方面完全符合有声可定位图像采集,EXIF文件的储存格式遵从JPEG标准,JPEG格式是常用的图片存储格式,所有的JPEG文件以字符0xFFD8开头,并以字符串0xFFD9结束。文件头中有一系列0xFF_格式的字符串,称为JPEG标识或JPEG段,用来标记JPEG文件的信息段。0xFFD8表示图像信息开始,0xFFD9表示图像信息结束,这两个标识后面没有信息,而在中间的字符段中的其他标识紧跟一些信息字符,用来存储各种与图像相关的信息[5⁃6]。所以用EXIF处理储存的图像可读性高,适用范围广,而EXIF文件处理就是在JPEG文件的头部根植所谓的高级信息,JPEG格式的文件结构的头部是APP1⁃APPn标识段,而APP1标识段通常默认开启,其段内信息包括IFH,IFD及缩略图3部分,而其余APP段信息属于写入信息,可以用来储存音频、方位、GPS等数据,开启后可以根据需要开发使用,本文应用APP2标识段存储音频信息,以0xFFE2字符段开始标识,字符段内前两个字符用于区分标识信息,后6个字符用来存储语音信息[7]。为了避免标识段重复,用APP3标识段记录位置信息,而每个标识段的文件储存大小为64 KB,相同标识段可以多次建立储存,因此有声可定位数据处理需要用到APP1段内的信息及APP2,APP3段内的附加信息,图2为EXIF图像结构及标识段应用。
2 基于Android平台的有声可定位图像采集过程
2.1 图像采集总体设计
在Android系统的终端平台上,有声可定位图像采集主要应用摄像机、麦克风、GPS及电子罗盘等的硬件设备,通过摄像机获取现场图像,并将其作为基础,此时GPS及电子罗盘开始定位读写位置信息,GPS通过卫星定位解析拍摄地点的经纬度及地理名称,电子罗盘获取镜头拍摄的方位信息(方向角、俯仰角和翻转角)[8],将记录信息写入载体(即以图像为主的基本信息),麦克风通过录入功能将获取的语音文件进行编码,存储到EXIF的APP2标识段中,再经Android SDK功能和定义好的EXIF综合存储过程进行兼容性匹配,生成JPEG格式的有声可定位图像文件。
2.2 综合数据融合过程
以摄像机采集的图像作为载体,将其他采集的数据有顺序的录入到图像编码器中。而位置信息及时间方位信息的数据录入相对简单,并且现在的智能终端设备都已经得到应用,相对于位置、时间、空间等信息,语音信息的写入过程比较复杂,因为移动终端内存存储有限,而语音信息文件又比较大,对于一些无线终端设备,语音模块的融合将直接影响到有声可定位图像的利用率及传输效率,所以就想到语音文件的压缩再处理,在数据压缩处理时,考虑用香浓⁃范诺编码,这种压缩算法又叫无损压缩算法,在本课题中应用这种算法可以将音频信息无损压缩,在调用时经解码还原,可以达到录入时的音频效果,但最大的问题是压缩还原过程中耗费时间,不能起到快捷方便的调用效果[9⁃10]。考虑到EXIF格式中有IMA⁃ADPCM语音编程算法,可以将采集的语音信息进行数据压缩,IMA⁃ADPCM语音编码虽然是一种有损压缩算法,但本文有声可定位图像采集对语音模块的音质效果要求不是很高,所以有损压缩算法可以满足对语音模块的需要。
语音数据的采集融合过程就是将采集后的无压缩语音信息进行量化,形成PCM数据,通过IMA⁃ADPCM编码器将PCM数据压缩得到压缩数据,再根据自定义好的APP2段进行编码储存,经EXIF格式系统性融合,就形成了有声图像。整个有声可定位图像采集流程图,如图3所示。获取音频文件并设置采样频率、声道、采样倍数、缓冲区等基本参数,建立元文件,调用麦克风采集语音,对语音文件量化处理形成PCM数据储存,调用EXIF模块的IMA⁃ADPCM编码对储存PCM数据压缩,生成IMA⁃ADPCM编码数据,由于APP2标识段内存的限制,所以应用程序判断语句判断IMA⁃ADPCM编码数据是否大于64 KB,若大于64 KB,则EXIF可创建多个APP2标识段进行语音文件储存。
3 基于Android系统的图像采集实现
3.1 有声可定位图像采集系统和移动终端平台的结合
有声可定位图像采集设计完成,需要在智能终端设备上实现,首先以该设计作为系统软件,以APP形式植入Android系统中,以Android为平台,实现有声可定位图像的采集、储存、调用。在这个APP软件中主要模块是有声可定位图像采集、无线传输、查询浏览模块。
用户启用APP进入图像采集界面,而这个采集界面和其他普通图像采集无太大区别,如图4(a)所示,在进行图像采集过程中,拍摄位置及拍摄方位会自动写入有声可定位图像中,而此时语音信息以录制原文件的形式暂存入移动终端内存中。当用户拍摄结束时,图像采集界面自动跳转到语音描述界面,如果用户不需要语音文件,则此界面可直接跳过,而语音文件也会消失,形成可定位普通图像。若用户需要语音信息,则在此界面开启语音录入功能,就可以形成有声可定位图像。当用户调用图像时,可以点击图像浏览界面标识,有声可定位图像采集系统会自动提取当前图像的位置、方位信息及语音信息。
3.2 图像采集系统数据信息准确性验证
有声可定位图像采集系统的各种录入信息要准确,而这些图像信息需要验证的就是EXIF图像格式内部标识段的完整性,本文验证方式采用十六进制查看器对其数据的完整性、正确性进行验证,通过数据解析,验证EXIF数据结构的完整性及关联稳定性,图像验证从0xFFD8开始,接着验证APP1标识段内的图像信息、图像分辨率、焦距大小、曝光度、光圈等级等基本参数信息。图4(b)是有声可定位图像查看的基本信息界面。然后验证APP2段内的语音信息,在验证语音信息时,查看器只能对压缩后的语音数据进行检验,所以在语音验证环节,需要人为的检验音频文件是否清晰。接着就是验证APP3段内的拍摄位置、地点坐标及名称信息。这样,整个有声可定位图像采集文件就验证完成。
4 结 语
本文提出一种集综合图像、语音、地理位置及属性信息多元结构于一体的新型有声可定位图像系统模型,将此系统植入到基于Android平台的移动终端设备中,通过图像数据采集、EXIF图像格式处理、IMA⁃ADPCM编码压缩,最后融合储存成JPEG格式的图像文件。基于Android平台的移动终端系统可以成功地实现有声可定位图像采集,而这种图像形式不仅可以应用到科技探索、人文研究、自然灾害等大型应用中,也可以在人们日常生活中应用。像监控、旅游拍摄、公路摄像等。而且这种有声可定位图像采集通过验证功能,增加了采集系统的精确性和稳定性,有声可定位图像采集系统能正确地反映拍摄地点的综合性信息,做到了完全的场景空间还原,为应用者提供了丰富的数据源,简化了数据采集、处理及储存的过程,大大提高了采集调用的效率。
参考文献
[1] 王伟,张礼中,蔡子昭,等.城市环境地质野外调查数据信息化采集[C]//2010年城市地质环境与可持续发展论坛论文集.上海:中国工程院土木、水利与建筑工程学部,2010:551⁃555.
[2] SHAHIDUZZAMAN M M, NAZNIN M, RAHMAN A A U. Portable and secure multimedia data transfer in mobile phones using record management store [C]// Proceedings of 2010 IEEE International Conference on Computer Science and 1nformation Technology. Chengdu, China: IEEE, 2010: 364⁃367.
[3] 范忠诚,郑慧,幸刚鸿,等.基于Android系统的校园手机定位与信息采集平台的开发[J].科技信息,2013(20):255.
[4] 李文闯,章永平,潘瑜春.移动地理信息系统中的多源异构数据融合模型[J].计算机应用,2012(9):2672⁃2678.
[5] 张涛,张建军,郭波.基于使用可用度的k/N系统(m,N_G)维修策略分析[J].宇航学报,2009,30(1):395⁃401.
[6] 张鼎周,包雷,钱存华.基于共因失效的层次表决系统可靠胜分析与维护策略[C]//中国运筹学会可靠性分会第八届可靠性学术会议论文集.南京:中国运筹学会,2009:170⁃178.
[7] 吴勇,罗腾元,王美珍.可定位图像采集与检索方法研究[J].计算机工程,2014(7):207⁃211.
[8] 李屏.GIS在中学生地理空间思维能力培养中的应用[D].福州:福建师范大学,2015.
[9] 周园春,胡良霖 ,沈志宏,等.基于PDA的野外科考数据采集系统及其应用[J].科研信息化技术与应用,2008(1):76⁃82.
[10] 陈彬,陈建平,马克平,等.摄影定位法野外生物考察与数据管理[J].科研信息化技术与应用,2011(5):81⁃89.
推荐访问: 终端 有声 采集 图像 定位