欢迎访问职称论文网!
科技论文

智能应答短信平台的自动应答功能

智能应答短信平台需要解决的关键技术包括建立专家数据库和设计短信分类器。

短信分类器借鉴文本数据挖掘[5-6]、BP神经网络[7]、垃圾短信过滤经验。短信分类是指根据标记的训练短信集合,找到内容属性(特征)和短信类别之间的关系模型(分类器),然后利用这种学习关系模型判断新短信的类别。从数学的角度来看,短信分类是一个映射过程。映射规则f是系统根据各类样本的数据信息,总结分类规则建立的判断公式和判断规则。随着类别集合Y的不断扩展,映射规则f也相应地发生了变化。短信分类器的工作流程包括两个步骤,即建立分类规则和短信分类。首先,建立分类规则,给定训练短信集;然后,统一表示训练集的文本,常用的是向量空间模型(VectorSpaceModel,VSM)表示法,然后通过特征提取降维;最后,通过各种分类模型建立分类规则;然后是短信分类过程,给出一条新的短信,在向量表示和特征提取后送入分类规则进行判断,输出文本类别(一个或多个)。在人工神经网络中,对分类结果不明确的结果进行第二次竞争,对结果进行排序,筛选出最佳分类结果。特征提取主要分为四个步骤:短信预处理、分词、去噪和短信文本特征表示。短信预处理是指根据短信内容处理一些乱码、符号等。一般来说,通过编写正则表达式,可以根据实际需要匹配贪婪或非贪婪,去除一些符号,如“#%*”。分词的过程类似于验证码识别技术中的分割技术。根据短信内容,将短信文本分为一些有意义的关键词(如农业技术推广、果树、出现和病虫害),便于与专家数据库匹配。去噪处理是指去除或统一短信中含有“噪声”数据的数据,即删除与短信真正需要表达的含义相差甚远的数据。例如,去除中文语气词“啊,啊,撒”和英文中的“hi,hello中文近义词“水果,水果”统一表示为水果。短信文本特征是指在特征空间中量化短信内容,方便后续特征提取和降维,筛选出真正能传达农民意图的向量属性进行分类。

智能应答短信平台中的专家数据库通过数据库接口模块与短信平台的数据库进行通信,是短信平台自身数据库的扩展。专家数据库的建立主要分为两部分:数据表设计和触发器设计。专家数据库中的数据表字段主要分为待匹配问题、解决方案、查询率和优先级。

首先,应建立匹配问题和相应解决方案的比较数据表。匹配问题字段的数据源来自短信平台。通过群发功能向广大农民征集的短信意见,通过短信分类器处理存储在短信平台自身数据库中的记录,以及高级专家在相关研究领域遇到的新问题或成果。匹配问题字段只记录问题分类,并通过分类索引与描述问题特征的数据表进行匹配。描述问题特征的数据表可以参考汉语写作习惯,并以主谓宾的方式插入数据。例如,一名农民发送了一条短信,“我的枣树不知道为什么吃了杀虫剂后仍然有昆虫”。数据表中对应的三个字段是“枣树”、“生”和“昆虫”。专家根据自己的时间表,抽出时间登录短信平台统一回答,建立稍大的专家数据库。

查询率是通过设置阈值来衡量查询率,记录最近一段时间提问次数与同一时间提问总次数之比。查询率高于阈值的被标记为热点问题,不等农民频繁询问,采用定期群发方案提醒农民注意;查询率远低于阈值的被标记为不受欢迎的问题。当系统负荷增加时,通过降低其优先级,暂时不处理,负荷恢复平衡。

优先级可以根据实际需要建立与查询率之间的算法,编写业务逻辑来控制优先级的大小,从而优化专家数据处理和相应的速度。专家数据库中的触发器主要触发轮询时间控制器扫描短信平台本身的数据库,以及负责在短信平台代码模块中发送短信的SendMessage()函数。轮询时间控制着专家数据库和短信平台自身数据库访问的频率。默认情况下,在农业闲置时,可以设置较长的时钟周期,在农业忙碌时设置较短的时钟周期,并用标志位置的标志激活状态。flag为0时,时间控制器处于休眠期;1时,开始工作。当触发器满足轮询时间控制器的时钟周期时,自动将flag标记位置1,触发轮询时间控制器。轮查时间控制器扫描并读入短信平台本身的数据库,记录并发送给短信分类器进行分类后,通过专家数据库给出解决方案,同时将短信置于已读,下一个时钟周期到来时不予处理。智能应答短信平台的自动应答功能是由专家数据库中的触发器根据条件发送Sendmessage()函数后发送的。根据触发器的触发条件,通过Sendmessage()函数发送到运营商网关进行后续处理。

加强农业技术服务体系建设,提高农业技术推广和农业信息服务能力,是各级农业技术推广部门正在思考的问题。智能应答短信平台有着广阔的应用前景。本文主要针对农民大量短信分类自动响应的解决方案,不涉及彩信的自动响应,对影响短信传输、造成短信服务中心网络堵塞的原因研究不够透彻。然而,我相信,随着3G技术的普及,国家对农业信息化的资本投资逐渐增加,SP服务提供商开发更多的应用服务来开发自己的用户,智能应答短信平台将为农业技术推广的农民提供更丰富的服务[8]。因此,考虑到农业信息短信服务平台的合理性和准确性,将物联网、云计算等新兴信息技术理念与短信平台相结合是未来的研究方向。


热门期刊