[发明专利]能自动鉴别武夷岩茶产地的机器学习方法在审

专利信息
申请号: 201610915342.5 申请日: 2016-10-20
公开(公告)号: CN106560700A 公开(公告)日: 2017-04-12
发明(设计)人: 俞晓平;叶子弘;付贤树;崔海峰;张雅芬 申请(专利权)人: 中国计量大学
主分类号: G01N21/359 分类号: G01N21/359;G01N21/3563;G01N27/62;G01N30/02;G01N27/00
代理公司: 暂无信息 代理人: 暂无信息
地址: 310018 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及能自动鉴别武夷岩茶产地的机器学习方法,所述方法融合了近红外、稳定同位素、微量元素、氨基酸和电子舌等五大类数据,建立了神经网络ELM武夷岩茶产地分析模型,本发明属于地理标志产品真实性识别技术领域,其目的在于解决单种检测数据无法代表产地溯源全部关键信息和不同类型检测数据在计量学方法中联合使用的数据匹配等问题。本发明基于具有机器学习功能的ELM模型,将不同产地岩茶的近红外、稳定同位素、微量元素、氨基酸、电子舌等五大类数据融合在一起,五种融合数据组成的ELM模型识别率最高,达100.0%,远高于由单种数据组成的神经网络判别结果,且对盲样的识别率达100%,本发明方法具有较好应用前景。
搜索关键词: 自动 鉴别 武夷岩茶 产地 机器 学习方法
【主权项】:
能自动鉴别武夷岩茶产地的机器学习方法,所述方法包括:(A)采集不同产地岩茶样品:武夷岩茶产区外样品数>100份,且产区周边50公里范围内样品占比>50%;武夷岩茶产区内样品数为产区外样品的2~3倍,采样范围覆盖主要产区各生产企业,且每家企业应不少于3个样品;(B)测定不同产地岩茶样品的近红外特征光谱数据:近红外光谱检测,64次扫描,特征光谱条带取其平均值,扫描范围为12000‑4000cm‑1,数据点的间隔为1.928cm‑1,室温25℃,湿度保持稳定,无损检测,无需采用粉碎等前处理,采用相同加料方法、加料量,加料完毕即可进行检测;(C)测定不同产地岩茶样品的稳定同位素质谱数据:δ13C、δ15N、δ18O、δ2H、δ86Sr等稳定同位素含量由稳定同位素质谱仪测定,每个样品至少重复分析3次以上,取平均值作为最终结果;通过SVM‑RFE(支持向量机回归特征消去法)对武夷岩茶稳定同位素数据进行训练和预测,随机重复100次,并对各变量的模型特征进行排序,筛选出岩茶原产地的同位素特征变量排列顺序为氢、氧、氮、碳、锶;并利用预测集计算模型的灵敏度、分辨率、识别率增维精度,均按重复计算100次平均结果,由氢、氧、氮、碳四种数据组成的模型,其识别率最高,达93.93%,因此建模只需选择氢、氧、氮、碳四种数据,无需对锶等其他稳定同位素含量进行检测;(D)测定不同产地岩茶样品的微量元素数据干茶样品微波消解,消解完毕,观察消解液是否澄清,若浑浊,则重复压力消解步骤,若完全澄清,则定容后测定;用原子吸收光谱仪测定Ca、Mg、Mn元素含量,用电感耦合等离子体质谱测Ti、Cr、Co、Ni、Cu、Zn、Rb、Cd、Cs、Ba、Sr元素含量;通过SVM‑RFE法对微量元素数据进行训练和预测,随机重复100次,得到铯、铜、钙、铷、锶、钡特征排序顺序;然后对特征变量按自然序逐级进行组合,并利用预测集计算模型的灵敏度增维精度、分辨率增维精度、识别率增维精度,由铯、铜、钙、铷四者微量元素组成的模型,其识别率增维精度最高,说明此四种微量元素间的信息具有互补性,只需要选择建模的铯、铜、钙、铷四种微量元素进行检测即可;(E)测定不同产地岩茶样品的氨基酸数据:利用HPLC法对不同产地岩茶样品中的27种氨基酸进行检测,平行测定两次,取平均值;通过SVM‑RFE法对武夷岩茶氨基酸组分数据进行训练和预测,随机重复100次,并对各变量的模型特征进行排序,筛选出茶叶原产地的特征变量,并通过预测集计算每一维变量累加之后的模型增维精度,确定其排序顺序为天冬酰胺、脯氨酸、色氨酸、磷乙醇胺、丙氨酸、谷氨酸、丝氨酸;然后对特征变量按自然序逐级进行组合,并利用预测集计算模型的灵敏度、分辨率、识别率,由天冬酰胺、脯氨酸、色氨酸、磷乙醇胺四种氨基酸组成的模型,其识别率最高,说明此四种氨基酸间的信息具有互补性,只需要选择建模的天冬酰胺、脯氨酸、色氨酸、磷乙醇胺四种氨基酸进行检测即可;(F)测定不同产地岩茶样品的电子舌数据:本研究采用ASTREE Electronic电子舌系统,该套系统具有一个电极(Ag/AgCl)以及7个独立传感器(ZZ、BA、BB、CA、GA、HA、JB),电子舌系统使用前用NaCl和C5H8NO4Na标准溶液对传感器进行活化,并依次进行信号校准和仪器自诊断,自诊断通过后可进行样品滋味的分析检测,取各传感器最后十秒(第91‑100秒)稳定数据的均值作为检测数据进行后续分析;(G)能自动鉴别武夷岩茶产地的机器学习方法,所述方法融合近红外、稳定同位素、微量元素、氨基酸以及电子舌数据建立不同产地岩茶鉴别数据库:(1)将每条近红外数据(Y轴数据)拼接在Excel数据表格中,每行所有列数据组成每条近红外数据;(2)将每个样品的稳定同位素数据按氢、氧、氮、碳顺序拼接在近红外数据后,将微量元素数据按铯、铜、钙、铷拼接在稳定同位素后,将氨基酸数据按天冬酰胺、脯氨酸、色氨酸、磷乙醇胺顺序拼接在微量元素后,最后将电子舌7个独立传感器(按ZZ、BA、BB、CA、GA、HA、JB顺序)最后十秒(第91‑100秒)稳定数据的均值拼接在氨基酸数据后,武夷岩茶产区内样品组成的Excel数据表,以data1命名;武夷岩茶产区外样品组成的Excel数据表,以data2命名;(3)运行MATLAB软件中的edit功能,打开data1.xls、data2.xls,以Mat文件格式保存,文件名对应为data1.mat、data2.mat;(4)数据分割:参考R.W.Kennard和L.A.Stone在Computer aided design of experiments中的方法,随机选取武夷岩茶产区内总数的65~70%作为原产地内模型数A1,随机取武夷岩茶产区外65~70%作为原产地外模型数A2,建立kenstone分割程序;(5)能自动鉴别武夷岩茶产地的神经网络ELM模型建立:对步骤(4)数据分割后的融合近红外、稳定同位素、微量元素、氨基酸以及电子舌数据,采用神经网络分析并建立神经网络ELM模型;(H)取待测未知产地样品按照B、C、D、E及F步骤,测定近红外特征光谱数据、稳定同位素质谱数据、微量元素数据、氨基酸数据以及电子舌数据,将测得数据代入上述神经网络ELM模型,判断待测样品的产地属性。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国计量大学,未经中国计量大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610915342.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top