六种家畜乳氨基酸特征聚类分析
我国牛羊乳业高速发展的同时,马、骆驼、牦牛和水牛等家畜乳也得到区域性开发。特种家畜乳因风味独特、营养价值高和产量低等特点,极易被低价位牛羊乳或其他原料掺假或冒充,破坏乳的完整性、真实性及功能属性[1]。不仅侵害消费者健康和尊严,也破坏正常市场竞争秩序,更不利于民族和地区特种家畜乳业健康发展[2]。乳是人类膳食蛋白质及氨基酸(amino acids,AA)的重要来源,哪种乳蛋白更接近人体,尤其是哪种乳更符合婴幼儿的必需氨基酸(essential amino acid,EAA)模式,成为亟待解决的重要问题。随着化学计量学及食品组学大数据检测分析技术的不断发展,各种家畜乳AA特征及营养价值的微妙差异应该重新探讨、认识和评价。
乳蛋白质和肽存在物种特异性,可用于乳的物种来源真实性判别。吴亚君等[3]利用毛细管电泳技术比较了牛和羊乳蛋白电泳图谱,发现牛和羊乳的电泳图谱存在差异。马露[4]报道了马、山羊、驼和牦牛4种家畜乳蛋白的反相高效液相色谱图存在种属特异性,利用其图谱可以很好地区分乳的物种来源。EL-HATMI等[5]通过聚丙烯酰胺凝胶电泳技术比较了牛、山羊、驴、骆驼和人乳乳清蛋白的电泳图谱,发现可判别乳样的物种真实性。但不同动物乳蛋白质或肽水解获得的AA,是否还存在物种或其他分类特异性,这种特异性是否可以实现特种家畜乳完整性和真实性判别,有待进一步研究。乌恩其[6]以组织液中的免疫球蛋白G(immunoglobulin G,IgG)为目标物种特异蛋白,建立用经典免疫学方法检验牛、羊和骆驼肉中掺假的马肉、鸭肉和猪肉等;乳中也含IgG,因此以IgG为目标蛋白也可检测高价格特种家畜乳中掺假牛乳。近些年有研究开始借助化学计量学研究食品营养素组或营养素指纹,如氨基酸指纹、脂肪酸指纹与物种特异性及其他决定和影响因素的关系模型。郭军等[2]提出了以脂肪酸和氨基酸指纹进行原奶和液态乳真实性的鉴别方法。吕中旺等[7]对牛、山羊、水牛和牦牛4种家畜乳AA进行主成分分析(principal component analysis,PCA),发现不同家畜乳有分离趋势,但未进行建模验证。郭珍琪[8]和张鑫等[9]利用化学计量学研究不同家畜乳的脂肪酸组成,发现家畜乳的脂肪酸构成存在显著的物种差异,同时也发现脂肪酸构成也与饲养模式及加工等分类因素有关。SMIDDY等[10]利用牛、水牛、绵羊、山羊、驴、马和驼乳的甘油三酯做PCA,结果显示家畜乳在得分向量图中明显分离,且聚类特征符合物种分类学规律,刘宇婷等[11]也印证了同样的结果。
传统描述性统计和差异检验的基本数学原理和构架基于单变量和数据的线性规律,无法对多指标、向量、矩阵等大数据进行分析。多变量统计学和化学计量学的发展为解析和挖掘数据串、数据矩阵等大数据结构和隐藏的规律模式、利用食物大数据描绘和分类食物提供了无限的可能[2]。本研究旨在利用现代化学计量学聚类和判别分析手段,探索和比较牛乳和特种家畜乳AA整体特征,同时相对于人乳必需氨基酸模式,利用新的策略和手段筛选AA更接近人乳的乳种类,以期为乳及乳制品数据库的健全、特种家畜乳的开发与利用提供理论依据。
1 材料与方法
1.1 实验材料
1.1.1 乳样
从内蒙古、四川和广西地区采集代表性乳样55份。其中荷斯坦牛(牛)乳15份,采自内蒙古巴彦淖尔和呼伦贝尔;蒙古马乳15份,采自内蒙古呼伦贝尔、锡林郭勒和鄂尔多斯;驼乳10份,采自内蒙古阿拉善和呼伦贝尔;山羊乳5份,采自内蒙古鄂尔多斯;牦牛乳5份,采自四川红原地区;水牛乳5份,采自广西南宁。样品采集后分装于离心管,密封并用液氮迅速冷却,冻藏于-20 ℃冰柜备用。样品置室温解冻后,均质取样用于AA的测定。每个乳样2次平行测定的AA值都用于聚类分析。
1.1.2 药品试剂
17种AA混合标准品,美国Sigma公司;CDAA-270019-200 mg L-色氨酸,上海安谱实验科技有限责任公司;浓盐酸(优级纯),国药化学试剂有限公司;甲醇(色谱纯)、冰乙酸、异丙醇(色谱纯)、氢氧化钠(优级纯),麦克林化学试剂有限公司;茚三酮、钾钠缓冲液、BUFFER A-1、BUFFER B-1、再生液,赛卡姆(北京)科学仪器有限公司。
1.1.3 仪器设备
S-433D全自动氨基酸分析仪,德国赛卡姆公司;HN200多功能氮吹仪,海能仪器。
1.2 实验方法
1.2.1 氨基酸测定
参照GB 5009.124—2016酸水解法测定17种AA(除色氨酸),参照GB/T 15400—2018碱水解法测定色氨酸。每个样品做2个平行,使用S-433D全自动氨基酸分析仪进行测定。色谱条件:使用水解氨基酸分析柱LCAK06/Na(4.6 mm×150 mm);柱温58~74 ℃梯度控温;反应温度130 ℃;流动相流速0.45 mL/min;茚三酮流速0.25 mL/min;检测器440 nm/570 nm双波长检测器;进样体积50 μL。
1.2.2 统计分析
本研究乳样2轮测定都直接用于分析,即55份乳样,进行2轮平行AA测定,获得110组数据,进行数据整理和质量检验,剔除了4组界外数据,有106组数据用于描述性统计和后续的聚类分析。平行测定数据纳入聚类分析,等同于引入和观察测定变异的影响,可增加模型稳健度。
以联合国粮农组织/世界卫生组织(Food and Agriculture Organization of the United Nations/World Health Organization,FAO/WHO)2007发布的935号报告中的混合人乳AA数据进行参照和比较研究[12]。
EAA模式以色氨酸含量为1分别计算其他EAA相应的比值[13]。
用IBM-SPSS 20.0进行描述性统计和差异检验,对6种家畜乳18种AA绝对含量、百分含量和EAA模式数据的整体差异均进行配伍方差分析,每种AA绝对含量和百分含量在物种间的差异做单因素方差分析,结果用表示。用化学计量学软件Pirouette 4.5(美国Infometrix公司)对AA百分含量及EAA模式数据分别进行PCA,观察乳样的自然聚类特性,探讨以AA建模判别乳的物种真实性的可行性,以及判断哪种家畜乳AA或EAA更接近人乳。并利用AA百分含量建立软独立建模分类(soft independent modeling of class analogies,SIMCA)判别模型,对被检乳样及人乳数据进行有监督的分类/判别分析。SIMCA模型内部验证:用所有55份乳样2个AA平行测定值(剔除4个异常值,即106组数据)进行建模,再对建模乳样物种进行鉴定(软件可自动完成);SIMCA模型外部验证:人工随机抽出10~12组数据,用其余94~96组数据建模,对抽出的样本数据进行判别;这种随机组合建模验证重复20次;人乳数据不参与建模,仅用于判别。累计验证样本221组。
2 结果与分析
2.1 六种家畜乳氨基酸特征
6种家畜和人乳AA绝对含量(mg/g)描述性统计结果见表1,AA百分含量[AA/总氨基酸(total amino acid,TAA),%]统计结果见表2,PCA结果见图1。
2.1.1 氨基酸绝对含量特征
6种家畜乳AA配伍方差分析整体差异极显著(P<0.01),每一种氨基酸在物种间均有差异。TAA(相当于总蛋白)含量由高到低依次为:牦牛和水牛乳(差异不显著)、山羊乳和驼乳(差异不显著)、牛乳和马乳。家畜乳TAA含量均高于人乳,其中牦牛乳TAA含量约为人乳的5.4倍;马乳最稀薄,TAA约为人乳的1.7倍。6种家畜乳EAA/TAA均达41.75%以上,EAA/NEAA均达71.86%以上,都符合并高于FAO/WHO理想蛋白相应指标40%和60%的标准[12];计算FAO/WHO公布混合人乳EAA/TAA为42.96%,EAA/非必需氨基酸(nonessential amino acid,NEAA)NEAA为75.32%。
6种家畜乳EAA中含量最高的为Leu,其次为Lys和Val;NEAA含量最高的为Glu,其次为Pro和Asp;牦牛乳中Leu、Phe、His、Lys、Gly、Ala和Arg含量显著或极显著的高于其他5种家畜乳。水牛乳中Thr、Asp、Glu、Cys和Tyr含量显著或极显著高于其他5种家畜乳。山羊乳中Trp含量显著高于其他5种家畜乳。
表1 六种家畜乳和人乳AA含量 单位:mg/g乳样
Table 1 Amino acid in six animals milk and human milk
注:*表示FAO/WHO 公布的混合人乳数据[12](下同),每一种AA做单因素方差分析,不同小写字母表示差异显著或极显著,6种家畜乳以AA均值做配伍方差分析(下同),TAA值行标注不同大写字母表示差异极显著(P<0.01)
2.1.2 氨基酸百分含量特征
6种家畜乳和人乳AA%结果统计见表2。对AA%均值的配伍方差分析,物种间无显著差异(P=1.000),而在PCA和SIMCA分析均清晰显示家畜乳以AA构成聚类符合物种分类学规律,说明传统统计对AA%整体差异不敏感。
牛乳中Lys%含量显著高于其他5种家畜乳;Leu%显著高于马、山羊、牦牛和水牛乳,与驼乳无显著差异。牦牛乳中Pro%显著高于驼乳、山羊乳、水牛乳、牛乳和马乳。水牛乳中Glu%显著高于其他5种家畜乳。山羊乳中Thr%、Val%、Phe%和Trp%显著高于其他家畜乳,其中Trp%约为其他5种家畜乳的1.2~1.5倍,牛乳含量最高,驼乳和马乳次之,牦牛乳最低。驼乳中Met%、IIe%和Leu%含量高于其他家畜乳。马乳中His%、Asp%、Ala%和Arg%显著高于其他5种家畜乳,Ser%显著高于水牛、牛和牦牛乳,与山羊乳无显著差异。人乳中Trp%、Gly%、Cys%和Tyr%高于6种家畜乳。
表2 六种家畜和人乳氨基酸百分含量(氨基酸/总氨基酸) 单位:%
Table 2 Amino acids percentage of six animals and human milk (AA/TAA)
注:物种间无显著差异(P=1.000)
家畜乳和人乳AA%的PCA结果见图1-a。6种家畜乳样在三维空间自然聚类的距离远近符合物种分类学规律。牛、牦牛、水牛和山羊乳4种牛科聚类同一区域(主因子1和主因子2相区),而马乳和驼乳分布在另外2个区域:同属偶蹄类的驼乳样品在主因子1轴下侧与牛科动物对应,但距离较远;马乳分布在偶蹄类对面,距离较远。人乳空间投射点距家畜乳聚类群较远,相对而言人乳与马乳最接近,说明不同物种乳样的AA特征存在显著差异。主因子1集合的AA共性(聚类贡献)仅为44.6%,而主因子2和3分别为16.9%和10.3%,说明动物乳中AA间的相关性并不大。
由图1-b可知不同乳样的特征氨基酸,人乳为Trp、Cys、Asp和Arg,马乳为Ala和His,驼乳为Ile和Leu,山羊乳为Ser和Phe,牛乳为Lys,牦牛乳为Pro,水牛乳为Glu,与AA%的描述性统计结果基本一致。
2.2 六种家畜乳必需氨基酸模式分析
6种家畜乳和人乳EAA模式值统计结果见表3,所有乳样EAA模式值的PCA结果见图2。6种家畜和FAO/WHO发布的混合人乳EAA模式值均值配伍方差分析差异极显著(P<0.01)。家畜乳EAA中含硫氨酸(Met+Cys)模式值最接近人乳,其他EAA值均高于人乳。从EAA模式值的总均值来看,山羊(4.57)和马乳(4.63)最接近人乳(3.14),其他动物乳EAA模式值均值为人乳的1.8~2.2倍。
a-得分向量图;b-根向量图
图1 六种家畜和人乳氨基酸PCA
Fig.1 PCA of amino acids of different specie milk
EAA模式值PCA结果显示,6种家畜乳相对集中,与人乳距离远,说明人乳EAA模式与动物乳差异大。主因子1集合了EAA共性为89.9%,说明EAA相关性较大,而主因子2仅聚集了7.8%的EAA共性。在主因子1轴上,山羊乳、马乳与人乳分布距离最接近,其次是牛乳、驼乳、水牛乳和牦牛乳,与EAA模式的配伍方差分析结果一致,也与EAA模式值的总均值分析结果一致。显然PCA结果更直观。
6种家畜乳和人乳中9种EAA的构成比例由高到低依次为Leu、Phe+Tyr、Lys、Val、Ile、Thr、His和含硫氨酸,其中含量较少的EAA有Trp和含硫氨酸,属于限制性AA。
表3 六种家畜乳和人乳的氨基酸模式
Table 3 Amino acid patterns in six livestock milk and human milk
注:对乳样的EAA模式进行配伍方差分析,同行不同小写字母间差异极显著(P<0.01)
图2 六种家畜乳和人乳的氨基酸模式PCA
Fig.2 PCA of amino acid patterns in six livestock milk and human milk
2.3 六种家畜乳SMICA模型的建立及判别
家畜乳AA构成和EAA模式的PCA均证明家畜乳AA构成存在显著的物种特异性,乳样的自然聚类符合这些哺乳动物物种分类学亲缘关系。但PCA实际上不是分类和判别分析的专用工具,因此本研究进一步利用家畜乳AA%数据建立了SIMCA判别模型(图3),对6种家畜乳进行有监督的聚类分析,物种判别模型效果见图3-a。6种家畜乳样在SIMCA模型图中的聚类符合物种亲缘远近。牛、牦牛、水牛和山羊乳4种牛科家畜乳的云图分布于同一相区,共同聚类于三维图右上方;同为偶蹄类的驼乳聚集在PC1轴对面,但与牛科动物聚类很远。而马属动物的蒙古马乳聚类云出现在三维图左侧(PC1轴负值侧),与偶蹄类对应,距离较远。总之,SIMCA结果与PCA一致,但作为有监督的聚类和判别分析方法,SIMCA的效果更好。
a-牛乳、马乳、驼乳、山羊乳、牦牛乳、水牛乳;b-人乳
图3 不同物种乳样氨基酸的SIMCA模型
Fig.3 Amino acid fingerprint SIMCA model of milk samples of different species
SIMCA模型内部验证和外部验证的样本集及验证结果见表4。用55份乳样平行测定结果建立的模型逐一对每个样品判别,即内部验证,结果准确率为100%;多次随机抽出一部分样品数据,用剩余的样品建立模型,再对未建模样品进行判别,即外部验证,累计进行了221个样品,共判别正确205个,判别正确率为92.76%,外部验证错误出现在牛科动物乳的判别中,其中牛判别错误最少(表4)。将人乳样品放入SIMCA模型进行外部验证,人乳判别为“0”,判别图周围未出现任何动物乳聚类云(图3-b),即未被判别为任何一类动物乳序号(判断正确),进一步证明其AA构成与6种家畜乳都不符合。
表4 SIMCA验证内部和外部模型
Table 4 Internal and external verification on SIMCA model
注:-表示人乳不参与建模
3 讨论
蛋白质和肽存在的物种特异性,不仅取决于蛋白质的AA排列顺序,更取决于蛋白质复杂的四级空间结构。蛋白质水解产生的18种AA,在不考虑其排列顺序和基因决定的排列规律的情况下,也存在显著的物种特异性。动物和植物蛋白AA构成差异很大,因此营养价值的差异也很大。而亲缘非常相近的动物,尤其是不同动物乳蛋白水解产生的AA构成也存在很大的物种差异,按目前的传统统计和营养学评价,较难说哪种动物乳蛋白或AA的营养价值更高。即便是存在差异,也不能被很好地观测和表达。不同家畜乳蛋白含量(TAA含量)显著不同,显然其AA绝对含量差异很大,但蛋白质的主要营养价值取决于其AA的比例构成,决定于EAA模式,实际取决于其是否已接近人体的需要模式[13-14]。因此按照人乳的EAA模式进行评价比较贴切。化学计量学理论及软件分析技术的发展使得多指标、数据组和数据矩阵等大数据潜藏规律和模式的直观分析有了无限可能,也有必要对乳蛋白AA指纹特征展开新一轮的研究和评价,为乳及乳品,以及其他食物营养价值评价,完整性和真实性判别引入新策略、原理和方法。
本研究发现6种家畜乳AA绝对含量存在极为显著的物种差异,家畜乳TAA含量为FAO/WHO混合人乳的1.7~5.4倍;EAA/TAA和EAA/NEAA分别在41.75%、71.86%以上,高于FAO/WHO发布的理想蛋白标准[12],因此按照传统的蛋白质AA评价指标,各种动物乳蛋白都是优质蛋白。不同家畜乳AA%整体相近,配伍方差分析无显著差异,这与高玎玲等[15]研究结果一致。PCA可直观看到不同家畜乳在三维空间自然聚类符合物种分类学规律,牛、牦牛、水牛和山羊乳4种牛科聚类同一区域,马乳和驼乳远远分布在另外2个区域。人乳空间投射点距家畜乳聚类群较远,说明人乳和家畜乳AA存在显著差异,这与ROUCHER等[16]传统统计分析研究结果一致,但PCA更加直观。郭军等[2]、高玎玲等[15]和孙慧阳[17]研究团队分别报道了乳AA的PCA可区分物种,但并未观察到以AA聚类可达到符合物种分类学规律的效果。明确了乳AA存在种属差异,挖掘其AA的具体差异就更加明朗了,传统统计不太确定的规律也可得到PCA的印证。乳中氨基酸组成比例存在种属特性,PCA和SIMCA分析根向量图(载荷图)及分析软件中的“建模能力”都可直接观察到每种家畜乳的特征AA:山羊乳为Thr、Val、Trp和Phe,其Trp最接近人乳;马乳为His、Asp、Ala、Ser和Arg;驼乳为Met、IIe和Leu;牛乳为Lys,且与描述性统计相互印证。古丽巴哈尔·卡吾力等[18]和李文婓等[19]检测马、驼、牛和山羊乳蛋白AA,并进行了传统统计学分析。聚类分析和描述性统计,各有优缺点,前者虽然直观,但适合多分类样本研究,不适合单个样品及单因素分析。
氨基酸的营养价值不仅取决于“量”的水平,同时还受EAA所占比例等“质”的影响。家畜乳EAA模式与人乳EAA模式越接近,蛋白质营养价值相对较高[13]。PCA发现山羊和马乳EAA构成最接近人乳,说明其EAA被机体利用程度高于其他4种家畜乳,这可能是山羊乳乳清蛋白、马乳酪蛋白与人乳接近的原因[4, 20]。PCA与EAA模式数据总均值(表3)可相互印证,但实际上传统营养学评价中通常并无以EAA模式总均值对比的习惯。
近年,判别分析逐渐应用于食物的真实性判别。MARIO等[21]用奶酪的近红外光谱数据建立SIMCA模型,发现掺假物有明显分离,模型可用于食物真实性判别。WANG等[22]证实了多元素分析方法可作为表征肉类来源的工具。姬彩霞等[23]论证了以牛肉脂肪酸指纹建立模型判别放牧和舍饲牛肉的可行性。本研究构建特种家畜乳SIMCA模型,将平行测定数据纳入聚类分析,等于引入和观察测定变异的影响,可增加模型稳健度。乳样的聚类符合物种亲缘远近,结果与PCA一致,但监督的聚类分析效果更好。内部和外部验证准确率分别为100%、92.76%,证明利用AA建立家畜乳物种真实性判别模型是可行的。外部验证错误出现在牛科动物乳判别中,这可能是种属亲缘性的原因,应建立牛科动物的专用判别模型。此外AA组成还受家畜品种、胎次、年龄、泌乳期、饲养状况、地区、季节和灭菌方式等因素影响[24-27],后续应扩大样本,以期建立更稳健的家畜乳判别模型。
4 结论
6种家畜乳AA绝对含量和相对比例构成和EAA模式都存在物种差异。以18种AA聚类特征符合物种分类学规律,牛、牦牛、水牛和山羊4种牛科动物乳聚类同一个相区,马乳和驼乳远远分离。6种动物乳按18种AA构成,马乳最接近人乳;按EAA模式山羊和马乳与人乳相对最接近。
以AA构成建立模型,判别家畜乳真实性可行,家畜乳18种AA建立SIMCA物种判别模型,内部和外部验证准确率分别为100%、92.76%;外部验证错误出现在牛科动物乳判别中;人乳与6种家畜乳都不符合,再次说明人乳AA与动物的差异很大。化学计量学聚类分析比传统描述性统计和营养学评价更能直观全息呈现乳的AA整体特征,为评价乳品营养和真实性提供了创新策略、原理和方法,同时也为乳制品数据库的健全和特种家畜乳的开发与利用提供参考依据。