东北农业大学隋晓楠教授等 | 人工智能驱动的植物蛋白精准加工与产品创新进展及未来趋势/中国食品科学技术学会

植物蛋白作为可持续食品体系中的重要功能配料，虽然应用潜力巨大，但是其提取与稳定化利用长期受到原料异质性、过程复杂性和质量波动性三重因素的共同制约。一是，原料差异显著，不同作物来源以及同一作物的品种差异，会导致蛋白含量与组成、亚基结构及其聚集状态存在明显变化，从而引起结构与功能性质（如溶解性、乳化性、凝胶性等）的系统性差异。二是，植物蛋白提取是典型的多变量耦合与非线性过程。无论是传统湿法提取，还是多种辅助/强化技术路线，提取效率与产品品质通常受到pH值、温度、时间、离子强度、酶用量以及传质/剪切条件等多种因素共同影响，并存在显著交互作用，使得“单因素最优”难以迁移到不同原料或不同工艺体系中。与此同时，工艺路线与资源约束的差异也会显著影响最终产品特性。三是，提取过程普遍面临产率/纯度、功能性、感官与稳定性难以兼顾的现实矛盾。为提升蛋白纯度与得率，常需要更强的溶出与分离条件，然而，这可能诱发结构变化并引起功能性质劣化；相反，若以降低成本与简化流程为目标，则可能带来残留组分与品质不稳定的问题。已有研究对多种商业植物蛋白粉的功能特性与感官特性进行系统表征，结果显示不同产品以及批次间存在明显差异与不确定性。

1.2 AI在植物蛋白提取条件优化中的应用

如图1所示，AI可通过“数据获取-过程建模-参数寻优-试验验证”的闭环流程，实现植物蛋白提取条件的快速优化与品质稳定化。

1.2.1 机器学习（Machine learning，ML）

ML模型【如随机森林、XGBoost、支持向量机（Support vector machine，SVM）、BP神经网络】已广泛用于预测植物蛋白提取过程的关键指标，包括提取率、蛋白含量、溶解性等，并可从多变量数据中识别主导因素与交互效应，从而显著提升试验设计与过程优化效率。

1.2.2 贝叶斯优化（Bayesian optimization，BO）

贝叶斯优化是一类概率驱动的迭代寻优策略，通常以高斯过程等代理模型刻画“参数-响应”关系，并通过采集函数在探索与利用之间自适应权衡，从而在目标函数难以显式表达（黑箱）且试验成本较高的场景下，用较少试验次数逼近最优条件。

1.2.3 遗传算法（Genetic algorithm，GA）

遗传算法是一种受自然选择与遗传进化机制启发的随机优化方法，通过选择、交叉和变异等操作对候选解进行迭代进化，从而在复杂、非凸或多峰问题中逐步逼近全局最优解。

1.3 AI驱动的原料筛选与成分预测

1.3.1 近红外光谱（Near-infrared spectroscopy，NIR）

近红外光谱具有快速、无损和适于在线检测的优势，与机器学习模型结合后，已成为植物原料中蛋白质含量及关键成分的高通量定量工具，可为原料筛选、批次分级与质量一致性控制提供数据支撑。

1.3.2 卷积神经网络（Convolutional neural network，CNN）

卷积神经网络具备从高维光谱/图像数据中自动学习特征的能力，尤其适用于高光谱成像等数据量大、维度高且特征复杂的场景，被广泛用于食品原料识别、作物品种判别与蛋白质含量预测等任务。

2 AI驱动植物蛋白加工中的技术创新

植物蛋白加工环节（如挤压成型、酶法改性与风味调控）具有典型的多变量耦合、非线性响应与质量指标多目标约束特征，传统“经验+少量试验设计”的优化模式往往难以兼顾效率与稳定性。近年来，人工智能通过过程数据采集、代理建模与智能寻优等手段，为植物蛋白加工提供了从“可预测”到“可控制”的新路径，推动产品开发从试错迭代向数据驱动的快速转变（图2）。

2.1 AI在挤压加工中的应用

2.1.1 数字孪生（Digital twin，DT）技术——在植物蛋白挤压中的应用

数字孪生通过传感器与在线检测获取关键过程数据（如温度、扭矩、压力、含水率等），在虚拟空间构建与物理过程同步的动态模型，从而实现对加工过程的仿真、在线预测与参数优化。

2.1.2 机器学习——预测质构

挤压过程中的质构形成受到原料组成（蛋白、水分、脂质、多糖等）、设备结构与运行参数（螺杆转速、温度梯度、含水率、喂料量等）共同影响，且响应呈显著非线性。机器学习能够从多源过程数据中学习“参数-性质”的映射关系，在自动化食品加工系统中的预测与控制方面具有突出潜力。

2.2 AI辅助酶解加工设计

酶解是植物蛋白改性与功能肽开发的重要途径，可通过控制水解程度与位点选择，实现对分子质量分布、序列特征与功能性质（溶解性、乳化性、起泡性、风味等）的定向调控。AI在酶解设计中的价值主要体现在3个方面：位点预测（指导可切割性）、风味预测（避免苦味/异味）和序列筛选（辅助设计低苦味肽）。

2.2.1 预测酶切位点

深度学习模型已在蛋白酶切位点预测中取得显著进展。DeepDigest（蛋白质酶切位点深度学习预测模型）通过融合CNN与长短期记忆网络（Long short-term memory network，LSTM），实现对多种常用蛋白酶剪切位点的高精度预测。DeepCleave采用DNN对特定蛋白酶（如半胱氨酸天冬氨酸蛋白酶和基质金属蛋白酶）的底物切割位点进行识别，在性能上优于传统机器学习方法。近期基于预训练蛋白语言模型与图神经网络的策略，进一步增强了对复杂位点的识别能力。除序列层面的位点预测外，将蛋白质三维结构特征与机器学习结合，以评估结构区域对水解的敏感性，可为“哪里更容易被切”提供结构依据。最新的UniZyme模型引入酶活性位点知识，以提升多类水解酶的位点预测精度，为酶解方案设计提供计算先导。这些方法为植物蛋白酶解从经验选酶/选条件向计算指导与试验验证相结合的范式转变提供了工具基础。

2.2.2 预测风味特征

酶解过程在提升溶解性与功能性的同时，常伴随苦味肽的生成等风味风险。基于AI/ML的建模可将酶解条件、理化属性（如疏水性、分子质量分布）与感官评分建立关联，实现对苦味风险的提前预警与参数优化。针对大豆分离蛋白水解产物的研究表明，结合感官、光谱与色谱等多源数据构建的机器学习模型能够预测苦味，并揭示其与理化特性之间的关系，为酶解条件选择与风味改善提供依据。该思路可进一步拓展到豌豆、蚕豆等蛋白体系，形成可迁移的酶解-风味预测框架。

2.2.3 辅助设计苦味肽

在序列层面，AI可结合生物信息学数据库与集成学习/深度学习技术，实现对苦味肽的识别与筛选，从源头降低风味风险。例如，iBitter-Stack多表征集成学习框架可用于苦味肽的鉴定，并提高识别准确性，为低苦味肽序列筛选提供高通量手段。结合2.2.1节的位点预测模型与2.2.2节的苦味预测模型，可构建位点-产物-风味联动的计算筛选流程，为酶解产物的风味与功能协同优化提供方法支持。

2.3 AI在风味控制与脱腥中的应用

植物蛋白食品常存在“豆腥味、青草味”等不良风味，其来源包括原料固有的挥发性化合物以及加工诱导的脂质氧化产物，这严重影响消费者的接受度。构建可用于AI建模的风味数据基础，通常依赖气相色谱-质谱联用（GC-MS）等平台获取挥发性成分指纹，并通过化学计量学或机器学习提取关键标志物。

3 AI赋能植物蛋白在食品中的应用

3.1 质构、乳化、凝胶、消化性能的预测与设计

近年来，机器学习被广泛用于植物蛋白食品领域，如：基于原料组成、结构特征与加工参数，预测植物蛋白食品的关键功能属性，并为配方筛选和工艺决策提供量化依据。有研究表明，机器学习能够对复杂配料体系（如黄豌豆与羽扇豆的复配体系）的凝胶化行为、黏度、乳液稳定性与起泡能力进行定量建模，为非线性的结构-功能关系解析提供实证支持。在更具体的功能配料体系中，模型可基于表面疏水性、未变性蛋白含量等结构相关因子，预测不同植物蛋白（如大豆、豌豆、鹰嘴豆等）的溶解度、乳化能力与凝胶强度，从而支持多来源蛋白的对比评估与定向筛选。此外，在食品胶体体系中，监督与非监督学习方法被用于预测乳液稳定性、监测微观结构的演变并估算凝胶强度，为植物蛋白基乳状食品的配方设计与稳定性提升提供了新的方法路径。除加工与质构功能外，AI也开始进入营养评价环节。有研究构建了基于神经网络的深度学习框架，利用蛋白理化特征快速预测其消化性（R²≈0.91），从而显著加速传统体外消化试验的筛查过程（图3）。

3.2 植物基肉制品的设计

在植物基肉制品开发中，质构是决定消费者接受度的核心指标之一。基于真实产品开发数据构建的机器学习框架，可将配方组成（蛋白、脂肪、碳水化合物、灰分等）与加工相关特征纳入统一模型，实现对硬度、咀嚼性等质构指标的有效预测；同时借助特征重要性分析识别关键影响因素（如目标水分含量、碳水化合物与脂肪水平），为“少试验、快筛选”的配方优化提供可解释的量化依据。

此外，AI还可与智能寻优策略结合，用于面向目标质构的反向设计。例如，在大豆浓缩蛋白高水分挤出体系中，通过AI辅助优化（调节山梨醇浓度与水分含量等变量）获得可复现鸡肉/牛肉质构特征的定制化产品，并结合微观结构与蛋白二级结构表征对质地形成机制进行解析，从而实现对高水分植物肉质构的更稳定调控。这类“预测-寻优-验证”的闭环思路，为植物肉从经验配方走向可计算设计提供了可行路径（图3）。

3.3 新质蛋白应用中的拓展

AI可通过培养基与过程优化、结构与功能预测以及感官数据解析等方式，加速从生产到产品化的全流程迭代。以发酵蛋白为例，基于贝叶斯优化的迭代试验设计框架已用于培养基开发与产量提升，可在较少试验次数下逼近更优配方，显著提高研发效率。此外，将发酵过程条件特征与氨基酸序列信息结合的机器学习模型，可用于预测目标重组蛋白在大肠杆菌体系中的最大表达产量及相应的最优发酵条件。此外，AI可用于预测微生物代谢行为，并辅助优化反应路径与过程控制。这一方法同样可迁移到真菌蛋白等生产体系中，以提升生产效率、过程可控性与产品一致性（图3）。

4 跨尺度数字化：从分子到工厂的AI植物蛋白体系

植物蛋白体系同时具有原料异质性强，加工过程非线性，终产品指标多目标的特点，而单一尺度或单一模型往往难以解释并支撑工程优化。因而，一个更可行的思路是建立跨尺度数字化框架：在分子层面理解结构响应，在微观层面刻画聚集/界面/凝胶结构演变，在宏观层面建立加工-质构映射，在工厂层面实现在线监测与质量决策，从而形成可迭代的数据、模型、验证到决策的闭环（图4）。

5 挑战与展望

虽然人工智能在植物蛋白提取、加工与应用中展现出较大潜力，但是其进一步落地仍面临若干关键瓶颈。首先，高质量数据不足与标准化缺失是最突出的问题。植物蛋白原料来源广，批次波动大，加工路径与评价体系高度多样，不同研究在试验条件、表征方法与指标口径上不一致，导致数据难以整合、对比与复用，进而限制模型训练与跨场景应用。其次，许多高性能模型仍呈现明显的“黑箱”特征，可是解释性不足，使得模型难以回答“为什么有效”，也不利于指导机制验证与工艺放大。更重要的是，蛋白结构、微观结构演化与宏观功能之间的跨尺度关联机制尚未形成可迁移的统一框架，导致模型在更换原料、工艺或设备条件时预测不稳定，影响其工程可靠性。

未来研究可从以下方向推动AI在植物蛋白领域实现更实质性的突破：1）发展面向植物蛋白的多模态与跨尺度建模，将序列/结构信息、光谱与显微表征、理化与感官数据、加工参数等进行协同融合，提升模型对复杂体系的表征能力与泛化能力。2）推动AI与自动化试验平台/高通量表征深度耦合，形成“模型提出假设-自动化验证-数据回流更新”的闭环，加速新原料、新工艺与新质蛋白的筛选与验证。3）在产品开发方面，面向目标质构、风味与营养指标的逆向设计将逐渐成为主流思路，实现从“试出来”向“算出来再做”转变。4）随着数据基础与计算能力提升，面向全流程的智能制造与决策支持体系将不断完善，并推动植物蛋白专用大模型的探索，用于工艺推荐、试验设计、知识挖掘与经验迁移，从而提升研发效率与产业稳定性。

6 结语

人工智能正在为植物蛋白提取、加工与食品应用提供新的方法体系。即：通过数据驱动建模与智能优化，提升提取产率，改善风味，优化质构与结构形成，降低研发与生产成本等。尤其是面对原料差异大、过程非线性强、结构-功能关系复杂等难题，AI为“更快理解-更少试错-更稳放大”提供了解决路径。

从更长远的视角看，AI不仅是工具，还可能成为推动植物蛋白可持续发展的关键支撑。AI通过整合多源数据，开展跨尺度建模并形成可落地的智能决策，加速高质量植物蛋白与新质蛋白产品的开发，从而提升食品体系的韧性与可持续性，减少资源浪费。随着算法、数据与工业应用场景的逐步成熟，植物蛋白产业也将加速迈向以数据与智能为驱动的研发与制造新范式。

原文链接：https://kns.cnki.net/kcms2/article/abstract?v=H26UkN0bSyQcK36wqO9o4Z7XpYqFZ01NB-vuFlgDFdQc5JUsgPGZemIjd_Xm43GI_6IbIvlcYSX65xZJ0wfDGrxL34Y3kfsMmfOHVs98z5csmHJ5y6xKPw5hrhWbZcnvsVV4dBhsYv-diRyyalkuX7DFA35T0rq2SRlIjrj63uujcnu-e4PnIA==&uniplatform=NZKPT&language=CHS