混合建模在基于數(shù)字孿生的實(shí)驗(yàn)設(shè)計(jì)中的應(yīng)用
生物過程的動(dòng)力學(xué)和相關(guān)的機(jī)械復(fù)雜性不包括在傳統(tǒng)的統(tǒng)計(jì)實(shí)驗(yàn)設(shè)計(jì) (DoE) 技術(shù)中,這些技術(shù)可以幫助研究人員找到生物過程的最佳條件。這些方法通常用于研究過程參數(shù)之間的相互作用,并確定每個(gè)參數(shù)對目標(biāo)響應(yīng)變量的影響的顯著性,例如滴定度和產(chǎn)量,特別是在合格的規(guī)??s小模型中,以量化跨規(guī)模的關(guān)鍵工藝參數(shù)的設(shè)定點(diǎn)和允許范圍。
近年來,以模擬給定生物過程為目的的數(shù)字孿生,即實(shí)際系統(tǒng)的數(shù)字虛擬復(fù)制,引起了GSK、Atos和Siemens等公司的極大關(guān)注。此外,數(shù)字孿生聯(lián)盟于 2019 年成立,以推進(jìn)數(shù)字孿生技術(shù)的學(xué)術(shù)研究以及工業(yè)應(yīng)用,并擴(kuò)大數(shù)字孿生的概念驗(yàn)證和試點(diǎn)計(jì)劃。
一種新的、有前途的方法涉及將基于知識的機(jī)械信息從數(shù)字孿生模型轉(zhuǎn)移到 DoE 方法以縮小實(shí)驗(yàn)邊界空間,從而顯著減少實(shí)驗(yàn)成本和生物反應(yīng)器優(yōu)化時(shí)間。在模型輔助 DoE 計(jì)劃的背景下,實(shí)驗(yàn)室實(shí)驗(yàn)被數(shù)字孿生模型取代,以根據(jù) DoE 策略預(yù)測響應(yīng)。然后篩選模擬結(jié)果,以確定新的實(shí)驗(yàn)空間,然后選擇新實(shí)驗(yàn)的性能。重復(fù)此過程,直到適當(dāng)?shù)卮_定最佳條件。具有 Monod 類型相關(guān)性的質(zhì)量平衡可用作生物反應(yīng)器(即數(shù)字孿生)的表示。作為一個(gè)典型的例子,M?ller 等人 (2019) 使用 DoE 方法為生物量、葡萄糖、谷氨酰胺、乳酸、氨和單克隆抗體集成動(dòng)態(tài)質(zhì)量平衡方程。這種基于模型的 DoE 策略用于優(yōu)化中國倉鼠卵巢細(xì)胞在批次和補(bǔ)料分批生物反應(yīng)器中的抗體生產(chǎn)。在這項(xiàng)研究中,初始邊界空間被選擇為三個(gè)可變因素,包括葡萄糖、谷氨酰胺和補(bǔ)液速率,以設(shè)計(jì)基于行列式或 D 最優(yōu)和綜合或 I 最優(yōu) DoE 技術(shù)的實(shí)驗(yàn)。與正交經(jīng)典響應(yīng)面方法不同,變量效應(yīng)在這些優(yōu)化設(shè)計(jì)中是相關(guān)的。D 最優(yōu)和 I 最優(yōu)設(shè)計(jì)分別最小化參數(shù)協(xié)方差和平均預(yù)測方差的決定因素。由于測量了多個(gè)響應(yīng),包括活細(xì)胞密度、抗體、乳酸和氨濃度,因此根據(jù)用戶定義的可接受響應(yīng)下限和上限創(chuàng)建了合意性函數(shù),以將多維優(yōu)化問題標(biāo)準(zhǔn)化為一個(gè)合意性功能。盡管模擬和實(shí)驗(yàn)設(shè)計(jì)在最佳補(bǔ)液速率以及補(bǔ)液中的葡萄糖和谷氨酰胺濃度方面對最佳條件給出了相同的建議,但模擬的用戶定義合意性函數(shù)與實(shí)驗(yàn)確定的用戶定義合意性函數(shù)存在偏差。這種不一致歸因于與機(jī)械模型相關(guān)的不確定性,因?yàn)橹挥兴膫€(gè)實(shí)驗(yàn)用于參數(shù)估計(jì),因此該模型無法反映過程變量的整個(gè)范圍。然而,這個(gè)例子說明了將機(jī)械洞察力應(yīng)用到 DoE 實(shí)驗(yàn)中的潛力。
圖7. 一種用于開發(fā)規(guī)??s小模型過程表征的、基于數(shù)字孿生的實(shí)驗(yàn)設(shè)計(jì) (DoE) 混合建模方法的示意圖。
混合模型也可以納入 DoE 實(shí)驗(yàn)中,它們可以在生物反應(yīng)器數(shù)字孿生模型中提供更準(zhǔn)確的參數(shù)預(yù)測。圖 7 顯示了基于模型的 DoE 與混合模型集成的示例。根據(jù)此工作流程,初始實(shí)驗(yàn)集(圖 7 I)首先在計(jì)算機(jī)中用于訓(xùn)練混合模型和優(yōu)化人工神經(jīng)網(wǎng)絡(luò)架構(gòu)(圖 7 II)。然后,根據(jù)關(guān)鍵過程參數(shù) (CPP) 的給定設(shè)計(jì)空間,將開發(fā)的混合模型用于響應(yīng)變量(例如,時(shí)空產(chǎn)量和生物量濃度)的動(dòng)態(tài)評估。在下一步中,使用過程模擬對結(jié)果進(jìn)行全面評估,以確定最佳 CPP 組合,給出最佳目標(biāo)響應(yīng)值(圖 7 III)。假設(shè)最佳 CPP 推薦已經(jīng)包含在實(shí)驗(yàn)集中,然后通過與實(shí)驗(yàn)數(shù)據(jù)的比較來確定最佳條件(圖 7 IV);否則,將從推薦的 CPP 獲得的新實(shí)驗(yàn)數(shù)據(jù)添加到訓(xùn)練數(shù)據(jù)集(圖 7 I),并重新訓(xùn)練混合模型(圖 7 II),重復(fù)優(yōu)化循環(huán),直到獲得實(shí)驗(yàn)和模擬之間的最佳一致性并且沒有生成新的 CPP 推薦(圖 7 V)。
用于規(guī)模放大的混合建模
前文所述的研究描述了混合方法在生物反應(yīng)器建模、控制和優(yōu)化以及規(guī)模縮小模型中的過程表征方面的潛力。為生物反應(yīng)器規(guī)模放大目的進(jìn)一步開發(fā)和應(yīng)用這些新興模型是一個(gè)具有重要意義的新課題,因?yàn)闉樾⌒蜕锓磻?yīng)器開發(fā)的純機(jī)械動(dòng)力學(xué)模型不一定能夠描述生產(chǎn)規(guī)模的狀態(tài)變量。相比之下,混合模型的更高靈活性可能允許進(jìn)行包括與規(guī)模相關(guān)的特征的調(diào)整。為此,可以使用小規(guī)模和大規(guī)模的測量來訓(xùn)練模型。此外,混合模型的數(shù)據(jù)驅(qū)動(dòng)部分可以配置為表示特定規(guī)模的變量。更重要的是,考慮到根據(jù)部分已知或未知的規(guī)則,參數(shù)范圍可能會(huì)在不同規(guī)模上發(fā)生顯著差異,因此包含數(shù)據(jù)驅(qū)動(dòng)模型可以提供一個(gè)補(bǔ)充組件,其中黑盒方法可以促進(jìn)生物反應(yīng)器的規(guī)模放大。使用基于數(shù)字孿生的 DoE 方法構(gòu)建具有代表性的規(guī)模縮小模型將提供有關(guān)關(guān)鍵過程參數(shù)和響應(yīng)變量之間交互關(guān)系的有見地的信息,從而加速優(yōu)化和表征研究。
在最近的一項(xiàng)研究中,開發(fā)了一系列混合模型結(jié)構(gòu)來預(yù)測 300 mL 搖瓶和 15 L 實(shí)驗(yàn)室規(guī)模生物反應(yīng)器中的活細(xì)胞濃度和產(chǎn)物滴度。人工神經(jīng)網(wǎng)絡(luò)被用作數(shù)據(jù)驅(qū)動(dòng)組件來估計(jì)該模型中的特異性增長率和產(chǎn)品形成率。為了測試用于預(yù)測 15 L 生物反應(yīng)器中細(xì)胞濃度和產(chǎn)物滴度的搖瓶混合模型性能的可轉(zhuǎn)移性,作者在搖瓶 DoE 數(shù)據(jù)上訓(xùn)練了該模型。該數(shù)據(jù)集還包括三個(gè) 15 L 生物反應(yīng)器實(shí)驗(yàn),以捕獲搖瓶和生物反應(yīng)器之間的特定比例差異,特別是 15 L 生物反應(yīng)器實(shí)驗(yàn)數(shù)據(jù)被用作設(shè)計(jì)中心點(diǎn)三次重復(fù)??傮w而言,結(jié)果表明該模型可以轉(zhuǎn)移到預(yù)測來自 15 L 生物反應(yīng)器的新過程數(shù)據(jù)?;罴?xì)胞濃度的歸一化均方根誤差 (10.92%) 較低,而滴度誤差較高 (17.19%)。這種誤差差異歸因于在 15 L 規(guī)模下獲得的一些更高的滴度值,這些值在訓(xùn)練數(shù)據(jù)中不存在。盡管這項(xiàng)研究展示了混合建模概念示例的極好證明,但仍需要進(jìn)一步研究來檢驗(yàn)這種方法在生產(chǎn)規(guī)模生物反應(yīng)器中的潛力,其中,細(xì)胞代謝與較小體積的生物反應(yīng)器(如搖瓶或?qū)嶒?yàn)室生物反應(yīng)器)的差異更大。
總結(jié)和未來展望
生物反應(yīng)器內(nèi)生化過程的復(fù)雜性要求研究人員從基于經(jīng)驗(yàn)法則和反復(fù)試驗(yàn)的工藝開發(fā)轉(zhuǎn)向更系統(tǒng)的數(shù)字化框架。這篇綜述概述了基于數(shù)字化的創(chuàng)新戰(zhàn)略,如果認(rèn)真實(shí)施,這些戰(zhàn)略將使生物制藥行業(yè)更有效地向大規(guī)模細(xì)胞培養(yǎng)系統(tǒng)發(fā)展。
此處回顧了生物工藝放大的三種方法,包括知識驅(qū)動(dòng)、數(shù)據(jù)驅(qū)動(dòng)或混合方法,每種方法各有優(yōu)缺點(diǎn)。盡管它們在歷史上被廣泛使用,但傳統(tǒng)方法是高度特定于過程的。相比之下,數(shù)字工具可以潛在地跨規(guī)模分析生物反應(yīng)器的性能,特別是在幾何形狀不同的反應(yīng)器方面,允許不同細(xì)胞系和產(chǎn)品之間的知識轉(zhuǎn)移,實(shí)現(xiàn)可比性和合并的定量評估,將工程設(shè)計(jì)參數(shù)和過程變量轉(zhuǎn)化為過程模型,盡管迄今為止幾乎沒有實(shí)際例子。
基于知識的研究將是該領(lǐng)域進(jìn)一步發(fā)展的關(guān)鍵。一系列數(shù)學(xué)公式已經(jīng)可用于描述生物藥物生物合成中涉及的基本機(jī)械步驟,提供對生物過程的更全面的理解。這種機(jī)制模型包含許多未知參數(shù),這些參數(shù)通常代表生理特征和參數(shù)估計(jì),通過合適的全局?jǐn)M合方法以及隨后使用統(tǒng)計(jì)推斷工具測量不確定性,在模型準(zhǔn)確性中起著重要作用。雖然這些模型已應(yīng)用于分析跨規(guī)模的過程動(dòng)力學(xué),但仍需要更高級的模型來整合生物反應(yīng)器設(shè)計(jì)參數(shù)的影響,這些參數(shù)對細(xì)胞代謝行為的影響因規(guī)模而異。要構(gòu)建這些模型,需要對細(xì)胞行為與規(guī)模相關(guān)因素之間的關(guān)系進(jìn)行深入的數(shù)學(xué)理解。這種方法將生成具有更多未知參數(shù)的高度非線性模型,其中參數(shù)之間的聯(lián)系并不為人所知或在數(shù)學(xué)上不相關(guān)。因此,為這些參數(shù)的可靠估計(jì)提供足夠的實(shí)驗(yàn)數(shù)據(jù)可能是一個(gè)進(jìn)一步的挑戰(zhàn)。
研究已經(jīng)提出了幾種可以幫助開發(fā)生物工藝的數(shù)據(jù)驅(qū)動(dòng)工具。引入多變量數(shù)據(jù)分析作為比較不同規(guī)模的生物反應(yīng)器過程變量和檢測任何偏離控制集的批次數(shù)據(jù)的強(qiáng)大技術(shù)。機(jī)器學(xué)習(xí)算法被描述為對生物系統(tǒng)的非線性特性進(jìn)行建模;鑒于規(guī)模依賴和非依賴性特征與生物反應(yīng)器中結(jié)果變量之間復(fù)雜的相互關(guān)聯(lián),這些工具具有廣泛使用的巨大潛力。盡管如此,當(dāng)預(yù)測變量的數(shù)量顯著增加時(shí),這些模型更有可能失敗,這表明可解釋性和特征提取技術(shù)對于識別最具影響力的預(yù)測變量和減少必須考慮的參數(shù)數(shù)量的重要性。我們還將遷移學(xué)習(xí)確定為一種有效利用從不同過程中獲得的數(shù)據(jù)的策略,例如各種細(xì)胞系或抗體產(chǎn)品,用于針對新工藝過程訓(xùn)練機(jī)器學(xué)習(xí)模型,特別是在數(shù)據(jù)不足可能成為問題的大規(guī)模工藝過程中。
本文中提供的示例顯示了數(shù)字工具在生物生產(chǎn)的不同領(lǐng)域(包括哺乳動(dòng)物和微生物系統(tǒng))的潛在應(yīng)用。此類示例包括 CHO 細(xì)胞生產(chǎn)單克隆抗體、微生物發(fā)酵和大腸桿菌生產(chǎn)蛋白質(zhì)或微藻細(xì)胞生產(chǎn)有機(jī)化合物。細(xì)胞農(nóng)業(yè)是另一種可能受益于數(shù)字生物生產(chǎn)進(jìn)步的新興技術(shù),因?yàn)閷?shí)現(xiàn)細(xì)胞農(nóng)業(yè)的可放大工藝將是一項(xiàng)艱巨的任務(wù),其中細(xì)胞增殖和分化過程需要保持規(guī)模。例如,生產(chǎn) 1 kg 肌肉細(xì)胞蛋白質(zhì)需要大約 8 ×10^12 個(gè)細(xì)胞的細(xì)胞擴(kuò)增。使用傳統(tǒng)的攪拌式生物反應(yīng)器獲得如此高的細(xì)胞數(shù)量需要 5,000 L 的規(guī)模。因此,在如此大的體積下為組織工程和間充質(zhì)干細(xì)胞建立實(shí)用的細(xì)胞擴(kuò)增方法是一項(xiàng)巨大的挑戰(zhàn)。因此,隨著 2019 年 Cultivated Meat Modeling Consortium (人造肉模型聯(lián)合會(huì)) 的成立,基于計(jì)算機(jī)的細(xì)胞農(nóng)業(yè)生物反應(yīng)器建模和分析的開發(fā)正受到相關(guān)行業(yè)機(jī)構(gòu)的關(guān)注,這些基于計(jì)算機(jī)的方法可用于協(xié)助解決來自從細(xì)胞系篩選到生物反應(yīng)器優(yōu)化的問題。
要釋放基于計(jì)算機(jī)的生物生產(chǎn)的全部潛力并從開發(fā)的早期階段取得進(jìn)展,需要克服廣泛的挑戰(zhàn)。最初的努力可能既費(fèi)錢又費(fèi)時(shí),但鑒于數(shù)字化轉(zhuǎn)型提供的更快價(jià)值實(shí)現(xiàn)時(shí)間、改進(jìn)的生產(chǎn)以及降低的風(fēng)險(xiǎn),預(yù)計(jì)從長遠(yuǎn)來看將獲得顯著的成本節(jié)約和競爭優(yōu)勢。盡管如此,鑒于全球?qū)ι镏扑幃a(chǎn)品的需求快速增長,我們相信未來五年將進(jìn)行重要的全球研究,以解決當(dāng)前通過數(shù)字化轉(zhuǎn)型放大生物反應(yīng)器的挑戰(zhàn),從而提高工藝生產(chǎn)率和質(zhì)量。為此,將科學(xué)和工程方面的知識與計(jì)算和數(shù)據(jù)科學(xué)技術(shù)相結(jié)合的合作研究將極大地促進(jìn)數(shù)字化生物生產(chǎn)的加速。
原文:M. K. Alavijeh, I. Baker, Y. Y. Lee, et al., Digitally enabled approaches for the scale up of mammalian cell bioreactors, Digital Chemical Engineering 4 (2022) 100040