JMP Blog

Ritalv · Sep 4, 2019 11:53 PM

從事流程開發的朋友對DOE相信都不陌生。DOE一種實驗的科學，通過對實驗中輸入（X預測變數）做一些有目的改變，觀察輸出（Y反應變數）有什麼變化，從而去研究X的改變對Y輸出的一些影響，建立起對X和Y的關係和理解。

DOE通常在流程開發中，通常分為三個階段。

首先，篩選階段。我們需要瞭解的是哪些預測變數可以顯著性地影響Y輸出，需要快速地找到這些最重要的預測變數。
在此基礎上，第二步是最佳化，包括最佳化流程應用，也包括PC實驗、製程表徵研究等，通過DOE可以對流程開發的最佳化起到很大的幫助。
最後一個是穩健性研究，也就是如何穩定、高效地生產出有品質的產品。製程能力是否好，製程是否穩健，通過DOE可以讓我們對流程有一個更好的認識。

這就是DOE在流程開發過程中三個主要的應用方面。那麼，在流程開發過程中，通常會應用DOE解決哪些問題呢？

DOE工艺开发中的应用.jpg

首先是細胞培養，可以是細胞培養，也可以是材料細胞的發酵，還有多肽的生產經常會需要做一些酶切，在酶切的過程中也可以應用DOE。此外，通常在下游過程中層析的流程開發，甚至包括分析方法的開發，比如說HPLC的方法開發時，DOE也是非常有用的工具。有些流程我們需要做結晶，需要做沉澱流程，DOE也是比較常見的。如果擴大到整個生產流程來看，在製劑流程中，DOE也是非常廣泛應用的。

因此可以看出，DOE在整個流程開發過程中的應用是比較廣泛。大家也都瞭解DOE的重要性，但其實在運用DOE進行流程開發的時候，有一些注意事項或者說一些意想不到的要點，容易被忽略，今天我們就來看看那些在DOE使用過程中的一些關鍵因素，或者經常被大家忽視的注意事項。

第一個，Input的範圍，也就是X的選擇範圍。

通常來講，X範圍我們希望它設置的寬一些。如下面兩個圖所示，當實驗系統誤差是一個固定值時，範圍定的窄一些，得到的模型波動自然就會很大。如果範圍設置的寬泛一些，模型的穩定性就會更好一點。所以大家通常在選擇範圍時會傾向於選擇寬一些。但在這裡需要提醒大家的是，尤其是做生物學實驗時，X的範圍寬度需要選到一個合適的點。如果設置太寬的話，可能會產生一些問題。

范围选择1.jpg

比如說，左邊的圖範圍是比較合適的。假如選了低值、高值中心點，通過這三個資料點就可以做出模型來試圖瞭解一下真實世界是怎樣的。可以看出得到的模型和實際的情況擬合會比較好。但如果範圍選得過寬的話，可能就會出現第二種情況，也就是選了低值、高值、中心點。但在真實世界中，它的峰值出現的是一個比較窄的範圍時，也就是圖中黑色的線，假如是真實的情況的話，擬合出來紅色的線就會失真了。這是什麼意思呢？可能是說，這個預測變數可能不太能影響到Y，因為低值、中值和中心點差異不大，但實際上你可能丟掉了非常重要的參數。

Wide range.jpg

那應該怎麼尋找比較合適的範圍呢？建議大家可以運用自己的生物學知識，比如，首先對自己要開展的實驗有初步的瞭解，這樣的話才不至於一上來就選擇了一個特別不合適的範圍。比如說，在做陰陽離子層析的時候，你在等電點的上和下同時選了ph去做層析，當蛋白跨等電點的時候，它在層析過程中很多行為是不一樣的。這個時候就可能會出現選出的結果範圍過寬，這個結果就會讓人覺得很難解釋。當有時做出來的結果完全違背你的生物學理解的時候，這時可能就需要回頭檢查哪裡做的不合適，其中一項就是包括範圍的選擇。

第二個是模型的評估。

當我們使用DOE的時候，尤其是對缺少統計學背景的從業人員來說，有時候比較容易過度依賴軟體，直接把資料放進去，擬合出來一個模型就直接使用了。實際上，這個模型能不能用、模型有沒有效？如果在這個地方沒有多思考一下的話，可能就會得到一個失之毫釐謬之千里的結論。因此，首先要評估一下模型好不好，然後去做調整模型、再擬合，實際上是一個迴圈遞進的過程。

比如，原始資料重複性怎樣？有沒有離群點？這個模型是不是一個很值得考驗的模型？假如有離群點，這個離群點是純粹的離群點，還是說它是有意義的理性點？有的時候可能就是因為範圍選的不一樣，有些離群點是可重複的，它真的可能意味著一些意義，如果看到離群點就簡單粗暴地把它刪除的話，你就會錯失發現一些未知的、新的資訊的機會。另外，有沒有丟掉一些關鍵的參數？如果這個參數沒有沒有找到的話，可能做出來的資料，調整了很多X但對Y的影響都不大，這可能就是因為有一些對Y影響大的參數沒有被發現。此外，你所選擇的這些X，不同參數之間它們有沒有相互作用？它們本身是否有曲線等等都是在模型評估中必須考量的因素。

JMP中提供了非常豐富的模型評估工具，下圖是比較比較常見的一些，實際上遠不止於此。建議大家把模型評估做好之後，再去做進一步的資料分析。

JMP interface.jpg

第三個是輸出（Y）的選擇。

說到Y的選擇，你可能會想，需要研究什麼，就把它定義為Y就好了，這個很簡單。但在某些情況下，需要再仔細考量一下到底如何選擇Y。

比如說，我們想做層析流程的開發，希望目標蛋白和雜質分離的好一點，希望挑選分離效果好的層析方式。分離效果好，其實有不同的Ｙ可以去做。

主峰的峰面積百分比。如果雜質分得好，主峰的峰面積百分比應該低，越低越好。這是一種維度。
層析介面上會提供不同峰之間的解析度（resolution）。resolution越大，說明你解析度好。這也是一個維度。
還有一種是波谷的高度。也即是兩個峰之間的波谷高度是多少。高度越低，表示它分離得越好。

Response Selection.jpg

以上這些維度都可以幫助我們評估層析效果好不好、不同的層析之間哪個更優。當面對不同的分離目標時，採用哪一種作為Y就不太一樣。對於左側的第一種情況來講，其實選用哪個為Y關係都不大，因為它們都可以較好地反映出層析分離效果的優勢和劣勢。但對於第二種情況，我們就會發現，使用哪個標準作為Y，分離效果也就是資料計算出來的偏差是比較大的。在這個案例裡面採用C去分離，去分析資料其實是更合適的。所以這個尤其是體現在支配型的層析方法開發。我們在開展HPLC分析方法開發的時候，很多公司也在使用DOE的方法，這裡面也經常會大家會討論到底有哪一個作為Ｙ更好。

综上，也就是给大家提醒下，無論採用哪個作為Ｙ，都不要放棄對原始資料的挖掘，看看哪个Ｙ是真正合適的，這樣做出來的資料的有效性才會更好一些。我們來看個小案例。

Response Selection_Raw Data.jpg

這兩個表格記錄了開展流程開發時嘗試的不同條件，有PA1-PA3，PA4-PA6，如果只看結果的話會發現差異不大，說明流程很穩定。實際上真是這樣嗎？我們來看原始資料，從峰形上來看，123的結果差異都不大，3稍微高點。再來看456的峰形，6的峰形完全和4，5不一樣。到底發生了什麼？這就需要你去挖掘自己的實驗了。在很多公司，研發是一個團隊，檢測是另外一個團隊，有時候，當實驗不是流程開發人員自己開展的時候，可能就會忽略了原始資料只看結論。如果不看原始資料就會錯失很多問題。無論原始資料是“驚喜”也好還是“驚嚇”也罷，都要早看早知道。

第四，回歸和模型複雜度。

我們在做擬合的時候大家都希望R²越高越好。一定是越高越好嗎？其實不一定。

我們來看一個有名的案例（Anscombe's quartet），總共有４個圖，都具有相同的R²，能看出它們的不一樣。在我們這裡擷取了２個。如果真實情況是線性的話，第一個圖採用最小平方法做出來的R²是比較符合事實的，是線性的。但如果讓軟體對第二個圖去用最小平方法擬合，這個圖的R²要更優。如果不去看原始資料，不去做模型評估只看R²，就會使用第二個圖去作預測，預測出來的結果偏差很大。因此，R²並不是越高越好。其次，一定要關注離群點，再判斷是否要剔除。

那麼，模型是越複雜越好嗎？

Model Complexity.jpg

同樣的資料，如果真實的情況就是線性的，第一種方式擬合的R²是0.96。如果過度追求R²，可以做到X⁶，把每一個點強行擬合到最好，也就是R²趨近於1. 那麼哪一種預測性更好？明顯是前者。因為大前者更體現了真實情況下的波動。所以不要為了追求R²強行擬合的更好，表觀上看起來更好，但實際上預測性更差。

第五，顯著性和等效性。

我們在做模型的時候通常希望找到1個或2個顯著的預測變數能夠影響Y。有時候我們會發現，舉個例子，1個中心點，3個重複，以及條件。分析顯著性會發現所有預測變數及它們的排列組合都不太顯著。X和Y之間的關係不太強。這是否意味著資料白做了呢？其實不一定。

DOE Analysis.jpg

首先，一定要看三個重複性好與不好。要從實驗本身的理解來看看三次重複是否本身該有的波動呢？也就是首先要看實驗中重複的波動和預期的波動像不像。如果這次波動遠遠高於預期波動，說明這次實驗做的不好，需要重新做實驗。如果三次實驗偏差和預期的偏差比較接近，這樣的波動是可接受的嗎？在這樣的波動下是否還能找到有規律、有意義的資料？如果還能找到，那就接著開展實驗；如果不能，說明系統波動本身比較大。此時就要考慮這個實驗就不太適用有如此大波動的體系通過DOE來找規律。也就是說，這個波動是否還適合通過DOE來找規律。

如果仍然是適合的，資料結果還是一樣，說明研究的幾個X不會顯著地影響Y。這可能有兩種情況，一是仍然有很顯著的X，但是沒有找到，目前找到的都是不重要的；第二種情況是流程中可能最影響Y的幾個預測變數都找出來了，它們都沒有那麼地影響Y，恭喜你，說明這個流程非常穩健。

因此，我們在開展DOE時不一定說R²一定要多高，一定要找到顯著性，這個實驗才是好的實驗。當你排除了前面那些問題之後，儘管沒找到顯著的X，那這個實驗也是很好的實驗。當然，當你對體系還不是很瞭解的時候，你可能還需要去做一些極值點的確認再來判斷資料的有效性。

最後，我們再來看看等效性評價。在做等效性的評價時，通常我們都希望得到等效的結論。以下面這個為例，回收率小試做了3次實驗和200L生產的結果用TOST方法去對比，發現符合判定標準，因此判定為等效的。有時候我們也會發現結果並不等效，但並不是所有的不等效都是沒有意義的資料。

比如單體生產的2000 L生產出來的三個結果與縮小模型的三個結果，如果按照統計學判定，發現結果是不等效的。再來看原始資料，看看到底發生了什麼。實際上，如果從流程開發人員的角度來看，這6個資料的差異和檢測方法的差異是很接近的，表明它們實際上是沒有顯著性差異的。但如果只是把資料登錄到軟體裡，軟體是不瞭解背後的流程，不瞭解分析方法波動的誤差，所以計算出來會出現不等效。因此，當我們發現結果不等效時，不要輕易下結論，更多的要結合自己的專業知識背景去解讀這些結果才會得到更客觀的結論和判斷。

DOE在流程開發中的應用非常廣泛，也是一款強大無比的工具，但在應用時也有以上這些常常被忽視的誤區需要大家注意，希望本文能夠對你有啟發和借鑒。