데이터에서 지식으로: SPC, 다변량 분석, 지속적 공정 검증

📍 현재 위치: 제5부가 열립니다. 우리는 책 전체에 걸쳐 데이터를 신뢰할 수 있고, 연결되어 있으며, 의미 있게 만드는 데 시간을 쏟았습니다. 이제 마침내 그 데이터를 사용합니다. 숫자의 흐름을 제어, 보증, 그리고 조기 경보로 바꾸는 것입니다.

앞 장에서는 모든 것을 두 가지 위대한 구조물로 엮어냈습니다. 디지털 스레드(digital thread) 는 하나로 연결되고 추적 가능한 기록으로, 제품이 처음 설계 아이디어로 시작해 환자에게 도달하기까지 모든 과정을 따라갑니다. 모든 측정, 결정, 그리고 일탈이 하나의 사슬로 연결되어 있습니다. 디지털 트윈(digital twin) 은 공정을 살아 있는 계산 모델로 표현한 것으로, 그 스레드로부터 끊임없이 데이터를 공급받으며 실제 공장이 가동되는 모습을 그대로 반영합니다. 둘 다 눈부신 성취이지만, 아무도 그것을 읽지 않는다면 둘 다 무용지물입니다. 결코 분석하지 않는 스레드는 그저 보관함일 뿐이고, 아무도 들여다보지 않는 트윈은 아무도 보지 않는 대시보드에 지나지 않습니다.

이 장은 데이터를 읽는 일에 관한 것입니다. 거버넌스가 적용되고 연결된 숫자를 실제로 행동에 옮길 수 있는 지식으로 바꾸는 고전적 분석 기법들입니다. 이 방법들은 수십 년의 역사를 지녔고, 동료 심사를 거쳤으며, 규제 기대치에 깊이 자리 잡고 있습니다. 다음 장에 등장하는 모든 신기술이 그 위에 세워지는 토대입니다.

쉽게 말하면

자동차 계기판을 떠올려 보세요. 속도계 바늘은 크루즈 컨트롤을 켜 두어도 조금씩 흔들립니다. 그 미세한 떨림은 정상이며 아무 문제가 없다는 뜻입니다. 하지만 온도계가 평소 머무는 자리보다 — 빨간 선과는 아직 한참 멀어도 — 조금이라도 올라간다면 그것은 신호입니다. 무언가 특정한 변화가 일어난 것이며, 좋은 운전자는 바늘이 마침내 빨간 선에 닿을 때가 아니라 바로 그때 행동합니다. 이 장의 핵심 과업은 무해한 떨림과 의미 있는 신호를 구별하는 법, 그리고 어떤 엄격한 한계에 닿기 훨씬 전에 그 신호를 포착하는 법을 배우는 것입니다.

이 장에서 다루는 내용

먼저 단일 측정값을 위한 통계적 공정 관리(Statistical Process Control, SPC) 로 시작한 다음, 수백 개의 얽힌 변수를 가진 바이오공정이 왜 다변량(multivariate) 방법(PCA, PLS, 다변량 SPC)을 요구하는지 설명합니다. 이어서 지속적 공정 검증(Continued Process Verification, CPV), 즉 모든 상업용 배치를 영원히 감시해야 한다는 규제 규칙을 만나고, 그 약속이 실제로 어떤 데이터 인프라를 요구하는지 살펴봅니다.

떨림과 신호 구별하기: 고전적 SPC

측정값 하나로는 부족한 이유 — 그리고 너무 많으면 더 나쁜 이유

모든 공정은 변동합니다. 같은 탱크에서 바이알 100개를 채우면 무게가 정확히 똑같지 않습니다. 월터 슈하트(Walter Shewhart)의 관리도 기법(1920–1930년대)에서 비롯되어 이후 W. 에드워즈 데밍(W. Edwards Deming)이 체계화한 통계적 품질 관리의 핵심 통찰은, 변동에 두 가지 종류가 있다는 것입니다 [7][8]. 우연 원인 변동(common-cause variation) 은 공정의 배경 소음으로, 피할 수 없는 수많은 작은 영향들의 총합입니다. 이는 안정적이고 예측 가능합니다. 이상 원인 변동(special-cause variation) 은 새롭고 규명 가능한 무언가입니다. 막힌 필터, 잘못된 원료 로트, 잘못 보정된 프로브 같은 것이죠. 그것이 바로 치솟는 온도계입니다 [7][8].

이 관리도들이 지켜보는 각 측정값은 긴 여정의 끝입니다. 생산 바이오리액터의 프로브가 값을 읽고, 그 값이 고유한 품질과 타임스탬프를 가진 거버넌스 데이터 포인트가 되며(데이터 포인트의 생애주기), 그제야 관리도 위에 놓입니다. SPC는 데이터 포인트가 태어나고, 신뢰받고, 저장된 다음에 우리가 그것으로 하는 일입니다.

이 둘을 구분하는 도구가 관리도(control chart) 입니다. 측정값을 시간에 따라 도표로 그리고 관리 한계(control limits) 를 그리는데, 보통 과거 평균의 위아래로 3σ(3 표준편차)에 둡니다. 우연 원인 변동만 작용할 때 이 범위는 기대값의 약 99.7%를 담아내므로, 그 밖으로 벗어난 점은 통계적으로 충분히 드물어 조사할 가치가 있습니다. 한계 안에서 춤추는 점들은 우연 원인 잡음이고, 한계 밖으로 벗어난 점이나 비무작위 패턴(연속, 추세)은 조사해야 할 이상 원인을 알립니다 [7]. 가장 단순한 것은 각 점에 개별적으로 반응하는 슈하트 관리도(Shewhart chart) 입니다. 여기에 기억을 더한 두 사촌이 있습니다. CUSUM(누적합)과 EWMA(지수가중이동평균)는 작은 편차들을 시간에 따라 누적하므로, 슈하트 관리도라면 무시했을 느린 표류를 잡아냅니다 [7][5].

"규격 내"는 "관리 상태"가 아닙니다

"규격 내(in spec)"는 "관리 상태(in control)"와 같지 않습니다. 규격 한계(specification limit) 는 품질 요구 사항으로, 제품이 합격하기 위해 충족해야 하는 값입니다. 관리 한계(control limit) 는 공정이 실제로 어떻게 행동하는지에 대한 통계적 기술입니다. 한 배치가 규격 안에 있으면서도 관리 상태에서 크게 벗어나 있을 수 있고(아직 요구 사항을 위반하지 않은 이상 원인일 뿐), 한 공정이 완벽한 관리 상태에 있으면서도 규격을 충족할 능력이 없을 수도 있습니다. 이 둘을 혼동하는 것은 제조 현장에서 가장 흔하고 값비싼 오류 중 하나입니다 [7].

1단계 모델 구축, 2단계 모니터링

문헌이 강조하는 한 가지 미묘한 점이 있습니다. 관리도를 만드는 일과 관리도를 사용하는 일은 서로 다른 작업이라는 것입니다. 1단계(Phase I) 는 과거 데이터를 분석해 "관리 상태"가 무엇인지 정의하고 한계를 설정하는 후향적 연구입니다. 2단계(Phase II) 는 실시간 모니터링으로, 새로운 점들을 그 확립된 한계와 비교해 점검합니다. 이 둘을 하나로 취급하는 것, 즉 판단하려는 바로 그 데이터로 한계를 설정하는 것은 관리도의 통계를 조용히 망가뜨립니다 [8]. 1단계 후 2단계라는 이 규율은 이 장이 만드는 모든 모델에서 다시 등장합니다. 언제나 신뢰할 수 있는 이력 위에 적합(fit) 시킨 다음 새 데이터를 그 적합에 비추어 판단하며, 결코 두 가지를 동시에 하지 않습니다.

관리도 하나로는 부족한 이유: 다변량으로 가기

이제 바이오공정 문제입니다. 해법을 한마디로 말하면 다변량 데이터 분석(Multivariate Data Analysis, MVDA), 즉 상관된 많은 변수를 하나씩이 아니라 함께 분석하는 것입니다. 현대식 바이오리액터의 한 번 가동은(고처리량 용기인 Sartorius ambr 250, 일회용 교반 탱크인 Cytiva Xcellerex XDR, 또는 록킹백 방식의 Cytiva WAVE 등 생산 바이오리액터의 명명된 용기들) 숫자 하나가 아니라 수백 개로 기술됩니다. 온도, pH, 용존 산소, 교반, 여러 가스 유량, 공급 속도, 배출 가스 측정값, 수십 가지 온라인 및 오프라인 측정값이 며칠 동안 몇 초마다 표본 추출됩니다. 더 나아가 이 변수들은 깊이 상관(correlated) 되어 있습니다. 함께 움직인다는 뜻입니다. 교반을 높이면 용존 산소가 올라가고, 포도당을 공급하면 pH가 변합니다. 이들은 독립적인 다이얼이 아닙니다 [4].

원시의 빠른 표본 태그를 그냥 슈하트 관리도에 올릴 수 없는, 두 번째이자 더 미묘한 이유가 있습니다. 그 신호들은 심하게 자기상관(autocorrelated) 되어 있습니다. 5초마다 표본 추출되는 용존 산소 측정값은 바로 직전 값과 거의 똑같은데, 이는 ±3σ 관리 한계 뒤에 깔린 독립성 가정을 위반합니다. 그래서 원시의 빠른 태그에 순진하게 슈하트 관리도를 적용하면, 사실은 공정 자체의 관성에 불과한 것에 거의 끊임없이 경보가 울립니다. 바로 이 때문에 바이오공정 SPC는 배치 요약 특징(배치당 값 하나, 이 장 뒤의 I-MR 예시처럼)이나 모델 잔차(몇 절 뒤에서 정의되는 다중경로 PCA T 제곱과 SPE 점수 — 지금은 그저 매 순간을 하나로 요약하는 숫자라고만 읽어 두면 됩니다)에 적용되며, 결코 원시의 5초 DO 데이터에는 적용되지 않습니다. 그리고 바로 이 때문에 원시 태그에 대한 단변량 슈하트가 아니라 궤적 방법이 현장의 진짜 일꾼인 것입니다.

이 문제를 300개의 개별 관리도를 그려서 풀 수는 없습니다. 개별 관리도는 각각 완벽하게 정상으로 보이면서도 그 조합은 기이할 수 있습니다. 키가 정상이고 몸무게도 정상이지만, 그 몸무게에 비한 키는 우려스러운 사람과 같습니다. 단변량 관리도는 상관 관계를 보지 못하며, 거짓 경보도 부풀립니다. 관리도를 늘릴수록 적어도 하나가 우연히 작동할 확률이 빠르게 올라가서, 수백 개의 관리도에서는 거짓 경보가 일상이 됩니다 [7][5].

각 센서 신호가 저마다의 개별 관리 한계 안에 머무르는 동안, 결합된 다변량 관리도는 같은 순간을 관리 이탈로 표시합니다. 센서 하나하나는 규격 안이지만 배치는 비정상입니다 — 다변량 관점만이 이를 포착합니다(Nomikos & MacGregor를 따름). 저자가 AI의 도움을 받아 직접 제작한 그림입니다.

아래 그림은 같은 요점을 나란히 보여 줍니다. 두 단변량 관리도가 모두 "관리 상태"로 읽히지만, 같은 두 강조 점을 다변량 모델에 비추어 채점하면 그 배치는 정상 군집에서 한참 벗어나며, 기여도 도표(contribution plot)(어떤 변수가 패턴을 깼는지 짚어 주는 막대그래프)는 어떤 단일 태그가 아니라 깨진 pH–glucose 관계를 범인으로 지목합니다.

두 패널 비교. 왼쪽 인디고 패널은 두 개의 단변량 I-MR 관리도(하나는 pH, 하나는 glucose)를 보여 주며, 모든 점이 저마다의 점선 관리 한계 안에 있고 둘 다 관리 상태라는 판정 상자가 있다. 오른쪽 보라색 패널은 같은 두 강조 점을 다변량 모델에 비추어 채점한 모습이다. PC1 대 PC2의 PCA 점수 도표에 좋은 배치들의 군집을 감싼 녹색 95퍼센트 신뢰 타원이 있고, 그 타원 바깥으로 멀리 떨어진 하나의 장미색 점에 이 배치라는 라벨이 붙어 있으며, 그 아래 기여도 도표에서는 pH 대 glucose 비율 막대가 개별 pH와 glucose 막대를 압도한다. 같은 순간을 두 가지로 읽기: 변수 하나하나는 괜찮다고 말하지만, 모든 변수를 한꺼번에 보면 상관 관계가 깨졌다고 말한다 — 그리고 기여도 도표가 그 짝을 가리킨다. 저자가 AI의 도움을 받아 직접 제작한 그림입니다.

PCA와 PLS: 상관된 변수를 압축하기

탈출구는 차원 축소(dimensionality reduction) 입니다. 주성분 분석(Principal Component Analysis, PCA) 은 기초가 되는 도구입니다. 데이터의 진짜 변동 대부분을 포착하는 소수의 새로운 결합 변수, 즉 주성분(principal components) 을 찾아내, 상관 관계를 활용해 수백 개의 측정값을 두세 개의 의미 있는 축으로 압축합니다 [4]. 그 짝꿍인 부분 최소 제곱(Partial Least Squares, PLS) 은 같은 압축을 수행하되, 공정 변수로부터 어떤 결과(예: 최종 제품 품질)를 예측하는 데 초점을 맞춥니다 [4]. 둘 다 잠재 변수(latent-variable) 방법입니다. 측정하는 수많은 것이 직접 볼 수 없는 소수의 숨은 것(세포 배양의 진짜 상태)에 의해 좌우된다고 가정하고, 그 숨은 동인을 재구성합니다 [4].

호텔링 T 제곱과 SPE: 두 관리도, 두 질문

데이터를 압축하고 나면 수백 개가 아니라 단 두 개의 관리도로 모니터링합니다. 호텔링 T 제곱(Hotelling's T-squared) 은 묻습니다. 공정이 다변량 공간의 정상 영역에서 작동하고 있는가? 이는 개별 변수 하나하나가 멀쩡해 보일 때조차 비정상적인 조합을 잡아냅니다 [4][5]. 그 경보 임계값은 어림짐작이 아닙니다. 알려진 통계 분포(F 분포(F-distribution))에서 도출되므로, 그 차단선은 손으로 그은 것이 아니라 방어 가능하고 계산된 근거를 가지며, 보통 99% 신뢰 수준에 그어집니다(의도적인 절충으로, 대개 배치당 거짓 경보율을 약 1–2%로 맞춥니다). (통계에 관심 있는 독자를 위해 덧붙이면, 정확한 한계는 그 분포에 k(n−1)(n+1)/[n(n−k)] 인자를 곱한 것으로, 여기서 k는 유지한 주성분의 수, n은 관측치의 수이며, 원시 분포 분위수 자체가 아닙니다.) SPE 관리도(제곱 예측 오차, Q라고도 함)는 보완적인 질문을 합니다. 공정이 여전히 모델이 기대하는 대로 행동하는가, 아니면 모델이 한 번도 본 적 없는 진정으로 새로운 무언가가 나타났는가? 둘을 합치면 화면의 두 선만으로 거의 완전한 건강 점검을 해 줍니다 [4][5].

이 관리도 중 하나가 작동하면, 기여도 도표(contribution plot) 가 "원래 변수들 중 어느 것이 경보를 일으키는가?"에 답합니다. 조사자가 수백 개를 뒤지게 두는 대신 의심스러운 측정값을 곧장 가리켜 줍니다 [4].

골든 배치: 진화하는 공정을 모니터링하기

배치는 정상 상태가 아니라 궤적(trajectory) 입니다. 1일 차의 "정상" 온도는 5일 차의 정상 온도와 다릅니다. 배양은 자라고, 소비하고, 내내 변화합니다. 따라서 "관리 상태"의 기준 자체가 건강한 가동의 모양을 띤 움직이는 목표여야 합니다.

획기적인 해법은 노미코스(Nomikos)와 맥그리거(MacGregor)가 도입한 다중경로 PCA(Multiway PCA, MPCA) 입니다 [3]. 과거의 성공한 배치들, 즉 골든 배치(golden batches) 의 역사적 라이브러리를 가져옵니다. 각각은 모든 변수의 완전한 시간 궤적이며, 이 3차원 블록(배치 × 변수 × 시간)을 일반 PCA가 소화할 수 있는 형태로 펼칩니다(unfold). 그 결과는 좋은 배치가 그 생애의 매 순간 어떤 모습인지에 대한 다변량 지문(multivariate fingerprint) 입니다. 그런 다음 새로운 배치를 가동 중에 한 점 한 점, 그 골든 기준 분포에서 도출된 시간 가변 관리 한계와 비교하여 모니터링합니다 [2][3].

그 보상이 조기 결함 탐지(early fault detection) 입니다. 모델이 기대되는 궤적을 알고 있기 때문에, 발생 중인 문제는 대개 어떤 단일 센서가 한계를 위반하기 전에, 그리고 최종 품질 시험보다 훨씬 전에 T 제곱이나 SPE 관리도를 궤도에서 벗어나게 만듭니다. 조사하고 개입할 시간을 벌어 주는 것이죠. 실제로 얼마나 일찍 경고를 받느냐는 공정에 따라 다릅니다. 14일짜리 유가식 배양(fed-batch)에서는 여러 시간일 수 있지만, 빠른 연속 공정 단계에서는 몇 분일 수 있으며, 배치를 구해낼 수 있는지는 근본 원인에 달려 있습니다 [2].

이 모든 것을 상류(upstream) 이야기 — 열나흘 동안 지켜보는 생물반응기 발효 — 로만 읽고 싶은 유혹이 들지만, 그 같은 궤적적 사고는 그 배양을 원료의약품으로 바꾸는 하류(downstream) 정제 단계들도 똑같이 관장하며, 진행 중인 캠페인은 그런 단계 여럿을 거칩니다. UF/DF(한외여과/정용여과(ultrafiltration/diafiltration) — 1권의 원료의약품 장에서 설명한 마지막 농축 및 완충액 교환 단계) 한 사이클은 그 자체로 짧은 궤적입니다. 인라인 전도도(conductivity) 프로브(완충액 교환이 얼마나 진행되었는지를 실시간으로 대리하는 값)는 오래된 공정 완충액이 다섯에서 열 정용부피(diavolume)(정용부피 하나는 시스템 안에 있는 제품의 부피)에 걸쳐 교체되는 동안 깔끔한 지수형 세척 곡선을 그리고, 투과 유속(permeate flux)(막을 가로질러 면적당 시간당 통과하는 부피, 단위 L/m²/h)은 단백질이 농축되면서 감쇠합니다. 그리고 골든 사이클보다 더 빠르게 감쇠하는 유속이야말로 궤적 모델이 종점 분석보다 먼저 포착하는 막 오염(fouling)의 조기 신호입니다. 다른 하류 단계들은 궤적이 아니라 단일한 배치 요약 특징을 기여합니다. 바이러스 여과 완전성 시험(virus-filtration integrity test)(바이러스 필터에 대한 공기 기반 확산 또는 압력 유지 시험으로, 사용 후 합격이 출하 게이트가 됨)은 I-MR 관리도가 로트별로 추세를 볼 수 있는 합격/불합격과 측정값을 내놓고, 저 pH 바이러스 불활화(viral-inactivation) 유지는 그 유지 pH, 온도, 지속 시간을 기여합니다. 교훈은 CPV가 하류를 뒤늦게 덧붙인 상류 프로그램이 아니라는 것입니다. 포집(capture)에서 폴리싱(polishing)을 거쳐 UF/DF에 이르는 모든 단위 공정이 추세 분석 가능한 특징을 내보내며, 마침내 출하 게이트를 작동시키는 집계값(SEC 한계를 위반하는 HMW 응집체)은 어떤 단일 하류 단계도 소유하지 않는 누적 속성입니다. 바로 이 때문에 추세 분석은 발효조만이 아니라 전체 사슬에 걸쳐야 합니다.

골든 배치 다변량 모니터링의 흐름도. 위쪽 모델 구축 레인은 왼쪽에서 오른쪽으로 흐른다: 과거의 성공한 배치(골든 라이브러리), 다음으로 다중경로 PCA 모델과 지문, 그다음 T 제곱과 SPE에 대한 시간 가변 관리 한계. 아래쪽 실시간 배치 레인은 실시간 스트리밍되는 새 배치, 그다음 각 시점마다 모델에 투영으로 흐른다. 두 레인은 모두 한계 안에 있는가? 결정 다이아몬드로 이어진다. 예는 아래로 관리 상태, 계속 가동으로 이어지고, 아니오는 경보 상자로 가서 기여도 도표가 변수를 찾고, 그다음 조기에 조사하고 개입으로 이어진다. 좋은 배치들의 라이브러리에서 출발해, 새 배치를 실시간으로 궤적을 인식하며 다변량적으로 모니터링하기까지(Nomikos와 MacGregor를 따름). 저자가 AI의 도움을 받아 직접 제작한 그림입니다.

지속적 공정 검증: 약속으로서의 모니터링

여기까지는 통계적 도구입니다. 이제 이 도구들을 선택이 아닌 필수로 만드는 규제의 힘이 등장합니다. FDA의 2011년 공정 밸리데이션(process validation) 지침은 밸리데이션을 3단계 생애주기로 재정의했습니다. 1단계(Stage 1) 는 공정 설계, 2단계(Stage 2) 는 공정 적격성 평가(상업 규모에서 제조 공정 자체가 적합 제품을 신뢰성 있게 생산함을 입증하는 것으로, 제3부의 밸리데이션 장에서 해부한 전산화 시스템(computerized-system) 밸리데이션 — 공정이 아니라 소프트웨어를 밸리데이션하는 것 — 과는 구별되는 규율), 그리고 결정적으로 3단계, 지속적 공정 검증(Stage 3, Continued Process Verification, CPV) 입니다 [1].

CPV는 밸리데이션이 결코 끝나지 않는다는 약속입니다. 제품의 상업적 생애 전체에 걸쳐, 제조사는 모든 배치의 데이터를 지속적으로 모니터링하고 추세를 분석(trend) 하여 공정이 관리 상태에 머물러 있다는 지속적 보증(ongoing assurance) 을 제공해야 합니다 [1]. 이는 미국만의 개념이 아닙니다. 유럽연합은 EU GMP 부속서 15(Annex 15)와 EMA 공정 밸리데이션 가이드라인 아래 진행 중 공정 검증(Ongoing Process Verification, OPV) 으로 동등한 의무를 성문화하고 있으므로, FDA 사찰관을 만나든 EU 사찰관을 만나든 동일한 상시 의무가 여러분을 기다립니다. 이 지침은 통계적 방법을 명시적으로 요구합니다. 바로 위에서 다룬 SPC와 추세 분석 도구로, 이상 원인 변동이 나타나는 즉시 탐지하고 시간이 지남에 따라 우연 원인 변동성을 줄이도록 이끄는 것입니다 [1]. 이는 한 번 작성해 제출하고 잊어버리는 연구가 아니라, 데이터로 끊임없이 공급되는 영구적 의무입니다. 그 추세 분석에 데이터를 공급하는 일 역시 선택이 아닙니다. 추세의 바탕이 되는 공정 중 시료 채취 및 시험은 공정 중 물질 및 의약품의 시료 채취 및 시험을 다루는 21 CFR 211.110이 다루는 것과 같은, 현행 우수 제조 관리 기준(current Good Manufacturing Practice, cGMP)의 공정 중 관리(in-process controls) 영역 안에 놓여 있습니다. 이 영역에서 제조사는 산출물과 변동성을 책임지는 공정의 성능을 모니터링하는 관리 절차를 수립하고 따릅니다. 그리고 CPV의 상당 부분이 분석 측정값 위에 세워지므로, 그 숫자를 만들어 내는 방법들은 ICH Q2(R2)(분석법 밸리데이션(analytical validation)) [10]와 ICH Q14(분석 절차 개발(analytical procedure development)) [11]의 생애주기 정신에 따라 목적에 적합한 상태를 유지하는 것이 좋습니다. 표류하는 분석법은 표류하는 공정으로 위장할 수 있기 때문입니다.

CPV는 홀로 떠다니지 않습니다. 그것은 제약 품질 시스템 프레임워크인 ICH Q10의 운영적 표현입니다. ICH Q10의 핵심 목표는 공정 성능 및 제품 품질 모니터링을 통해 제품 생애주기 전반에 걸쳐 관리 상태를 유지하고 지속적 개선(continual improvement) 을 추구하는 것입니다 [6]. SPC 관리도가 눈이라면, CPV와 ICH Q10은 그 눈을 계속 뜨고 있으라는 상시 명령입니다.

왜 중요한가

CPV는 분석을 최우선 순위의 데이터 관리 문제로 바꾸며, 앞서 다룬 모든 장의 가치를 거둬들입니다. 모든 배치를 영원히 추세 분석하려면, 제품의 전 생애에 걸쳐 이용 가능(available) 하고 지속되는(enduring) 역사적 데이터가 필요합니다(제3부의 ALCOA+와 보존 원칙). 배치 4번을 배치 4,000번과 비교하려면, 수년간의 계측기 및 소프트웨어 변경에도 모든 숫자가 동일한 의미를 가져야 합니다(제4부의 의미론적 상호운용성과 디지털 스레드). 바로 이 때문에 장비와 태그 명명법을 위한 ANSI/ISA-95(IEC 62264, 현행판 2025)와 배치 레시피 구조를 위한 ISA-88(IEC 61512) 같은 표준이 그토록 중요합니다. 이들은 BR101.Temp.PV(바이오리액터 101, 온도, 현재값) 같은 태그가 모든 시스템과 모든 해에 걸쳐 동일한 물리적 대상을 의미하도록 지켜 줍니다. 모델은 결코 "그 바이오리액터"를 보지 않습니다. 모델이 보는 것은 다음과 같이 정렬된 행들로, 여기서는 우리의 진행 중인 mAb 캠페인 안의 한 바이오리액터 가동(BR101-2241)입니다.

Timestamp,BatchID,BR101.Temp.PV,BR101.DO.PV,BR101.pH.PV
2024-06-14T08:00:00Z,BR101-2241,37.0,52.3,7.02
2024-06-14T08:00:05Z,BR101-2241,37.0,51.8,7.02
2024-06-14T08:00:10Z,BR101-2241,37.1,51.1,7.01

골든 배치 모델을 만들려면, 여러 시스템(히스토리언, MES, LIMS)에서 이렇게 정렬된 궤적 수천 개를 한꺼번에 끌어와야 하는데, 이는 제2부의 아키텍처와 연결성 표준이 실제로 그것들을 연결했을 때만 작동합니다. 그리고 CPV 시스템 자체가 GxP(규제 데이터를 규율하는 우수 관리 기준 규정 일체) 아래에서 가동되므로, 다른 모든 규제 기록과 마찬가지로 밸리데이션되고, 감사 추적되며, 무결성이 관리되어야 합니다. 결국 CPV 프로그램은, 책의 나머지가 주장해 온 모든 데이터 거버넌스에 대한 청구서가 도래하는 순간입니다. 그 기초 작업을 건너뛰면 CPV는 숫자를 스프레드시트에 손으로 옮겨 적는 일로 전락합니다. 느리고, 오류가 잦으며, 가장 중요한 다변량 신호에는 눈먼 상태로 말입니다.

정렬된 태그에서 기계가 추론할 수 있는 사실로

수년에 걸쳐 같은 물리적 대상을 의미하는 태그 이름은 일관성의 이름 절반입니다. 의미 절반은 그 일관성을 기계가 검사 가능하게 만드는 것이며, 바로 여기서 형식적 온톨로지(ontology)(한 도메인에 어떤 종류의 것들이 있고 그것들이 서로 어떻게 관계 맺는지를 다룬, 공유되고 계산 가능한 어휘 — 동반서의 주제)가 제 몫을 합니다. 아래 I-MR 카드가 해부하는 바로 그 CEX_main_pct 값은 RDF 트리플(RDF triple)(주어–술어–목적어 사실, 지식 그래프의 원자적 진술)로 적을 수 있습니다 — bp:DS-001 bp:cexMainPct 68.99 — 여기서 술어 bp:cexMainPct는 그 의미가 시스템마다 다시 추측되지 않고 한 번 고정된 타입 지정 속성입니다. 그 하나의 타입 지정 간선이야말로, 그 숫자가 LIMS에서 왔든 히스토리언에서 왔든 질의가 같은 값에 닿게 해 주는 것입니다. 책의 관계와 계보 장은 이 추세가 기술하는 배치를 bp:derivedFrom 계보 척추에 연결하므로, 한 로트에 대한 CPV 경보는 그 세포 은행을 공유하는 모든 형제 로트로 향하는 순회가 됩니다 — 추세와 회수 범위가 같은 그래프인 셈입니다.

세 가지 형식적 의미론 도구가 CPV 작업에 깔끔하게 대응됩니다. 첫째, PROV-O(W3C 출처(provenance) 어휘 — 누가 또는 무엇이, 어떤 활동으로, 어떤 입력으로부터 하나의 사실을 만들어 냈는지)는 어떤 SPC 한계가 특정 1단계 기준선 가동에 의해 생성되었음(was generated by) 을 기록하므로, 리뷰어는 관리 한계가 지금 판단하고 있는 그 데이터에 적합된 것이 아니라 올바른 이력으로부터 계산되었는지를 볼 수 있습니다 — 정직한 한계와 순환적인 한계를 구별하는 계보로, 발행과 FAIR 장이 서로 어긋나는 소스 시스템을 조정하는 데 쓰는 바로 그 prov:wasGeneratedBy 규율입니다. 둘째, SHACL 형상(SHACL shape)(형상 제약 언어(Shapes Constraint Language) — 그래프 데이터가 요구되는 구조를 갖추었는지 검증하는 닫힌 세계(closed-world) 게이트)은 "규격 내" 절반을 기계적으로 강제할 수 있습니다. bp:cexMainPct에 대한 sh:maxInclusive 80.0 같은 제약은 값이 성적서 범위를 벗어난 출하 로트를 모두 불합격시키고, 결정적으로 sh:minCount 1은 결과가 단지 빠진 로트를 불합격시킵니다 — 어떤 SPC 관리도도 표현할 수 없는 닫힌 세계 실패인데, 관리도는 존재하는 숫자만 찍을 수 있기 때문입니다. 그 출하 게이트는 SHACL 출하 게이트 장에서 온전히 구축됩니다. 그 분업은 정확히 이 장이 열며 다룬 "규격 내 대 관리 상태" 구분입니다. SHACL은 고정된 규격(specification)(로트가 충족해야 하는 닫힌 세계 규칙)을 게이트하고, SPC는 살아 있는 관리(control) 상태(공정이 스스로 설정하는 통계적 한계)를 기술합니다. 셋째, CPV 추세 질문은 SPARQL 역량 질문(SPARQL competency question)(그래프가 답해야 하는 평이한 자연어 질문으로, RDF의 질의 언어로 실행됨) — "관리 한계를 벗어난 모든 출하 DrugProduct 로트를 날짜순으로 반환하라" — 으로 던질 수 있으며, 관장되는 그래프 위에서는 이것이 손으로 하는 스프레드시트 추출이 아니라 단 한 번의 순회가 됩니다.

# CEX 관리 한계를 벗어난 모든 출하 로트 -- 그래프 질의로 표현한 CPV 추세
PREFIX bp: <https://example.org/bioproc#>
SELECT ?lot ?value WHERE {
  ?lot a bp:DrugProduct ;
       bp:cexMainPct ?value ;
       bp:cexLcl ?lcl ; bp:cexUcl ?ucl .
  FILTER(?value < ?lcl || ?value > ?ucl)
} ORDER BY ?lot

더 깊은 토대는, BFO(기초 형식 온톨로지(Basic Formal Ontology), 동반서가 그 위에 세워지는 상위 온톨로지)의 지속체/발생체 구분이 CPV 프로그램의 두 절반에 직접 대응한다는 것입니다. CEX 값이 추세 분석되는 로트는 지속체(continuant)(시간을 거쳐 지속되며 품질을 지니는 것)이고, 그것을 만들어 낸 배치 가동은 발생체(occurrent)(일어났다가 끝나는 과정)입니다 — 이 둘을 구별해 두는 것이야말로, 용기와 공정과 물질을 뒤섞지 않으면서 한 가동의 결함을 그것이 오염시킨 로트들로 추적할 수 있게 해 줍니다. 위의 명명 표준(ISA-95, ISA-88)은 태그를 안정적으로 만들고, 이 형식적 계층은 그 의미를 기계가 검증하고 추적하고 질의할 수 있는 무언가로 만듭니다 — 추세 분석된 숫자의 벽을 회수가 행동에 옮길 수 있는 지식으로 바꾸는 것이 바로 이것입니다.

SPC 기록에서 결정으로: 출하 속성의 관리도 읽기

관리도는 그림처럼 보이지만, 품질 엔지니어가 실제로 승인하는 것은 작은 기록(record) 입니다. 배치 이력으로부터 계산된 몇 개의 명명된 필드들이죠. 하나의 출하 속성, 즉 배치당 한 번 측정되는 양이온 교환(cation-exchange, CEX) 주피크 전하 변이체 백분율(QC 및 출하에서 태어나는 종류의 숫자로, 순도 패널이 아니라 가장 우세한 전하 변이체를 보고함)을 가져와 캠페인 전체에 대해 단변량 I-MR(개별값 / 이동 범위, individuals / moving-range) 관리도를 돌려 봅니다. 배치당 값이 하나뿐이라 사용할 군내 산포가 없으므로, 관리도는 이동 범위(moving range)(연속한 배치 사이의 절댓값 차이)에서 시그마를 추정하며, 관리도 상수 d2 = 1.128(짝(pair)의 이동 범위에 대한 표준 통계표에서 가져온 고정값)이 짝의 평균 이동 범위를 시그마로 변환합니다. 능력은 두 번째 통계량인 Cpk 에서 나옵니다. 공정 평균에서 더 가까운 규격 한계까지의 거리를 3시그마로 나눈 값입니다(그래서 Cpk = 1이면 산포가 겨우 들어맞는다는 뜻이고, Cpk ≥ 1.33이면 여유 있게 능력이 있다는 뜻입니다). 숫자를 읽기 전에 솔직한 주의 한 가지: 배치가 여섯 개뿐일 때 이 Cpk는 넓은 신뢰 구간을 지닌 거친 초기 추정치이며, 데이터가 대체로 정규 분포를 따르고 공정이 이미 관리 상태에 있을 때만 의미가 있습니다. 여섯 점에서 나온 깔끔한 Cpk 하나를 확정된 사실로 읽어서는 결코 안 됩니다. 아래 기록은 오픈소스 구현이 반환하는 바로 그것으로, 필드별로 정리되어 있습니다.

식별 카드로서의 SPC 기록: 산포 사슬 mr_bar 그다음 d2 그다음 sigma가 한계를 만들고, Cpk가 능력을 보고하며, 가장 중요한 필드 쌍 — 고정된 제품 규격에 맞세운 데이터 유도 관리 한계. 저자가 AI의 도움을 받아 직접 제작한 그림입니다.

이 카드를 리뷰어처럼 읽어 봅시다. center 는 다른 모든 필드를 측정하는 기준선입니다. 산포 사슬 — mr_bar → d2 → sigma — 은 한계를 어림짐작이 아니라 데이터 유도로 만드는 것입니다. sigma = mr_bar / d2이고, 관리 한계는 단순히 center ± 3·sigma입니다. 결정적으로, 여기서 sigma는 여섯 값의 일반 표준편차가 아니라 이동 범위 추정치입니다. I-MR 관리도는 의도적으로 그것을 사용합니다. 반대로 Cpk 는 규격에 맞세운 일반 표본 표준편차로 계산됩니다. 그래서 기록의 두 절반은 서로 다른 두 질문에 답하며 서로 다른 산포 추정치를 써도 됩니다. SPC 전체에서 가장 자주 오독되는 필드 쌍이 카드 맨 아래에 두 개의 쌓인 밴드로 그려져 있습니다. 규격(specification) [60.0, 80.0] 은 제품이 반드시 해야 하는 것(품질성적서로 고정되며, 모든 배치가 61%로 나와도 변하지 않음)이고, 관리 한계(control limits) [64.1485, 73.8262] 는 공정이 실제로 하는 것(배치 간 변동에서 재계산되며 규격에 무관함)입니다. 한 배치가 한 밴드 안에 있으면서 다른 밴드를 벗어날 수 있는데, 바로 이 때문에 "규격 내"는 "관리 상태"가 아닙니다.

이 기록은 책들 사이의 구체적인 인수인계 지점입니다. 물리적 산출물 — CEX 주피크 전하 변이체 백분율이 측정되고 있는 정제 풀(pool) — 은 다운스트림 크로마토그래피에서 만들어지고, 그것이 만들어 내는 데이터 포인트는 이 책 전체에서 설명한 대로 거버넌스되고 저장되며, 여기서 해부한 SPC 기록은 오픈소스 공정 분석 장에서 문자 그대로 release_spc()의 반환값으로 구현됩니다. 이 반환값은 I-MR 필드(center, ucl, lcl — 상한 및 하한 관리 한계 — sigma, mr_bar)를 limits 객체 아래에 중첩하고, 품질성적서 규격을 두 원소 리스트 spec: [spec_low, spec_high]로 담으며(그 spec_low/spec_high는 hplc_results.csv의 열입니다), 능력은 소문자 cpk로 보고합니다. 같은 필드, 같은 산술, 실행 가능한 코드여서, 코드를 열어 보는 독자는 정확히 이 기록을 모순 없이 만납니다. 여기 해부는 데이터 기록 관점이고, 그 장은 같은 것의 SQL과 파이썬 관점입니다.

여전히 어려운 것: 공정이 움직일 때 골든 배치 모델을 유효하게 유지하기

위의 모든 것은 모델이 여전히 공정을 기술한다는 전제에 기댑니다. 이 데이터 흐름에서 진정으로 풀리지 않은 문제는 모델 표류(model drift) 입니다. 구체적으로는, 공정 자체가 그 아래에서 이동할 때 다중경로 PCA 골든 배치 지문을 어떻게 탐지하고 재밸리데이션하느냐 — 매번 모델 전체를 처음부터 재학습하지 않으면서 — 하는 것입니다.

함정은 방법 자체에 내장되어 있습니다. 다중경로 PCA 모델은 고정된 과거 우량 가동 라이브러리에서 학습한 "정상 배치"의 지문입니다 [3]. 그러나 그 라이브러리는 하나의 규모에서, 하나의 원료 로트 집합으로, 한 세대의 장비에서 수집되었습니다. 200 L 개발 리액터에서 2,000 L 제조 탱크로 스케일업하거나, 핵심 배지 성분의 새 로트로 바꾸거나, 프로브를 교체하면 진짜 정상 궤적은 움직이지만 모델의 정상 개념은 그대로입니다. 그러면 모델은 두 가지 해로운 일 중 하나를 합니다. 완벽하게 좋은 배치에 거짓 경보를 울리거나(기준선이 움직였기에 모든 새 배치가 "비정상"으로 보임), 누군가 소음을 잠재우려 한계를 넓힌 뒤로는 진짜 결함에 조용히 눈멀게 됩니다. 프로브 사례는 가상이 아닙니다. 한 통제 연구에서, 같은 라만 분석기의 두 프로브를 같은 배양에 같은 시각에 넣었을 때, 예측 변수에 대한 두 프로브의 불일치가 순전히 계측기 간 차이만으로 약 20%였고, 그 격차를 절반으로 줄이려면 보정 전이(calibration-transfer) 단계가 필요했습니다 [9] — 전체 궤적 지문을 불안정하게 만드는 바로 그 표류의 분광학 수준 버전입니다.

머신러닝 쪽에서 나온 두 가지 방법론적 논점이 골든 배치 모델에서 "유효(valid)"가 대체 무엇을 뜻하는지를 더 날카롭게 만드는데, 둘 다 틀리기 쉽습니다. 첫째는 애초에 그 지문을 어떻게 검증하느냐입니다. MPCA 모델의 한계는 한 번도 본 적 없는 배치에서 버텨 줘야 하므로, 검증용 보류 집합은 무작위로 흩어진 시점들이 아니라 배치 전체여야 합니다. 시점을 무작위로 나누는 것은 교과서적인 데이터 누출(data-leakage) 함정입니다. 한 배치의 점들은 심하게 자기상관되어 있어서, 무작위로 보류된 점은 모델이 학습한 점에서 불과 몇 초 떨어진 곳에 놓이고, 그래서 모델은 거의 암기에 가까운 방식으로 "통과"하며 한계는 실제 생산에서 그러할 것보다 훨씬 더 빡빡해 보입니다. 정직한 시험은 그룹화(배치 하나씩 빼기, leave-one-batch-out) 교차 검증입니다 — 한 번에 한 배치의 모든 점을 빼 두고, 나머지로 적합시킨 뒤, 진짜로 한 번도 보지 못한 그 배치로 모델을 판단하는 것 — 동반서의 모델과 검증 장이 소프트 센서를 위해 세우는 바로 그 규율입니다. 둘째는 적용 가능 영역(applicability domain, AD) — 모델이 발언할 자격이 있는 공정 공간의 영역 — 입니다. 호텔링 T 제곱과 SPE는 제대로 읽으면 바로 AD 게이트입니다. SPE가 큰 새 배치는 단지 "관리 이탈"인 것이 아니라 모델의 능력 밖(out of the model's competence), 즉 지문이 적합된 군집 바깥에 있는 것이며, 그 T 제곱 점수는 경보 대상이라기보다 신뢰할 수 없는 것으로 다뤄야 합니다. 모델이 지금 외삽(extrapolating)하고 있기 때문입니다. "AD 바깥"을 "규격 이탈"과 혼동하는 것은 규격 내 대 관리 상태 오류의 다변량 사촌입니다.

배치별로 색칠된 행에 대한 교차 검증 분할을 비교하는 두 패널 그림. 왼쪽 장미색 패널은 순진한 무작위 분할이자 데이터 누출로 표시되며, BATCH-2026-001, BATCH-2026-002, BATCH-2026-003의 행을 흩뿌려 같은 배치가 학습 열과 시험 열 양쪽에 들어가고, 한계가 실제 생산보다 훨씬 빡빡해 보인다는 판정을 보여줍니다. 오른쪽 초록색 패널은 그룹화(배치 하나씩 빼기)로 표시되며, BATCH-2026-003의 모든 행을 시험 배치로 보류하고 나머지 두 배치는 모두 학습으로 두어, 어떤 배치도 분할을 가로지르지 않고 모델이 진짜로 한 번도 보지 못한 배치로 판단됩니다. 무작위 분할은 자기상관된 같은 배치를 양쪽에 놓아 한계를 부풀리지만, 배치 하나씩 빼기는 배치 전체를 보류하므로 시험 배치가 진짜로 본 적 없는 것입니다. 저자가 AI의 도움을 받아 직접 제작한 그림입니다.

같은 렌즈가 그 핵심 긴장을 정확히 이름 붙입니다. 공정 표류(process drift)(살아 있는 시스템이 진짜로 움직이는 것 — 모델이 표시해야 할 진짜 이상 원인)와 모델 노후화(model staleness)(여전히 유효한 공정 아래에서 기준선이 이동하는 것 — 모델이 적응해야 할 공변량 이동(covariate shift))는 같은 SPE 이탈을 일으키며, 이 둘을 구별하는 것이 풀리지 않은 부분입니다. 머신러닝 용어로 둘은 서로 다른 탐지기를 필요로 합니다. 선행하는(leading), 레이블이 필요 없는 입력 분포 모니터(들어오는 태그에 대한 모집단 안정성 지수(Population Stability Index))는 어떤 품질 결과가 돌아오기도 전에 기준선의 이동을 보고, 후행하는(lagging) 예측 잔차 모니터는 관계 자체가 변했음을 확인하기 위해 느린 오프라인 분석을 기다려야 합니다 — 동반서의 MLOps 장이 온전히 풀어내는 두 탐지기 구분으로, 거기서는 관장되는 재학습이 변경 관리 사건으로서 곧장 CPV 기록으로 되먹여집니다.

이 문제를 단지 번거로운 것이 아니라 어렵게 만드는 것은, 순진한 해법 — 새 조건에 모델을 재학습하기 — 이 바로 이 장의 규제 틀과 정면으로 충돌한다는 점입니다. CPV와 ICH Q10 아래에서, GxP 결정에 닿는 모니터링 모델은 통제 대상 산출물입니다. 숫자가 표류할 때마다 조용히 재적합할 수 없습니다. 그러면 모델이 제공한다고 주장하는 "관리"는 반증 불가능해지기 때문입니다. 그래서 미해결 문제는 진정으로 양면적입니다. 통계적으로는, 모델이 표시해야 할 공정 표류와 모델이 적응해야 할 모델 노후화를 어떻게 구별하느냐(같은 신호가 둘 중 어느 것이든 될 수 있음), 이상적으로는 밸리데이션된 모델을 버리는 대신 지문의 영향받은 부분만 갱신하느냐; 절차적으로는, 그 적응을 변경 관리, 표류 탐지 임계값, 재밸리데이션 트리거 안에 가두어 갱신 자체가 감사 가능하게 만드느냐입니다. 정착되고 밸리데이션된 답은 없습니다. 부분 모델 갱신, 보정 전이, 형식적 표류 모니터가 모두 활발한 실무이지만 어느 것도 즉시 쓸 수 있는 해법은 아닙니다. 이것은 다음 장의 머신러닝 소프트 센서가 훨씬 더 강하게 부딪히는 바로 그 표류-재밸리데이션의 벽이며, 다른 모든 규제 기록과 마찬가지로 모델 갱신에도 같은 데이터 무결성 요구(ALCOA+)가 적용됩니다. 누가, 언제, 왜, 무엇으로부터 바꿨는가.

현장에서는

다변량 SPC는 이론이 아니라 주류입니다. 상업용 공정 분석 플랫폼은 이를 일상적인 일로 만듭니다. Sartorius SIMCA와 SIMCA-online(옛 Umetrics 도구), 그리고 AspenTech의 aspenProMV는 MPCA와 PLS 배치 모니터링을 기본 탑재해 출시하며, SAS JMP 같은 범용 도구는 PCA/PLS 다변량 관리도를 더합니다. 이들 모두가 일상적으로 쓰이고 있으며, 골든 배치 지문 기법은 대형 바이오제조사가 실시간 발효를 감시하고 결함을 조기에 탐지하는 표준적인 방법입니다 [2][3]. MasterControl, Sartorius SIMCA 같은 전용 CPV 및 추세 분석 제품군도 이제 평범한 품질 스택의 일부입니다. CPV 프로그램은 이제 모든 상업용 바이오의약품 허가의 당연한 일부가 되었으며, 사찰관은 추세 분석이 형식적인 것이 아니라 실제로 이루어지고 그에 따라 조치가 취해진다는 증거를 찾습니다 [1].

CPV의 어려운 부분은 통계가 아닙니다. 그것은 교과서에 있습니다 [7]. 어려운 부분은 모델이 돌아갈 수 있도록, 여러 계측기와 파트너로부터 깨끗하고, 정렬되고, 의미론적으로 일관된 배치 데이터를 실시간으로 흐르게 하는 일입니다. 데이터 배관을 해결하면 이 장의 분석은 거의 거저 따라오고, 그것을 무시하면 세상에서 가장 발전된 모델이라도 신뢰할 만한 읽을거리가 없게 됩니다.

핵심 용어

통계적 공정 관리(Statistical Process Control, SPC) — 통계를 사용해 정상적인 공정 변동과 의미 있는 변화를 구별하는 것.
우연 원인 변동 대 이상 원인 변동(common-cause vs special-cause variation) — 공정의 안정적인 배경 잡음 대 새롭고 규명 가능한 교란.
관리도(control chart) — 통계적 한계를 가진 시간 도표로, 잡음과 신호를 구별함.
관리 한계 대 규격 한계(control limit vs specification limit) — 공정이 실제로 어떻게 행동하는지 대 그것이 충족해야 하는 품질 요구 사항. 같은 것이 아님.
슈하트 / CUSUM / EWMA(Shewhart / CUSUM / EWMA) — 각각 단일 점, 누적 편차, 가중된 최근 이력에 반응하는 관리도.
1단계 대 2단계(Phase I vs Phase II) — 이력으로부터 관리도 한계를 설정하기 대 그 한계와 비교하여 실시간 데이터를 모니터링하기.
다변량 데이터 분석(Multivariate Data Analysis, MVDA) — 상관된 많은 변수를 하나씩이 아니라 함께 분석하기.
PCA / PLS — 상관된 많은 변수를 소수로 압축하는 잠재 변수 방법. PLS는 그 압축을 결과 예측에 초점을 맞춤.
호텔링 T 제곱 / SPE (Q)(Hotelling's T-squared / SPE (Q)) — 두 가지 다변량 관리도. 정상 영역에 있는가, 그리고 여전히 모델이 기대하는 대로 행동하는가.
기여도 도표(contribution plot) — 어떤 원래 변수가 다변량 경보를 일으켰는지 짚어 주는 진단 도구.
다중경로 PCA(Multiway PCA, MPCA) / 골든 배치 / 지문(MPCA / golden batch / fingerprint) — 과거의 성공한 가동으로부터 전체 배치 궤적을 모델링하여 새 배치를 실시간으로 모니터링하기.
I-MR 관리도 / Cpk(I-MR chart / Cpk) — 배치당 값 하나에 대한 개별값 / 이동 범위 관리도(d2 = 1.128로 연속 짝 차이에서 산포를 추정), 그리고 평균에서 더 가까운 규격 한계까지의 거리를 3시그마로 나눈 — 그 산포가 규격 안에 얼마나 여유 있게 들어가는지 재는 — 공정 능력 지수(Cpk ≥ 1.33이면 여유 있게 능력이 있음. 표본이 적으면 넓고 잠정적인 추정치가 됨).
관리 상태(state of control) — 변동이 시간이 지나도 예측 가능하고 확립된 통계적 한계 안에 머무는 공정. 이를 유지하는 것이 CPV와 ICH Q10의 명시적 목표.
지속적 공정 검증(Continued Process Verification, CPV) — FDA 3단계: 모든 상업용 배치를 영구적으로 데이터 기반 모니터링하기.
ICH Q10 — 관리 상태와 지속적 개선을 의무화하는 제약 품질 시스템 프레임워크.
모델 표류 / 재밸리데이션(model drift / re-validation) — 규모, 원료, 장비가 진짜 공정을 이동시킬 때 적합된 모니터링 모델이 서서히 무효화되는 현상. GxP 아래에서 이를 고치는 일은 조용한 재적합이 아니라 통제되고 감사 가능한 재밸리데이션이다.
하류 추세 분석(downstream trending) — CPV가 정제 사슬 전체에 걸친다는 것: UF/DF 전도도와 투과 유속 궤적, 바이러스 여과 완전성 시험 결과, 그리고 바이러스 불활화 유지 조건이 모두, 상류 발효조뿐 아니라, 추세 분석 가능한 특징을 내보낸다.
RDF 트리플 / 타입 지정 속성(RDF triple / typed property) — 주어–술어–목적어 사실(예: 한 로트의 cexMainPct 값)로, 그 술어의 의미가 온톨로지에 한 번 고정되어 질의가 모든 시스템에 걸쳐 같은 값에 닿게 함.
PROV-O 출처(PROV-O provenance) — 어떤 활동이 한 사실을 생성했는지 기록하는 W3C 어휘. SPC에 적용하면 어떤 관리 한계가 명명된 1단계 기준선에 의해 생성되었음을 포착하여 정직한 한계와 순환적인 한계를 구별함.
SHACL 형상(SHACL shape) — 로트 기록에 대해 고정된 규격(범위와 존재)을 게이트하는 닫힌 세계 제약. 존재하는 값만 찍는 SPC 관리도가 잡지 못하는, 빠진 필수 결과를 잡아냄.
SPARQL 역량 질문(SPARQL competency question) — CPV 추세를 그래프 질의("관리 한계를 벗어난 모든 로트")로 던져, 손으로 하는 스프레드시트 추출이 아니라 순회로 답하기.
지속체 대 발생체(continuant vs occurrent, BFO) — 로트(지속되며 추세 분석되는 것)와 배치 가동(일어났다가 끝나는 과정) 사이의 상위 온톨로지 구분. 이 둘을 구별해 두면 가동 결함을 그것이 오염시킨 로트들로 추적할 수 있음.
그룹화 / 배치 하나씩 빼기 교차 검증(grouped / leave-one-batch-out cross-validation) — 무작위 시점이 아니라 배치 전체를 보류하여 골든 배치 모델을 검증하기. 무작위 분할은 자기상관된 배치를 가로질러 누출되어 한계를 실제보다 더 좋게 보이게 함.
적용 가능 영역(applicability domain, AD) — 모델이 발언할 수 있는 공정 공간의 영역. 큰 SPE는 배치가 단지 관리 이탈인 것이 아니라 모델의 능력 밖(외삽)에 있다는 뜻.

이 다음은

이 고전적 방법들은 기술하고 탐지합니다. 현재 순간이 비정상일 때 알려 주는 것이죠. 그 다음 영역은 예측하는 것입니다. 실시간으로 측정할 수 없는 양을 추정하거나, 배치가 도착하기 전에 어디로 향하는지 예보하는 것입니다. 다음 장 머신러닝, 소프트 센서, 그리고 하이브리드 모델(Machine Learning, Soft Sensors, and Hybrid Models) 은 여기서 소개한 데이터 기반의 다변량적 사고 위에 곧바로 세워집니다. 측정하기 쉬운 값으로부터 측정하기 어려운 값을 추론하는 소프트 센서, 기전적 생물학과 데이터 기반 학습을 융합하는 하이브리드 모델, 그리고 GxP 환경 안에서 인공지능을 밸리데이션하는 독특한 과제를 다룹니다.

이 장에서 다루는 내용​

떨림과 신호 구별하기: 고전적 SPC​

측정값 하나로는 부족한 이유 — 그리고 너무 많으면 더 나쁜 이유​

1단계 모델 구축, 2단계 모니터링​

관리도 하나로는 부족한 이유: 다변량으로 가기​

PCA와 PLS: 상관된 변수를 압축하기​

호텔링 T 제곱과 SPE: 두 관리도, 두 질문​

골든 배치: 진화하는 공정을 모니터링하기​

지속적 공정 검증: 약속으로서의 모니터링​

왜 중요한가​

정렬된 태그에서 기계가 추론할 수 있는 사실로​

SPC 기록에서 결정으로: 출하 속성의 관리도 읽기​

여전히 어려운 것: 공정이 움직일 때 골든 배치 모델을 유효하게 유지하기​

현장에서는​

핵심 용어​

이 다음은​