데이터에서 지식으로: SPC, 다변량 분석, 지속적 공정 검증
📍 현재 위치: 제5부가 열립니다. 우리는 책 전체에 걸쳐 데이터를 신뢰할 수 있고, 연결되어 있으며, 의미 있게 만드는 데 시간을 쏟았습니다. 이제 마침내 그 데이터를 사용합니다. 숫자의 흐름을 제어, 보증, 그리고 조기 경보로 바꾸는 것입니다.
앞 장에서는 모든 것을 두 가지 위대한 구조물로 엮어냈습니다. 디지털 스레드(digital thread) 는 하나로 연결되고 추적 가능한 기록으로, 제품이 처음 설계 아이디어로 시작해 환자에게 도달하기까지 모든 과정을 따라갑니다. 모든 측정, 결정, 그리고 일탈이 하나의 사슬로 연결되어 있습니다. 디지털 트윈(digital twin) 은 공정을 살아 있는 계산 모델로 표현한 것으로, 그 스레드로부터 끊임없이 데이터를 공급받으며 실제 공장이 가동되는 모습을 그대로 반영합니다. 둘 다 눈부신 성취이지만, 아무도 그것을 읽지 않는다면 둘 다 무용지물입니다. 결코 분석하지 않는 스레드는 그저 보관함일 뿐이고, 아무도 들여다보지 않는 트윈은 아무도 보지 않는 대시보드에 지나지 않습니다.
이 장은 데이터를 읽는 일에 관한 것입니다. 거버넌스가 적용되고 연결된 숫자를 실제로 행동에 옮길 수 있는 지식으로 바꾸는 고전적 분석 기법들입니다. 이 방법들은 수십 년의 역사를 지녔고, 동료 심사를 거쳤으며, 규제 기대치에 깊이 자리 잡고 있습니다. 다음 장에 등장하는 모든 신기술이 그 위에 세워지는 토대입니다.
자동차 계기판을 떠올려 보세요. 속도계 바늘은 크루즈 컨트롤을 켜 두어도 조금씩 흔들립니다. 그 미세한 떨림은 정상이며 아무 문제가 없다는 뜻입니다. 하지만 온도계가 갑자기 치솟는다면 그것은 신호입니다. 무언가 특정한 변화가 일어났으니, 엔진이 한계를 넘기기 전에 차를 세워야 합니다. 이 장의 핵심 과업은 무해한 떨림과 의미 있는 신호를 구별하는 법, 그리고 계기 바늘이 빨간 선에 닿기 훨씬 전에 그 신호를 포착하는 법을 배우는 것입니다.
이 장에서 다루는 내용
먼저 단일 측정값을 위한 통계적 공정 관리(Statistical Process Control, SPC) 로 시작한 다음, 수백 개의 얽힌 변수를 가진 바이오공정이 왜 다변량(multivariate) 방법(PCA, PLS, 다변량 SPC)을 요구하는지 설명합니다. 이어서 지속적 공정 검증(Continued Process Verification, CPV), 즉 모든 상업용 배치를 영원히 감시해야 한다는 규제 규칙을 만나고, 그 약속이 실제로 어떤 데이터 인프라를 요구하는지 살펴봅니다.
떨림과 신호 구별하기: 고전적 SPC
모든 공정은 변동합니다. 같은 탱크에서 바이알 100개를 채우면 무게가 정확히 똑같지 않습니다. 월터 슈하트(Walter Shewhart)의 관리도 기법(1920~1930년대)에서 비롯되어 이후 W. 에드워즈 데밍(W. Edwards Deming)이 체계화한 통계적 품질 관리의 핵심 통찰은, 변동에 두 가지 종류가 있다는 것입니다 [7][8]. 우연 원인 변동(common-cause variation) 은 공정의 배경 소음으로, 피할 수 없는 수많은 작은 영향들의 총합입니다. 이는 안정적이고 예측 가능합니다. 이상 원인 변동(special-cause variation) 은 새롭고 규명 가능한 무언가입니다. 막힌 필터, 잘못된 원료 로트, 잘못 보정된 프로브 같은 것이죠. 그것이 바로 치솟는 온도계입니다 [7][8].
이 둘을 구분하는 도구가 관리도(control chart) 입니다. 측정값을 시간에 따라 도표로 그리고 관리 한계(control limits) 를 그리는데, 보통 과거 평균의 위아래로 3σ(3 표준편차)에 둡니다. 우연 원인 변동만 작용할 때 이 범위는 기대값의 약 99.7%를 담아내므로, 그 밖으로 벗어난 점은 통계적으로 충분히 드물어 조사할 가치가 있습니다. 한계 안에서 춤추는 점들은 우연 원인 잡음이고, 한계 밖으로 벗어난 점이나 비무작위 패턴(연속, 추세)은 조사해야 할 이상 원인을 알립니다 [7]. 가장 단순한 것은 각 점에 개별적으로 반응하는 슈하트 관리도(Shewhart chart) 입니다. 여기에 기억을 더한 두 사촌이 있습니다. CUSUM(누적합)과 EWMA(지수가중이동평균)는 작은 편차들을 시간에 따라 누적하므로, 슈하트 관리도라면 무시했을 느린 표류를 잡아냅니다 [7][5].
"규격 내(in spec)"는 "관리 상태(in control)"와 같지 않습니다. 규격 한계(specification limit) 는 품질 요구 사항으로, 제품이 합격하기 위해 충족해야 하는 값입니다. 관리 한계(control limit) 는 공정이 실제로 어떻게 행동하는지에 대한 통계적 기술입니다. 한 배치가 규격 안에 있으면서도 관리 상태에서 크게 벗어나 있을 수 있고(아직 요구 사항을 위반하지 않은 이상 원인일 뿐), 한 공정이 완벽한 관리 상태에 있으면서도 규격을 충족할 능력이 없을 수도 있습니다. 이 둘을 혼동하는 것은 제조 현장에서 가장 흔하고 값비싼 오류 중 하나입니다 [7].
문헌이 강조하는 한 가지 미묘한 점이 있습니다. 관리도를 만드는 일과 관리도를 사용하는 일은 서로 다른 작업이라는 것입니다. 1단계(Phase I) 는 과거 데이터를 분석해 "관리 상태"가 무엇인지 정의하고 한계를 설정하는 후향적 연구입니다. 2단계(Phase II) 는 실시간 모니터링으로, 새로운 점들을 그 확립된 한계와 비교해 점검합니다. 이 둘을 하나로 취급하는 것, 즉 판단하려는 바로 그 데이터로 한계를 설정하는 것은 관리도의 통계를 조용히 망가뜨립니다 [8].
관리도 하나로는 부족한 이유: 다변량으로 가기
이제 바이오공정 문제입니다. 현대식 바이오리액터의 한 번 가동은(고처리량 용기인 Sartorius ambr 250, 일회용 교반 탱크인 Cytiva Xcellerex XDR, 또는 록킹백 방식의 Cytiva WAVE 등) 숫자 하나가 아니라 수백 개로 기술됩니다. 온도, pH, 용존 산소, 교반, 여러 가스 유량, 공급 속도, 배출 가스 측정값, 수십 가지 온라인 및 오프라인 측정값이 며칠 동안 몇 초마다 표본 추출됩니다. 더 나아가 이 변수들은 깊이 상관(correlated) 되어 있습니다. 함께 움직인다는 뜻입니다. 교반을 높이면 용존 산소가 올라가고, 포도당을 공급하면 pH가 변합니다. 이들은 독립적인 다이얼이 아닙니다 [4].
이 문제를 300개의 개별 관리도를 그려서 풀 수는 없습니다. 개별 관리도는 각각 완벽하게 정상으로 보이면서도 그 조합은 기이할 수 있습니다. 키가 정상이고 몸무게도 정상이지만, 그 몸무게에 비한 키는 우려스러운 사람과 같습니다. 단변량 관리도는 상관 관계를 보지 못하며, 거짓 경보도 부풀립니다. 관리도를 늘릴수록 적어도 하나가 우연히 작동할 확률이 빠르게 올라가서, 수백 개의 관리도에서는 거짓 경보가 일상이 됩니다 [7][5].
센서 하나하나는 규격 안이지만 배치는 비정상입니다 — 다변량 관점만이 이를 포착합니다(Nomikos & MacGregor를 따름).
저자 원본 도해(AI 보조로 제작).
탈출구는 차원 축소(dimensionality reduction) 입니다. 주성분 분석(Principal Component Analysis, PCA) 은 기초가 되는 도구입니다. 데이터의 진짜 변동 대부분을 포착하는 소수의 새로운 결합 변수, 즉 주성분(principal components) 을 찾아내, 상관 관계를 활용해 수백 개의 측정값을 두세 개의 의미 있는 축으로 압축합니다 [4]. 그 짝꿍인 부분 최소 제곱(Partial Least Squares, PLS) 은 같은 압축을 수행하되, 공정 변수로부터 어떤 결과(예: 최종 제품 품질)를 예측하는 데 초점을 맞춥니다 [4]. 둘 다 잠재 변수(latent-variable) 방법입니다. 측정하는 수많은 것이 직접 볼 수 없는 소수의 숨은 것(세포 배양의 진짜 상태)에 의해 좌우된다고 가정하고, 그 숨은 동인을 재구성합니다 [4].
데이터를 압축하고 나면 수백 개가 아니라 단 두 개의 관리도로 모니터링합니다. 호텔링 T 제곱(Hotelling's T-squared) 은 묻습니다. 공정이 다변량 공간의 정상 영역에서 작동하고 있는가? 이는 개별 변수 하나하나가 멀쩡해 보일 때조차 비정상적인 조합을 잡아냅니다 [4][5]. 그 경보 임계값은 어림짐작이 아닙니다. 자유도 k와 (n−k) 를 갖는 F 분포(F-distribution)에서 도출되는데, 여기서 k는 유지한 주성분의 수이고 n은 관측치의 수이며, 보통 99% 신뢰 수준에 그어집니다(의도적인 절충으로, 대개 배치당 거짓 경보율을 약 1~2%로 맞춥니다). SPE 관리도(제곱 예측 오차, Q라고도 함)는 보완적인 질문을 합니다. 공정이 여전히 모델이 기대하는 대로 행동하는가, 아니면 모델이 한 번도 본 적 없는 진정으로 새로운 무언가가 나타났는가? 둘을 합치면 화면의 두 선만으로 거의 완전한 건강 점검을 해 줍니다 [4][5].
이 관리도 중 하나가 작동하면, 기여도 도표(contribution plot) 가 "원래 변수들 중 어느 것이 경보를 일으키는가?"에 답합니다. 조사자가 수백 개를 뒤지게 두는 대신 의심스러운 측정값을 곧장 가리켜 줍니다 [4].
골든 배치: 진화하는 공정을 모니터링하기
배치는 정상 상태가 아니라 궤적(trajectory) 입니다. 1일 차의 "정상" 온도는 5일 차의 정상 온도와 다릅니다. 배양은 자라고, 소비하고, 내내 변화합니다. 따라서 "관리 상태"의 기준 자체가 건강한 가동의 모양을 띤 움직이는 목표여야 합니다.
획기적인 해법은 노미코스(Nomikos)와 맥그리거(MacGregor)가 도입한 다중경로 PCA(Multiway PCA, MPCA) 입니다 [3]. 과거의 성공한 배치들, 즉 골든 배치(golden batches) 의 역사적 라이브러리를 가져옵니다. 각각은 모든 변수의 완전한 시간 궤적이며, 이 3차원 블록(배치 × 변수 × 시간)을 일반 PCA가 소화할 수 있는 형태로 펼칩니다(unfold). 그 결과는 좋은 배치가 그 생애의 매 순간 어떤 모습인지에 대한 다변량 지문(multivariate fingerprint) 입니다. 그런 다음 새로운 배치를 가동 중에 한 점 한 점, 그 골든 기준 분포에서 도출된 시간 가변 관리 한계와 비교하여 모니터링합니다 [2][3].
그 보상이 조기 결함 탐지(early fault detection) 입니다. 모델이 기대되는 궤적을 알고 있기 때문에, 발생 중인 문제는 대개 어떤 단일 센서가 한계를 위반하기 전에, 그리고 최종 품질 시험보다 훨씬 전에 T 제곱이나 SPE 관리도를 궤도에서 벗어나게 만듭니다. 조사하고 개입할 시간을 벌어 주는 것이죠. 실제로 얼마나 일찍 경고를 받느냐는 공정에 따라 다릅니다. 14일짜리 유가식 배양(fed-batch)에서는 여러 시간일 수 있지만, 빠른 연속 공정 단계에서는 몇 분일 수 있으며, 배치를 구해낼 수 있는지는 근본 원인에 달려 있습니다 [2].
좋은 배치들의 라이브러리에서 출발해, 새 배치를 실시간으로 궤적을 인식하며 다변량적으로 모니터링하기까지. 저자 작성 도해, Nomikos와 MacGregor를 따름.
지속적 공정 검증: 약속으로서의 모니터링
여기까지는 통계적 도구입니다. 이제 이 도구들을 선택이 아닌 필수로 만드는 규제의 힘이 등장합니다. FDA의 2011년 공정 밸리데이션(process validation) 지침은 밸리데이션을 3단계 생애주기로 재정의했습니다. 1단계(Stage 1) 는 공정 설계, 2단계(Stage 2) 는 공정 적격성 평가(상업 공정이 작동함을 입증), 그리고 결정적으로 3단계, 지속적 공정 검증(Stage 3, Continued Process Verification, CPV) 입니다 [1].
CPV는 밸리데이션이 결코 끝나지 않는다는 약속입니다. 제품의 상업적 생애 전체에 걸쳐, 제조사는 모든 배치의 데이터를 지속적으로 모니터링하고 추세를 분석(trend) 하여 공정이 관리 상태에 머물러 있다는 지속적 보증(ongoing assurance) 을 제공해야 합니다 [1]. 이 지침은 통계적 방법을 명시적으로 요구합니다. 바로 위에서 다룬 SPC와 추세 분석 도구로, 이상 원인 변동이 나타나는 즉시 탐지하고 시간이 지남에 따라 우연 원인 변동성을 줄이도록 이끄는 것입니다 [1]. 이는 한 번 작성해 제출하고 잊어버리는 연구가 아니라, 데이터로 끊임없이 공급되는 영구적 의무입니다. 그 추세 분석에 데이터를 공급하는 일 역시 선택이 아닙니다. 추세의 바탕이 되는 공정 중 시료 채취 및 시험은 공정 중 물질 및 의약품의 시료 채취 및 시험을 다루는 21 CFR 211.110이 다루는 것과 같은, cGMP의 공정 중 관리(in-process controls) 영역 안에 놓여 있습니다. 이 영역에서 제조사는 산출물과 변동성을 책임지는 공정의 성능을 모니터링하는 관리 절차를 수립하고 따릅니다. 그리고 CPV의 상당 부분이 분석 측정값 위에 세워지므로, 그 숫자를 만들어 내는 방법들은 ICH Q2(R2)(분석법 밸리데이션(analytical validation))와 ICH Q14(분석 절차 개발(analytical procedure development))의 생애주기 정신에 따라 목적에 적합한 상태를 유지하는 것이 좋습니다. 표류하는 분석법은 표류하는 공정으로 위장할 수 있기 때문입니다.
CPV는 홀로 떠다니지 않습니다. 그것은 제약 품질 시스템 프레임워크인 ICH Q10의 운영적 표현입니다. ICH Q10의 핵심 목표는 공정 성능 및 제품 품질 모니터링을 통해 제품 생애주기 전반에 걸쳐 관리 상태를 유지하고 지속적 개선(continual improvement) 을 추구하는 것입니다 [6]. SPC 관리도가 눈이라면, CPV와 ICH Q10은 그 눈을 계속 뜨고 있으라는 상시 명령입니다.
왜 중요한가
CPV는 분석을 최우선 순위의 데이터 관리 문제로 바꾸며, 앞서 다룬 모든 장의 가치를 거둬들입니다. 모든 배치를 영원히 추세 분석하려면, 제품의 전 생애에 걸쳐 이용 가능(available) 하고 지속되는(enduring) 역사적 데이터가 필요합니다(제3부의 ALCOA+와 보존 원칙). 배치 4번을 배치 4,000번과 비교하려면, 수년간의 계측기 및 소프트웨어 변경에도 모든 숫자가 동일한 의미를 가져야 합니다(제4부의 의미론과 디지털 스레드). 바로 이 때문에 장비와 태그 명명법을 위한 ANSI/ISA-95(IEC 62264)와 배치 레시피 구조를 위한 ISA-88(IEC 61512) 같은 표준이 그토록 중요합니다. 이들은 BR101.Temp.PV(바이오리액터 101, 온도, 현재값) 같은 태그가 모든 시스템과 모든 해에 걸쳐 동일한 물리적 대상을 의미하도록 지켜 줍니다. 모델은 결코 "그 바이오리액터"를 보지 않습니다. 모델이 보는 것은 다음과 같이 정렬된 행들입니다.
Timestamp,BatchID,BR101.Temp.PV,BR101.DO.PV,BR101.pH.PV
2026-06-14T08:00:00Z,BR101-2241,37.0,52.3,7.02
2026-06-14T08:00:05Z,BR101-2241,37.0,51.8,7.02
2026-06-14T08:00:10Z,BR101-2241,37.1,51.1,7.01
골든 배치 모델을 만들려면, 여러 시스템(히스토리언, MES, LIMS)에서 이렇게 정렬된 궤적 수천 개를 한꺼번에 끌어와야 하는데, 이는 제2부의 아키텍처와 연결성 표준이 실제로 그것들을 연결했을 때만 작동합니다. 그리고 CPV 시스템 자체가 GxP 아래에서 가동되므로, 다른 모든 규제 기록과 마찬가지로 밸리데이션되고, 감사 추적되며, 무결성이 관리되어야 합니다. 결국 CPV 프로그램은, 책의 나머지가 주장해 온 모든 데이터 거버넌스에 대한 청구서가 도래하는 순간입니다. 그 기초 작업을 건너뛰면 CPV는 숫자를 스프레드시트에 손으로 옮겨 적는 일로 전락합니다. 느리고, 오류가 잦으며, 가장 중요한 다변량 신호에는 눈먼 상태로 말입니다.
현장에서는
다변량 SPC는 이론이 아니라 주류입니다. 상업용 공정 분석 플랫폼은 이를 일상적인 일로 만듭니다. Sartorius SIMCA와 SIMCA-online(옛 Umetrics 도구), 그리고 AspenTech의 aspenProMV는 MPCA와 PLS 배치 모니터링을 기본 탑재해 출시하며, SAS JMP 같은 범용 도구는 PCA/PLS 다변량 관리도를 더합니다. 이들 모두가 일상적으로 쓰이고 있으며, 골든 배치 지문 기법은 대형 바이오제조사가 실시간 발효를 감시하고 결함을 조기에 탐지하는 표준적인 방법입니다 [2][3]. MasterControl, Sartorius Umetrics 같은 전용 CPV 및 추세 분석 제품군도 이제 평범한 품질 스택의 일부입니다. CPV 프로그램은 이제 모든 상업용 바이오의약품 허가의 당연한 일부가 되었으며, 사찰관은 추세 분석이 형식적인 것이 아니라 실제로 이루어지고 그에 따라 조치가 취해진다는 증거를 찾습니다 [1].
이곳이 바로 미국 NIIMBL 연구소와 그 실시간 실험실 데이터 개념 증명(proof of concept), 즉 깨끗하고 연결된 실험실 데이터를 실시간으로 흐르게 하는 작업이 놓이고자 하는 지점이기도 합니다(이는 미래 지향적 목표로서, 인근에 건설 중인 NIIMBL의 SABRE 시범 시설(cGMP 바이오제조 및 인력 양성 시설로, 첨단 바이오제조를 규모 확대하고 위험을 줄이기 위해 짓고 있음)이 이를 보완합니다). CPV의 어려운 부분은 통계가 아닙니다. 그것은 교과서에 있습니다 [7]. 어려운 부분은 모델이 돌아갈 수 있도록, 여러 계측기와 파트너로부터 깨끗하고, 정렬되고, 의미론적으로 일관된 배치 데이터를 실시간으로 흐르게 하는 일입니다. 데이터 배관을 해결하면 이 장의 분석은 거의 거저 따라오고, 그것을 무시하면 세상에서 가장 발전된 모델이라도 신뢰할 만한 읽을거리가 없게 됩니다.
핵심 용어
- 통계적 공정 관리(Statistical Process Control, SPC) — 통계를 사용해 정상적인 공정 변동과 의미 있는 변화를 구별하는 것.
- 우연 원인 변동 대 이상 원인 변동(common-cause vs special-cause variation) — 공정의 안정적인 배경 잡음 대 새롭고 규명 가능한 교란.
- 관리도(control chart) — 통계적 한계를 가진 시간 도표로, 잡음과 신호를 구별함.
- 관리 한계 대 규격 한계(control limit vs specification limit) — 공정이 실제로 어떻게 행동하는지 대 그것이 충족해야 하는 품질 요구 사항. 같은 것이 아님.
- 슈하트 / CUSUM / EWMA(Shewhart / CUSUM / EWMA) — 각각 단일 점, 누적 편차, 가중된 최근 이력에 반응하는 관리도.
- 1단계 대 2단계(Phase I vs Phase II) — 이력으로부터 관리도 한계를 설정하기 대 그 한계와 비교하여 실시간 데이터를 모니터링하기.
- 다변량 데이터 분석(Multivariate Data Analysis, MVDA) — 상관된 많은 변수를 하나씩이 아니라 함께 분석하기.
- PCA / PLS — 상관된 많은 변수를 소수로 압축하는 잠재 변수 방법. PLS는 그 압축을 결과 예측에 초점을 맞춤.
- 호텔링 T 제곱 / SPE (Q)(Hotelling's T-squared / SPE (Q)) — 두 가지 다변량 관리도. 정상 영역에 있는가, 그리고 여전히 모델이 기대하는 대로 행동하는가.
- 기여도 도표(contribution plot) — 어떤 원래 변수가 다변량 경보를 일으켰는지 짚어 주는 진단 도구.
- 다중경로 PCA(Multiway PCA, MPCA) / 골든 배치 / 지문(MPCA / golden batch / fingerprint) — 과거의 성공한 가동으로부터 전체 배치 궤적을 모델링하여 새 배치를 실시간으로 모니터링하기.
- 지속적 공정 검증(Continued Process Verification, CPV) — FDA 3단계: 모든 상업용 배치를 영구적으로 데이터 기반 모니터링하기.
- ICH Q10 — 관리 상태와 지속적 개선을 의무화하는 제약 품질 시스템 프레임워크.
이 다음은
이 고전적 방법들은 기술하고 탐지합니다. 현재 순간이 비정상일 때 알려 주는 것이죠. 그 다음 영역은 예측하는 것입니다. 실시간으로 측정할 수 없는 양을 추정하거나, 배치가 도착하기 전에 어디로 향하는지 예보하는 것입니다. 다음 장 머신러닝, 소프트 센서, 그리고 하이브리드 모델(Machine Learning, Soft Sensors, and Hybrid Models) 은 여기서 소개한 데이터 기반의 다변량적 사고 위에 곧바로 세워집니다. 측정하기 쉬운 값으로부터 측정하기 어려운 값을 추론하는 소프트 센서, 기전적 생물학과 데이터 기반 학습을 융합하는 하이브리드 모델, 그리고 GxP 환경 안에서 인공지능을 밸리데이션하는 독특한 과제를 다룹니다.