데이터 소스로서의 계측기와 센서
📍 현재 위치: 여기서 2부가 열립니다 — 공정 데이터가 어디서 태어나는지를 둘러보았으니, 이제 그것을 실제로 만들어내는 물리적 계측기들, 곧 우리 데이터 공급망의 첫 번째 진짜 소스들을 만나봅니다.
지난 장 공정 데이터가 태어나는 곳을 둘러보다(A Tour of Where Process Data Is Born)에서 우리는 단일클론항체(monoclonal antibody) — 살아 있는 세포가 키워내는 Y자 모양의 단백질 의약품 — 를 만드는 여정 전체를 걸으며, 모든 정거장을 데이터를 내보내는 장소로 다시 바라보았습니다. 그러나 우리는 그 데이터를 마치 저절로 나타나는 것처럼 다루었습니다. 데이터는 저절로 나타나지 않습니다. 모든 숫자, 스펙트럼(spectrum), 크로마토그램(chromatogram)은 물리적 장치 안에서 태어납니다. 탱크에 담근 프로브(probe), 용기에 빛을 쏘는 레이저, 품질 실험실에서 윙윙거리는 계측기 말입니다. 이 장은 바로 그 장치들 — 모든 제조 데이터가 흘러나오는 최초의 소스들 — 에 관한 것입니다.
현대의 자동차를 떠올려 보세요. 어떤 계기는 운전하는 내내 연속적으로 값을 읽습니다 — 속도, 연료, 엔진 온도 — 결코 대시보드를 떠나는 법이 없습니다. 또 어떤 것들은 정비소를 찾아가야 합니다. 거기서 정비공이 장비를 연결해, 주행 중에는 할 수 없는 더 깊은 진단을 돌립니다. 바이오리액터(bioreactor)도 마찬가지입니다. 어떤 계측기는 단 한 방울도 빼내지 않고 살아 있는 공정을 매 순간 지켜보고, 또 어떤 것은 시료를 뽑아 전용 장비로 가져갈 것을 요구합니다. 핵심은 각 계측기가 어떤 질문에 답할 수 있는지, 그리고 그것이 돌려주는 데이터가 어떤 모양인지를 아는 것입니다.
이 장에서 다루는 것
우리는 먼저 계측기를 공정에 대해 어디서 측정하는지에 따라 분류하는 법을 배웁니다. 그다음 프로브의 두 거대한 계열 — 단순한 단일 숫자 센서와 풍부한 분광(spectroscopic) 센서 — 와, 그 신호를 제어로 바꾸어 주는 PAT라는 프레임워크를 만납니다. 마지막으로 품질 실험실의 오프라인(off-line) 분석 계측기들을 둘러보고, 각 계측기가 어째서 특유의 **데이터 모양(data shape)**을 만들어내며 하류(downstream) 시스템이 그것을 담을 수 있도록 설계되어야 하는지를 살펴봅니다.
계측기가 측정하는 위치: 네 가지 장소
엔지니어는 모든 측정을 공정 흐름(process stream)과의 물리적 관계에 따라 분류합니다. 이 주제에 대한 규제 당국의 기초 지침 — 미국 FDA의 2004년 공정 분석 기술(Process Analytical Technology) 프레임워크 — 이 이 용어를 공식화했고, Rathore와 동료들의 널리 인용되는 리뷰가 이를 바이오의약품에 맞게 깔끔하게 정리했습니다 [1][2]. 네 가지 장소가 있습니다.
- 인라인(In-line) — 센서가 공정 흐름 안에 자리 잡고, 시료를 빼내지 않은 채 그 자리에서 측정합니다. 바이오리액터 액체에 잠긴 pH 프로브가 인라인입니다. 아무것도 빼내지 않으며, 측정은 액체가 사는 바로 그곳에서 일어납니다.
- 온라인(On-line) — 작은 곁가지 흐름(side-stream)이 공정에서 자동으로 빠져나와 측정되고, (흔히) 되돌아갑니다. 제품은 닫힌 무균(sterile) 시스템을 결코 떠나지 않지만, 측정은 주 흐름 안이 아니라 바로 그 옆에서 일어납니다. (배기가스 분석기(off-gas analyzer)도 느슨하게 여기에 묶이지만, 그것은 되돌아가는 액체 곁가지 흐름이 아니라 용기 상부 공간(headspace)을 떠나는 배기가스를 측정합니다.)
- 앳라인(At-line) — 시료가 공정에서 물리적으로 빠져나와 근처에서, 보통 장비 바로 옆에서, 수초에서 수분 안에 측정됩니다. 시료는 흐름을 떠나지만 방을 떠나지는 않습니다.
- 오프라인(Off-line) — 시료가 빠져나와 별도의 실험실로 옮겨지고, 거기서 크고 전용화된 계측기로 수 시간 또는 수일 뒤에 측정될 수도 있습니다.
이 차이는 학문적인 것이 아닙니다. 그것은 데이터가 얼마나 신선한지, 얼마나 자동으로 도착하는지, 그리고 결과가 공정이 아직 돌아가는 동안 그것을 조종할 수 있는지 아니면 끝난 뒤에 판정만 할 수 있는지를 좌우합니다.
측정 위치 분류 체계: 흐름에 가까울수록 데이터는 더 빠르고 더 연속적이며, 멀어질수록 더 결정적이지만 지연됩니다.
두 프로브 계열: 단일 숫자와 분광
인라인과 온라인의 세계 안에서 프로브는 크게 두 종류로 나뉘는데, 이 구분은 데이터에 있어 엄청나게 중요합니다.
**단변량 프로브(univariate probe)**는 한 번에 하나의 숫자를 돌려줍니다. ("단변량(univariate)"은 그저 변수가 하나라는 뜻입니다.) 고전적인 사총사는 온도, pH(액체가 얼마나 산성인지), 용존 산소(dissolved oxygen) 또는 DO(세포가 숨 쉬는 데 쓸 산소가 얼마나 있는지), 그리고 용존 이산화탄소를 측정합니다. 정전용량 프로브(capacitance probe) — 세포 배양 현장에서 오래 쓰여 온 예로 Aber Instruments Futura 계열이 있습니다 — 는 다섯 번째를 더합니다. 액체가 미세한 전기장에 어떻게 반응하는지를 감지함으로써, 아무도 세지 않아도 생존 세포 밀도(viable cell density) / 바이오매스(biomass) — 대략, 살아 있는 세포가 얼마나 있는지 — 를 추정합니다. 이들 프로브 각각은 시간에 따라 단일 측정값의 꾸준한 흐름을 만들어냅니다. 바로 스칼라 시계열(scalar time-series), 존재하는 가장 단순한 데이터 모양입니다 [2].
실제로 그 시계열은 히스토리언(historian)이나 평평한 파일(flat file)에 평범한 행(row)들로 떨어집니다. 한 바이오리액터에서 몇 초간의 값은 이렇게 보일 수 있습니다 — 타임스탬프 하나, 그다음 프로브당 한 열(column)씩입니다.
timestamp,pH_PV,DO_percent,temperature_C
2026-06-13T09:00:00Z,7.02,48.5,36.99
2026-06-13T09:00:05Z,7.01,48.2,37.00
2026-06-13T09:00:10Z,7.02,47.9,37.01
2026-06-13T09:00:15Z,7.00,47.6,37.00
열들은 태그(tag) 형식의 이름을 지닙니다 — pH_PV는 pH 루프의 *현재값(present value)*이며 — 같은 측정값이 다른 곳에서는 BR101.pH.PV 같은 태그로 지정될 수도 있습니다. 이 태그 관례는 자동화 장에서 만납니다.
계측화된 바이오리액터의 모식도: 온도, pH, 용존 산소 등을 위한 프로브들이 제어 및 데이터 시스템으로 연속 신호를 보냅니다.
Industrial bioreactor schematic. Image by NIST, public domain, via Wikimedia Commons.
**분광 프로브(spectroscopic probe)**는 훨씬 더 풍부합니다. 하나의 숫자 대신, 액체에 빛을 쏘고 시료가 수백에서 수천 개의 파장에 걸쳐 그 빛을 어떻게 흡수하거나 산란시키는지를 한꺼번에 기록합니다 — 바로 **스펙트럼(spectrum)**입니다. 스펙트럼은 많은 화학종을 동시에 반영하므로, 이들은 다변량(multivariate)("여러 변수") 계측기입니다. Lourenço와 동료들의 리뷰는 바이오리액터에서 쓰이는 주요 유형들을 살핍니다. UV-Vis(자외선과 가시광선), 근적외선(near-infrared, NIR) 광, 형광(fluorescence), 그리고 라만(Raman) 분광법입니다 [3]. 완전한 라만, NIR, 또는 형광 스캔은 같은 일반적 데이터 모양을 돌려줍니다. 강도(intensity) 값들의 긴 *벡터(vector)*로, 파장 하나당 숫자 하나입니다. 짚고 넘어갈 예외는 UV-Vis입니다. 전체 스펙트럼 UV-Vis 계측기는 다변량이지만, 많은 인라인 UV/Vis 프로브는 단 하나 또는 몇 개의 고정된 파장에서만 값을 보고합니다 — 600 nm에서의 광학 밀도 바이오매스 측정값(OD600)이나 280 nm에서의 단백질 농도(A280) — 그래서 빛을 쓰면서도 사실상 단변량 스칼라입니다.
라만은 바이오공정 엔지니어가 가장 자주 손을 뻗는 분광법입니다. 그것은 분자가 레이저광을 산란시키는 희미하고 특징적인 방식을 측정합니다. 물은 약한 라만 산란체이므로 수용액 시료는 깨끗한 스펙트럼을 줍니다 — 물이 강하게 흡수하여 신호를 뒤덮어 버리는 적외선 방법에 비한 이점입니다 — 다만 생물학적 매트릭스(matrix)에서 간섭을 일으킬 수 있는 형광 배경(background)을 대가로 치릅니다. 바이오리액터를 위해 만들어진 상용 인라인 라만 시스템은 이제 익숙한 장비가 되었습니다 — Kaiser Optical Systems의 RamanRxn 프로브(현재 Endress+Hauser 소속)와 Tornado Spectral Systems의 분석기(현재 Bruker 소속)가, 공장 엔지니어라면 알아볼 두 가지 예입니다. 2011년의 획기적인 연구에서 Abu-Absi와 동료들은 단 하나의 인라인 라만 프로브가 포유류 세포 바이오리액터 안에서 글루코스(glucose)(세포의 먹이), 젖산(lactate)(노폐물), 글루타민(glutamine), 그리고 생존 세포 밀도 / 바이오매스 — 정전용량 프로브가 추정하는 바로 그 양 — 를 실시간으로 동시에 추적할 수 있음을 보였습니다 [4]. 이 네 가지 출력 각각 — 글루코스, 젖산, 글루타민, 바이오매스 — 은 학습 데이터로 구축된 저마다의 다변량 보정 모델(multivariate calibration model)을 필요로 합니다. 하나의 라만 스펙트럼은 네 개의 별도로 검증된 모델이 그것을 추출해 내기 전까지는 네 개의 측정값을 "담고" 있지 않습니다(이 점은 PAT에서 다시 다룹니다). 이후 권위 있는 리뷰들은 라만을 초기 개발부터 상업적 제어에 이르기까지 제약 제조와 바이오공정 전반의 주류 도구로 확립했습니다 [5][6]. 더 폭넓은 조사들은 상류(upstream)와 하류(downstream)를 막론하고 분광 계열 전체에 대해 같은 패턴을 확인합니다 [7].
PAT: 단지 센서가 아니라 프레임워크
라만 스펙트럼은 글루코스 농도가 아닙니다. 그것은 수천 개의 강도 숫자입니다. 그 원시 스펙트럼을 "글루코스가 리터당 4.2 그램"으로 바꾸려면 화학계량 모델(chemometric model) — 미리 구축되고 보정된 수학적 레시피로, 스펙트럼 지문을 농도로 사상(mapping)하는 것 — 이 필요합니다 [3][7]. 계측기는 감지하고, 모델은 해석합니다. 그 레시피를 만드는 일 자체가 하나의 소프트웨어 작업입니다. 실무자는 보통 전용 화학계량 패키지 — Eigenvector Research의 PLS_Toolbox, Sartorius의 SIMCA, 또는 JMP Pro 같은 범용 통계 도구 — 에서 그러한 모델을 적합(fitting)시키며, 대개 스펙트럼을 알려진 기준값에 연결하는 부분 최소제곱 회귀(partial-least-squares regression)를 씁니다.
측정과 모델의 이 짝지음이 **공정 분석 기술(Process Analytical Technology, PAT)**의 핵심입니다. FDA의 2004년 지침은 PAT를 의도적으로 폭넓게 정의합니다. 장치들의 목록이 아니라, 핵심 품질 및 성능 속성을 시의적절하게 측정함으로써 제조를 설계하고 분석하고 제어하기 위한 시스템 — 그 목표는 끝에서 품질을 시험하는 것이 아니라 품질을 안에 구축하는 것 — 이라고요 [1]. 그 관점에서 보면, 센서는 그 데이터가 실제로 공정을 이해하고 조종하는 데 쓰일 때 비로소 "PAT"가 됩니다.
스펙트럼을 농도로 변환하는 화학계량 모델은 뒤 장들이 **소프트 센서(soft sensor)**라 부르는 것의 씨앗입니다 — 어떤 물리적 프로브도 직접 측정하지 않은 값을, 다른 신호들로부터 추론해 보고하는 "가상 계측기"입니다. 우리는 머신러닝과 소프트 센서를 다루는 장에서 소프트 센서를 제대로 만납니다. 지금은 다만 그것이 소비하는 데이터 모양이 여기서 만들어진 스펙트럼임을 알아두세요.
이러한 모델 기반 방법이 이제 품질 의사결정에 쓰이기 때문에, 규제 당국은 그것을 관리되는 분석 절차로 다룹니다. 2023년에 채택된 국제 가이드라인 ICH Q14는 그러한 절차 — NIR 같은 다변량, 분광 방법을 포함하여 — 를 적절한 보정과 지속적인 수명주기(lifecycle) 모니터링과 함께 개발하는 과학 및 위험 기반(risk-based) 방식을 제시합니다 [8]. 같은 기대는 대서양 양안의 구속력 있는 규제에도 나타납니다. 미국에서는 21 CFR 211.160과 211.165가 결과가 출하를 뒷받침하기 전에 시험 방법이 검증(validation)되고 장비가 적격성 평가(qualification)를 받을 것을 요구하며, 유럽연합에서는 EU Annex 11(EU GMP의 전산화 시스템 부속서)이 그 4절에서 검증과 적격성 평가를, 1절에서 시스템 수명주기 전반에 걸친 위험 관리(risk management)를 요청합니다. 그곳에 이르기 위한 제약 업계의 실무 지침서인 GAMP 5는 화학계량 모델이나 분석 계측기가 거치게 되는 검증 수명주기 단계를 제시합니다. 다시 말해, 계측기는 중립적인 사실 기계가 아닙니다. 그것은 검증되고 버전 관리되는 데이터 소스입니다.
품질 실험실의 분석 계측기
모든 질문에 탱크 속 프로브가 답할 수 있는 것은 아닙니다. 제품 품질에 대한 가장 결정적인 측정 — 이것이 정말로 맞는 항체인가, 그리고 얼마나 순수한가? — 은 품질 관리(quality control, QC) 실험실의 크고 오프라인인 계측기에서 나옵니다.
품질 관리(QC) 실험실의 실험실 원심분리기 — HPLC·LC-MS·CE 같은 분석 계측기가 제품 품질 속성을 정의하는 크로마토그램과 결과를 내놓기 전에, 시료를 준비하고 정제하는 오프라인 일꾼입니다.
실험실 원심분리기. 이미지: Ivangiesen, CC0(퍼블릭 도메인 헌정), Wikimedia Commons.
대표적인 일꾼들은 다음과 같습니다.
-
HPLC / UPLC — 고성능(또는 초고성능) 액체 크로마토그래피(high- or ultra-performance liquid chromatography). QC 분석가라면 망설임 없이 이름을 댈 상용 플랫폼 — Waters ACQUITY UPLC, Agilent 1290 Infinity II, Shimadzu Nexera 계열 — 에서 돌립니다. 시료가 충전된 컬럼(column)을 통과하는데, 거기서 서로 다른 분자가 서로 다른 속도로 이동해 분리되어 나옵니다. 계측기는 **크로마토그램(chromatogram)**을 기록합니다. 시간에 따른 검출기 신호의 곡선으로, 그 봉우리(peak)들이 각 성분이 얼마나 있는지를 드러냅니다. 그러한 분석 한 번의 처리된 결과는 본질적으로 작은 표입니다 — 각 행이 하나의 봉우리이며 — 이렇게 생겼습니다.
머무름 시간(retention time, 분) 봉우리 면적(peak area) 분석물(analyte) 7.83 1,284,500 주 항체 (단량체, monomer) 6.41 51,200 고분자량 응집체(high-molecular-weight aggregate) 9.12 18,640 저분자량 단편(low-molecular-weight fragment) 이 세 개의 숫자는 수만 개의 원시 점으로 이루어진 크로마토그램을 압축한 것일 수 있습니다 — 바로 이것이 원시 파일과 처리된 결과를 둘 다 보관해야 하는 이유이며, 아래에서 다시 다룰 구분입니다.
-
CE — 모세관 전기영동(capillary electrophoresis). 분자를 전기장 아래 가는 관으로 밀어 넣어 분리하며, 마찬가지로 봉우리를 지닌 트레이스(trace)를 산출합니다.
-
질량분석(mass spectrometry, MS) — 보통 크로마토그래피와 짝지어 LC-MS로 쓰이며, 분자의 무게를 비범한 정밀도로 잽니다. Rogers와 동료들은 고분해능 MS **다속성 방법(multi-attribute method, MAM)**을 소개했습니다 — 바이오의약품의 많은 품질 속성을 한 번의 LC-MS 분석으로 정량하여 특성 분석, QC 시험, 출하/처분(release/disposition) 결정을 뒷받침하려는 방법입니다 [9]. (Rogers와 동료들이 2015년에 발표했을 당시, MAM은 일부 시설에서 이미 사용되고 있던 발전 중인 방법이었지만, 아직 출하 시험에 보편적으로 채택되지는 않았습니다.) 그 데이터는 고차원입니다. 크로마토그램을 따라가는 모든 지점에서의 질량 스펙트럼입니다.
-
ddPCR — 디지털 액적 PCR(droplet digital PCR). 특정 DNA 분자를 하나씩 세며, 예컨대 잔류 숙주세포 DNA를 측정하는 데 쓰입니다. 그 출력은 스펙트럼이나 크로마토그램, 이미지가 아니라 단일 스칼라/계수(count) 결과 — 하나의 농도 — 이므로, 그 데이터 모양은 스칼라, 곧 아래에 정리된 모양들 가운데 가장 단순한 것입니다.
이들 계측기는 혼동하기 쉽지만 반드시 구분해 두어야 하는 두 층의 데이터를 만들어냅니다. 원시 파일(raw file)(계측기의 완전한 원천 기록 — 그것이 포착한 모든 데이터 점)과 처리된 결과(processed result)(그로부터 도출된 적분 봉우리 면적, 계산된 농도, 합격/불합격 판정)입니다. 원시 파일은 증거이고, 처리된 결과는 결론입니다. 건전한 데이터 관리는 둘 다 보존합니다.
데이터 모양과 그것이 중요한 이유
이 모든 계측기를 관통하는 하나의 패턴이 있습니다. 각 계열은 특유의 데이터 모양을 만들어내며, 그 모양이 데이터를 어떻게 저장하고, 크기를 잡고, 통합해야 하는지를 좌우합니다 [2][3][9]. 마지막 열의 크기와 속도는 예시적인 자릿수 규모입니다 — 그 참고문헌에서 가져온 수치가 아니라, 규모를 전달하기 위한 저자의 대략적인 추정치입니다.
| 계측기 | 데이터 모양 | 대략적인 크기와 속도 |
|---|---|---|
| 단변량 프로브 (온도, pH, DO, 용존 이산화탄소, 정전용량) | 스칼라 시계열 | 하나의 숫자, 초당에서 분당까지 여러 번 |
| 분광 프로브 (라만, NIR, 형광) | 스펙트럼: 벡터 | 스캔당 수백에서 수천 개의 숫자 |
| 크로마토그래피 (HPLC, CE) | 크로마토그램: 신호-대-시간 곡선 | 주입(injection)당 수천 개의 점 |
| 질량분석 (LC-MS / MAM) | 시간에 걸친 고차원 스펙트럼 | 분석당 메가바이트에서 기가바이트 |
| 이미징 / 현미경 | 이미지 (픽셀 격자) | 큰 이진(binary) 파일 |
스칼라 측정값은 저장하기는 사소하지만 쉴 새 없이 도착하므로, 그 부피는 수 주에 걸친 배양 동안의 높은 샘플링 속도에서 나옵니다. 스펙트럼은 하나의 타임스탬프가 찍힌 벡터입니다 — 그리고 단일 숫자만을 위해 설계된 데이터베이스는 그것을 우아하게 담는 데 애를 먹습니다. 크로마토그램은 그것을 해석하는 소프트웨어와 방법 없이는 거의 의미가 없는 곡선입니다. 질량분석 분석 하나는 기가바이트가 될 수 있습니다. 스칼라만을 위해 저장 공간을 계획하면, 첫 라만 프로브나 LC-MS 계측기가 시스템을 압도할 것입니다.
왜 중요한가
이 책의 모든 뒤 개념 — 공정 제어, 전자 배치 기록(electronic batch record), 데이터 무결성(data integrity), 분석 — 은 이러한 1차 소스 위에 놓여 있습니다. 계측기의 측정 위치를 모르면, 그 데이터가 얼마나 신선한지, 또는 그것이 실시간 제어를 구동할 수 있는지를 알 수 없습니다. 계측기의 데이터 모양을 존중하지 않으면, 우리는 정보를 슬그머니 떨어뜨리는 저장과 통합을 만들게 됩니다. 라만 스펙트럼이 단일 숫자로 납작해지거나, 크로마토그램이 그 밑바탕 곡선은 버려진 채 판정 하나로 저장되는 식으로요. 소스의 모양은 그 하류에 있는 모든 시스템의 첫 번째 설계 제약입니다.
실제 현장에서
현대의 연속 바이오 제조 — 미국 NIIMBL 연구소가 발전시키고 있으며, SABRE라 불리는 새로운 파일럿 규모 cGMP(current Good Manufacturing Practice) 시설(지금 NIIMBL 옆에 건설 중이며, 첨단 바이오 제조를 규모 확대하고 위험을 줄이며 가르치기 위한 시설)이 가동에 들어가도록 도울 종류 — 는 인라인과 온라인 PAT에 크게 의존합니다. 흐르는 공정은 행동에 나서기 전 수 시간씩 오프라인 실험실 결과를 기다릴 수 없기 때문입니다. 인라인 라만과 NIR 프로브는 화학계량 모델과 짝을 이루어, 그러한 시설이 글루코스, 제품 역가(titer), 불순물을 연속적으로 지켜보고 즉석에서 조정하게 해줍니다 — FDA가 2004년에 짜낸 바로 그 PAT 비전입니다 [1][6]. 한편 QC 실험실의 오프라인 LC-MS와 다속성 방법은 제품 품질에 대한 결정적이고 규제 등급의 판정을 제공합니다 [9]. 진짜 공장은 두 세계를 동시에 돌립니다 — 제어를 위한 빠르고 연속적인 신호와, 출하를 위한 느리고 결정적인 결과 — 그리고 데이터 아키텍처는 둘 다를 떠받쳐야 합니다.
핵심 용어
- 인라인 / 온라인 / 앳라인 / 오프라인(In-line / on-line / at-line / off-line) — 측정이 일어날 수 있는 네 가지 장소로, 흐름 안에서부터 멀리 떨어진 실험실까지, 대략 가장 빠른 것에서 가장 결정적인 것 순으로 늘어선 것.
- 단변량 프로브(univariate probe) — 한 번에 하나의 숫자를 돌려주는 센서(온도, pH, 용존 산소, 용존 이산화탄소, 정전용량/바이오매스).
- pH — 액체가 얼마나 산성인지를 나타내는 숫자.
- 용존 산소(dissolved oxygen, DO) — 세포가 숨 쉬는 데 쓸 산소가 액체 속에 얼마나 있는지.
- 정전용량 / 바이오매스 프로브(capacitance / biomass probe) — 살아 있는 세포가 전기장에 어떻게 반응하는지로부터 생존 세포 밀도(바이오매스)를 추정하는 프로브.
- 생존 세포 밀도(viable cell density, VCD) / 바이오매스(biomass) — 배양액에 살아 있는 세포가 얼마나 있는지; 정전용량 프로브로 전기적으로, 또는 라만으로 광학적으로 추정됨.
- 분광 프로브(spectroscopic probe) — 많은 파장에 걸쳐 스펙트럼을 기록하는 다변량 계측기(라만, NIR, 형광, 전체 스펙트럼 UV-Vis).
- 스펙트럼(spectrum) — 파장마다 하나씩의 강도 값으로 이루어진 벡터로, 많은 화학종을 한꺼번에 반영함.
- 화학계량 모델(chemometric model) — 스펙트럼을 농도나 다른 속성으로 변환하는 보정된 수학적 레시피.
- 공정 분석 기술(Process Analytical Technology, PAT) — 단지 센서 자체가 아니라, 시의적절한 측정을 통해 제조를 설계하고 분석하고 제어하는 FDA 프레임워크.
- 소프트 센서(soft sensor) — 어떤 값을 직접 측정하기보다 다른 신호들로부터 추론하는 가상 계측기.
- HPLC / UPLC — 혼합물을 분리하고 크로마토그램을 기록하는 액체 크로마토그래피.
- 크로마토그램(chromatogram) — 시간에 따른 검출기 신호의 곡선으로, 그 봉우리가 성분을 정량함.
- 질량분석(mass spectrometry, MS / LC-MS) — 분자의 무게를 정밀하게 재는 계측기; 다속성 방법(MAM)의 기반.
- 다속성 방법(multi-attribute method, MAM) — 많은 제품 품질 속성을 한꺼번에 측정하는 단일 LC-MS 방법.
- ddPCR — 디지털 액적 PCR(droplet digital PCR)로, 특정 DNA 분자를 하나씩 셈.
- 원시 파일 대 처리된 결과(raw file vs. processed result) — 계측기의 완전한 원천 기록과, 그로부터 도출된 적분·계산된 결론.
- 데이터 모양(data shape) — 계측기 출력이 취하는 구조적 형태: 스칼라, 스펙트럼 벡터, 크로마토그램, 또는 이미지.
이 다음은
이제 우리는 프로브와 계측기에서 쏟아져 나오는 원시 신호를 손에 쥐었습니다 — 그러나 신호는 아직 제어된 공정도, 저장된 기록도 아닙니다. 센서와 데이터베이스 사이에는 **자동화 계층(automation layer)**이 자리합니다. 다음 장 자동화와 공정 제어 데이터(Automation and Process Control Data)는 이 계측기 신호를 읽고, 그에 따라 행동하며, 그 과정에서 완전히 새로운 부류의 데이터 — 설정값(setpoint), 알람, 이벤트, 레시피 — 를 만들어내는 제어기들, 즉 PLC, DCS, SCADA를 소개합니다. 거기서 우리는 ISA-88 배치 제어 표준을 만나고, 이 제어 및 레시피 데이터가 어떻게 전자 배치 기록의 척추가 되는지를 보게 될 것입니다.