본문으로 건너뛰기

공정 데이터가 태어나는 곳들

📍 현재 위치: 데이터 한 점의 생애주기에서 하나의 데이터 점이 생애주기를 거치는 과정을 따라가 보았으니, 이제 공장 전체로 시야를 넓혀 — 단일클론항체(monoclonal antibody) 공정 전체를 공정 데이터가 태어나는 장소들의 사슬로서 다시 한번 걸어봅니다.

앞 장에서 우리는 센서나 분석자가 측정값을 만들어내는 순간부터 포착, 맥락화, 그리고 보관에 이르기까지 하나의 측정값을 추적했습니다 — 이것이 바로 이 책의 모든 내용을 떠받치는 척추인 데이터 생애주기(data lifecycle)입니다. 또한 우리는 메타데이터(metadata) — 어떤 값이 무엇을, 언제, 어디서, 어떤 조건에서 기록되었는지 말해주는 맥락 — 가 없는 원시 데이터(raw data)는 그저 잡음에 불과하다는 것을 배웠습니다. 이제 자연스럽게 다음 질문이 떠오릅니다. 그 모든 데이터 점들은 실제로 어디서 오는 것일까요? 그 답을 찾기 위해 우리는 바이오의약품 공장을 걸어서 둘러보되, 한 가지 비틀기를 더합니다. "각 기계가 무엇을 만드는가?"를 묻는 대신, "각 기계가 어떤 데이터를 내보내는가?"를 묻습니다.

쉽게 말하면

바쁜 식당 주방을 둘러보는데, 음식은 볼 수 없고 주문표만 볼 수 있다고 상상해 보세요. 각 조리대 — 그릴, 튀김기, 플레이팅 작업대 — 는 저마다의 방식으로, 저마다의 리듬에 따라 자기만의 주문표를 토해냅니다. 바이오공정(bioprocess)도 마찬가지입니다. 모든 장비가 조용히 서로 다른 종류의 "주문표"를 찍어내고 있으며, 우리가 할 일은 공장을 액체의 흐름이 아니라 주문표의 흐름으로 읽어내는 것입니다.

이 장에서 다루는 내용

우리는 표준 공정도를 데이터 지도로, 조리대별로 — 상류(upstream) 세포 배양, 하류(downstream) 정제, 충전·마감(fill-finish), 그리고 품질관리(quality control) — 다시 그려볼 것입니다. 그 과정에서 1부의 나머지 내용이 토대로 삼는 두 가지 개념을 소개합니다. 공정 진행 중에 측정되는 데이터와 공정 이후에 측정되는 데이터의 차이, 그리고 모든 조리대의 데이터를 하나의 일관된 이야기로 엮어내는 배치 계보(batch genealogy) 개념입니다. 마지막으로 연속 제조(continuous manufacturing)가 데이터의 모양 자체를 어떻게 바꾸는지 살펴보며 마무리합니다.

공정도는 곧 데이터 지도다

단일클론항체(monoclonal antibody, mAb) 는 살아있는 세포가 키워내는 치료용 단백질로 — 암과 자가면역 질환을 치료하는 데 쓰이는 종류의 의약품입니다. 이것을 만드는 일은 단위 조작(unit operation) 의 릴레이 경주입니다. 단위 조작이란 각각 전용 장비(바이오리액터, 크로마토그래피 컬럼, 필터)가 수행하는 개별적인 처리 단계를 말합니다. 이 공정을 그리는 전통적인 방식은 물질의 흐름으로 — 세포가 들어가고 정제된 약물이 나오는 것으로 — 표현하는 것입니다.

하지만 물질 다이어그램에는 결코 나타나지 않는, 또 하나의 평행한 흐름이 있습니다. 바로 데이터입니다. 현대 바이오공정의 기초 원리 — FDA의 공정 분석 기술(Process Analytical Technology, PAT) 프레임워크에서 규제기관이 공식화한 것으로, 이는 최종 제품만 시험하는 대신 공정이 진행되는 동안 측정함으로써 품질을 공정 안에 구축하도록 권장하는 지침입니다 [8] — 은 품질이 각 단계의 측정을 통해 이해되고 관리되어야 한다는 것입니다 [1]. 다시 말해, 모든 단위 조작은 동시에 데이터 스테이션(data station) 이기도 합니다. 각 단위 조작은 센서 판독값, 프로브 추적선(probe trace), 분석기 출력의 특징적인 서명을 생성하며, 이를 한데 모으면 그 안에서 무슨 일이 일어났는지 묘사하게 됩니다 [2].

그 렌즈를 끼고 보면 공장이 다르게 보입니다. 다음은 똑같은 mAb 공정을 각 조리대가 내보내는 데이터로 그린 것입니다.

각 조리대는 서로 다른 종류의 데이터를 내보냅니다. 제조 라인은 동시에 데이터를 생성하는 라인이기도 합니다.

온도, pH, 용존 산소를 측정하는 프로브가 장착된 벤치 규모 바이오리액터 프로브가 장착된 벤치 규모 바이오리액터 — 연속적인 온도, pH, 용존 산소 추적선을 생성하는 상류 데이터 소스. 이것은 벤치/개발 규모의 용기이지만, 아래에서 설명할 훨씬 큰 생산 탱크와 동일한 계측 장비를 갖추고 있어 함께 보여줍니다. Bench-scale bioreactor. Image by Jonas Schenk, public domain, via Wikimedia Commons.

상류: 시계열의 분수인 바이오리액터

상류(upstream)란 세포 배양과 제품 생성을 의미합니다 — 세포를 키우는 일부터 수확(harvest), 즉 배양물이 세포로부터 분리될 준비가 된 시점까지의 모든 것입니다. (수확과 그 바로 다음의 청징 단계가 상류와 하류를 가르는 관례적인 경계입니다.) 상류의 중심에는 바이오리액터(bioreactor) 가 있습니다 — 세포가 살면서 제품을 분비하는, 계측 장비를 갖춘 큰 탱크입니다. 데이터 스테이션으로서 바이오리액터는 공장 전체에서 가장 시끄럽고 가장 연속적인 곳입니다.

탱크 안의 프로브들은 몇 초마다 온도(temperature), pH(산성도), 용존 산소(dissolved oxygen)(세포가 호흡할 수 있는 산소)를 읽어내며, 조밀한 시계열(time-series) 데이터 — 측정된 시각이 찍힌 값들의 흐름 — 를 만들어냅니다. 전형적인 표본 하나는 히스토리언(historian)에 BR101.Temp.PV,2026-06-13T08:00:00Z,37.5,degC 와 같은 한 줄 — 하나의 태그, 하나의 타임스탬프, 하나의 값, 하나의 단위 — 으로 들어오며, 이런 줄이 분당 수백 개씩 도착합니다. 그 위에 개별 이벤트(discrete events) 가 겹쳐집니다. 각각의 영양분 피드, pH를 교정하기 위한 각각의 염기 투여량, 채취되는 각각의 시료가 그것입니다. 그리고 점점 더, 라만(Raman)과 같은 분광 프로브 — 배양액 안으로 빛을 쏘아 그 빛이 산란되는 방식으로부터 화학 조성을 추론하는 — 가 바이오리액터를 그 자체로 하나의 다변량(multivariate) 데이터 소스로 만듭니다. 하나의 인라인(in-line) 라만 프로브가 포도당, 젖산, 글루타민, 그리고 생존 세포 밀도를 실시간으로 동시에 추적할 수 있음이 입증된 바 있어 [4], 과거에는 네 번의 개별적인 실험실 채취였던 것이 하나의 연속적인 스트림이 됩니다. 라만과 그 사촌격 기술들은 다음 장에서 제대로 소개합니다. 여기서는 바이오리액터 하나만으로도 수십 개의 상관된 채널을 한 번에 내보낼 수 있다는 것을 보는 것으로 충분합니다.

이는 우리의 첫 번째 큰 구분을 도입합니다. 모든 측정이 공정 흐름에 대해 같은 위치에서 이루어지는 것은 아닙니다. 측정은 센서가 공정 흐름 안에 자리 잡고 시료를 빼내지 않은 채 그 자리에서 읽어낼 때 인라인(in-line) 입니다 — 배양액에 잠긴 온도 프로브가 인라인이며, 결과는 연속적으로 도착합니다. 대신 기술자가 시료를 뽑아 가까이서 곧바로 읽을 때 그 측정은 앳라인(at-line) 입니다. 그리고 인라인과 앳라인 사이에 자리 잡은 세 번째 위치, 온라인(on-line) 이 있습니다 — 작은 부분 흐름(side-stream)이 공정에서 자동으로 분기되어 나와 측정되고, 종종 되돌아갑니다 — 바로 이 때문에 "온라인" 데이터는 "인라인" 데이터와 완전히 같지는 않습니다. 이 세 가지 — 인라인, 온라인, 앳라인 — 가 FDA의 PAT 프레임워크가 정의하는 공정 분석기(process-analyzer) 모드입니다 [8]. 이에 대비되는 것이 오프라인(off-line) 측정 — 시료를 가져가 나중에 별도의 실험실에서 분석하는 것 — 으로, 이는 측정을 공정에 더 가까이 옮김으로써 PAT가 줄이고자 하는 관례적인 방식입니다. 바로 다음 장에서 이 네 가지 위치를 모두 상세히 나누어 다룹니다. 지금은 한 가지만 기억하세요. 바이오리액터는 홍수처럼 쏟아지는 연속적인 인라인(그리고 일부 온라인) 데이터를, 나중에 반드시 다시 결합되어야 하는 가느다란 앳라인 및 오프라인 실험실 결과의 물줄기와 뒤섞습니다.

이들을 다시 결합하는 일 자체가 하나의 데이터 문제이며, 바로 이 지점에서 소프트 센서(soft sensor) 가 제값을 합니다. 소프트 센서는 빈번한 온라인 신호와 드문드문한 앳라인 또는 오프라인 값을 융합하여, 어떤 단일 프로브도 직접 측정하지 못하는 공정 변수 — 바이오매스, 성장률, 또는 포도당 흡수율 — 를 직접 측정하는 대신 모니터링과 제어를 위해 실시간으로 추정하는 모델입니다 [6]. 예를 들어, 어떤 소프트 센서는 빈번한 라만 스펙트럼 판독값을 가끔씩의 수동 세포 계수(manual cell count)와 짝지어 실시간 바이오매스 농도를 추론함으로써, 분석자의 다음 실험실 결과가 몇 시간 뒤에야 도착하기 전에 제어 시스템이 피드를 조정할 수 있게 합니다. 온라인 흐름은 소프트 센서에 리듬을 주고, 가끔씩 들어오는 실험실 값은 그것이 정직함을 유지하게 합니다. 이것은 단순한 편의 이상입니다. 소프트 센서가 데이터 아키텍처의 심장부에 자리 잡는 이유가 바로 이것이며, 빠르지만 간접적인 신호와 느리지만 신뢰할 수 있는 신호를 제어기가 작동의 근거로 삼을 수 있는 하나의 숫자로 바꾸어내는 방식이 곧 소프트 센서이기 때문입니다.

하류: 청징, 추적선, 그리고 단계 이벤트

하류(downstream) 는 정제입니다 — 세포가 만들어낸 다른 모든 것으로부터 항체를 분리하는 일입니다. 하류는 청징 및 포집(clarification and capture) 으로 시작합니다. 수확된 배양액을 원심분리기와 심층 필터(depth filter)에 통과시켜 첫 번째 컬럼에 들어가기 전에 세포와 잔해를 제거하는 단계입니다. 이 정돈 단계조차도 데이터 스테이션입니다 — 탁도(turbidity)(흐름이 아직 얼마나 흐린지를 나타내는 척도), 필터 압력(pressure), 유량(flow) 판독값을 내보내며, 이곳에서 압력이 상승하는 것은 다른 어디에서나 그렇듯이 필터가 부하를 받고 있다는 신호입니다.

하지만 하류의 일꾼은 크로마토그래피(chromatography) 입니다. 단백질 혼합물을 수지(resin)로 채워진 컬럼에 통과시켜, 어떤 분자는 붙잡고 다른 분자는 흘려보내는 방식입니다. 이를 운전하는 스키드(skid) — Cytiva의 ÄKTA process 라인이나 Sartorius의 Resolute 같은 공정 규모 시스템 — 는 단순한 펌프와 밸브가 아닙니다. 데이터 스테이션으로서 크로마토그래피 스키드는 연속 추적선(continuous traces) 의 합창에 날카로운 단계 이벤트(phase events) 가 더해진 것입니다. 컬럼 출구의 검출기들이 280 nm에서의 UV 흡광도(UV absorbance)(얼마나 많은 단백질이 지나가는지에 대한 대리 지표 — 로딩 중에는 거의 0에 가깝게 머물다가 용출 정점에서는 2.5 흡광도 단위(absorbance units)를 넘어 치솟을 수 있습니다), 전도도(conductivity)(염 농도에 대한 대리 지표), 그리고 pH 를 연속적으로 기록합니다 [5]. 그 위에 명명된 단계들(phases) — 로드(load), 세척(wash), 용출(elute), 재생(regenerate) — 이 겹쳐지며, 각각은 조건의 의도적인 변화를 표시하는 타임스탬프가 찍힌 이벤트입니다. 결정적인 순간은 정제된 제품을 모으기 시작하고 멈추는 시점, 즉 풀링(pooling) 결정입니다. 관례적으로 이 결정은 표준 UV 추적선으로 판단합니다. 더 진보된 접근법은 이를 직접 측정합니다 — 한 대규모 실증에서는 온라인 HPLC 분석기가 데이터 자체로부터 실시간 풀링 판단을 내렸으나 [5], 이는 일상적인 관행이라기보다는 실증된 기법으로 남아 있습니다.

정제 과정에서 UV, 전도도, pH 추적선을 내보내는 공정용 크로마토그래피 스키드 공정용 크로마토그래피 스키드. 각 정제 단계는 UV, 전도도, pH 추적선에 더해 개별적인 단계 전이 이벤트를 내보냅니다. (사진 속 장비는 초기의 Amersham Pharmacia Biotech 시스템이며, ÄKTA와 Resolute 라인은 현재의 예시로만 언급된 것입니다.) Image by Kitmondo Lab, CC BY 2.0 (https://creativecommons.org/licenses/by/2.0/), via Wikimedia Commons (File: Amersham Pharmacia Biotech chromotography skid.jpg).

크로마토그래피 단계들 사이에 끼어 있는 것이 접선 흐름 여과(tangential flow filtration, TFF) 입니다 — 액체를 막을 가로질러 밀어내어 제품을 농축하거나 그 완충액을 교체하는 것입니다. 그 데이터 서명은 더 단순하지만 그만큼 의미심장합니다. 플럭스(flux)(액체가 막을 얼마나 빨리 가로지르는지)와 막간차압(transmembrane pressure)(액체를 막 너머로 밀어내는 압력 차이)입니다. 서서히 기어오르는 압력 상승은 막이 막혀가고 있음을 보고하는 막의 방식입니다.

참고

이 패턴에 주목하세요. 각 조리대는 데이터의 모양을 가지고 있습니다. 바이오리액터의 것은 길고 조밀한 시계열이고, 크로마토그래피의 것은 이벤트로 구두점이 찍힌 추적선의 묶음이며, TFF의 것은 한 쌍의 압력·유량 신호입니다. 이 모양들을 알아보는 것이 데이터 관리의 절반입니다. 각 모양은 서로 다르게 저장되고 분석되기를 원하기 때문입니다.

충전·마감과 QC: 마지막 방울과 최종 판정

충전·마감(fill-finish) 은 벌크 약물이 환자가 받는 바이알이나 주사기가 되는 곳입니다. 그 데이터는 혼합물입니다. 모든 용기에 대한 충전 중량(fill-weight)(스칼라 측정값의 연속적인 흐름), 각 단위의 결함을 검사하는 머신 비전(machine-vision) 이미지, 그리고 환경 모니터링(environmental monitoring) — 방이 청결하게 유지되었음을 입증하는 입자 수와 미생물 시료가 그것입니다.

마지막으로 품질관리(quality control, QC) 가 옵니다 — 배치가 주장하는 그대로임을 확인하는 분석 실험실입니다. QC는 오프라인(offline) 데이터의 원형입니다. HPLC(고성능 액체 크로마토그래피, high-performance liquid chromatography) 와 같은 기기들은 시료가 채취된 지 몇 시간 또는 며칠 후에 크로마토그램(chromatogram)(곡선)과 결과 표를 만들어내며, 이때 사용되는 방법은 ICH Q2(R2)(분석 절차의 검증에 관한 국제 지침)에 제시된 기준에 맞추어 검증됩니다. 이것들은 직접적인 분석 측정값이며, 배치를 출하하는 규제 등급의 무게를 지닙니다 — 바로 이 때문에 이것들은 자신이 묘사하는 배치와 조리대로 모호함 없이 다시 연결되어야 합니다.

배치 계보: 조리대들을 하나의 이야기로 꿰매기

각 조리대는 참되지만 부분적인 이야기를 들려줍니다. 의약품은 배치(batch) — 정의된 하나의 제품 수량 — 이며, 이를 판단하려면 모든 조리대의 데이터를 하나의 추적 가능한 서사로 엮을 수 있어야 합니다. 어느 바이오리액터 운전이, 어느 배지 로트로 공급받았고, 어느 하류 컬럼들로 공급했으며, 어느 라인에서 충전되었고, 어느 QC 결과로 시험되었는지를 말입니다. 그 사슬이 배치 계보(batch genealogy)(또는 계통, lineage)입니다. 이것은 선택적인 기록 관리가 아닙니다. 완전한 배치 기록(batch record)은 미국에서 21 CFR Part 211 Subpart J 에 의해, 그리고 그것을 보관하는 전산화 시스템에 대해서는 EU Annex 11 에 의해 의무화되어 있으며, 규제기관은 이 종단 간 추적성(traceability) 을 관리 전략 — 품질을 보증하는 문서화된 관리 계획 — 의 기둥으로 취급합니다 [7].

실제로 이 연결은 은유가 아닙니다. 그것은 모든 기록에 적히는 공유된 키(shared key)입니다. 동일한 배치 식별자 — 아래의 B-26-0847 — 가 바이오리액터 스트림, 크로마토그래피 풀(pool), 그리고 QC 결과에 각인되므로, 그 하나의 값으로 질의하면 전체 이야기를 다시 짜맞출 수 있습니다.

{
"batch_id": "B-26-0847",
"station": "BR101",
"timestamp": "2026-06-13T08:00:00Z",
"temperature_degC": 37.5,
"pH": 7.0,
"DO_pct_sat": 50,
"operator": "A. Okafor"
}

각 조리대의 기록이 모두 동일한 배치 식별자 B-26-0847로 각인된 배치 계보 데이터 트리 데이터로 본 배치 계보(genealogy): 모든 단계가 동일한 배치 식별자(B-26-0847)로 각인됩니다. 저자 원본 도해(AI 보조로 제작).

실제 공장에서 이 연결은 전용 소프트웨어의 몫입니다 — 시계열을 포착하는 데이터 히스토리언(data historian) 과, 어느 로트, 어느 라인, 어느 작업자가 어느 배치에 속하는지를 기록하는 Korber Werum PAS-X, Rockwell FactoryTalk PharmaSuite, 또는 DELMIA Apriso 같은 제조 실행 시스템(manufacturing execution system, MES) 이 그것입니다. 그 기록들이 구조화되는 방식 자체도 표준화되어 있습니다. ISA-88 배치 제어 표준이 배치와 그 절차적 단계들이 어떻게 기술되는지를 정의하고, ISA-95 가 그 작업 현장 정보가 위쪽의 비즈니스 시스템과 어떻게 연결되는지를 규정합니다 — 자동화와 공장 아키텍처를 상세히 살펴볼 때 다시 돌아올 표준들입니다.

계보가 없으면 QC에서 발생한 일탈은 미아입니다 — 늦게 도착한 피드나 막힌 컬럼으로 거슬러 올라가 추적할 수 없습니다. 따라서 연결(linking) 은 데이터 관리의 핵심 행위이며, 바로 이것이 메타데이터가 중요한 이유입니다. 모든 데이터 점은 자신이 어느 배치와 어느 조리대에 속하는지 말해줄 충분한 맥락을 지녀야 합니다.

왜 중요한가

공장을 데이터 스테이션으로 재구성하는 것은 그 자체를 위한 은유가 아닙니다 — 그것은 데이터가 어떻게 다루어져야 하는지를 좌우합니다. 서로 다른 모양은 서로 다른 저장소를 요구합니다. 고빈도 시계열, 크로마토그래피 추적선의 묶음, 그리고 QC 결과 표는 각각 뚜렷이 다른 용량, 구조, 시점을 가집니다. 온라인 데이터와 오프라인 데이터는 엄청나게 다른 빈도(frequency)와 지연(latency)으로 도착하며 하나의 통합된 타임라인으로 조정되어야 합니다. 그리고 이 모든 것을 수집하는 본래의 목적 — 배치가 안전하고 효과적임을 입증하고 공정을 개선하는 것 — 은 모든 조리대의 출력이 하나의 계보로 연결되지 않으면 무너집니다. 데이터 아키텍처를 제대로 갖추면 공장은 읽힐 수 있게 되고, 잘못 갖추면 연결되지 않고 추적 불가능한 숫자 더미만 남게 됩니다.

현실 세계에서는

이것이 바로 미국 NIIMBL 연구소가 탐구하는 영역이며 — 그리고 NIIMBL이 델라웨어 대학교(University of Delaware)에 짓고 있는 파일럿 규모의 SABRE 센터는 이를 실증하고 가르치도록 설계되었습니다. 산업이 하나의 큰 탱크를 유가식(fed-batch) 모드로 운전하는 방식에서 통합 연속 바이오공정(integrated continuous bioprocessing) — 관류(perfusion) 바이오리액터가 최소한의 유지 부피로 정상 상태에서 운전되는 연속 하류 단계들로 공급하는 방식 [3] — 으로 옮겨감에 따라, 데이터 자체의 모양이 바뀝니다. 연속 운전은 단정하고 개별적인 배치를 정상 상태에서 연속적으로 모니터링되는 스트림(streams) 으로 대체하며 [3], FDA는 이를 배치 생산과 명시적으로 대조하면서 그것이 추적성과 관리 전략을 어떻게 재구성하는지 언급했습니다 [7]. 단일한 수확 이벤트가 없을 때 "배치"는 시간의 한 조각으로 정의되어야 합니다 — 이 변화는 연속 및 강화 공정(continuous and intensified processing)에 관한 장에서 다시 다룹니다.

핵심 용어

  • 단위 조작(unit operation) — 전용 장비가 수행하는 개별적인 처리 단계. 여기서는 데이터 스테이션이기도 합니다.
  • 단일클론항체(monoclonal antibody, mAb) — 살아있는 세포가 키워내는 치료용 단백질.
  • 시계열 데이터(time-series data) — 기록된 시각이 각각 찍힌 값들의 흐름.
  • 인라인(in-line) — 시료를 빼내지 않고 공정 흐름 안의 센서로 측정하여 연속적인 데이터를 주는 것.
  • 온라인(on-line) — 부분 흐름이 공정에서 자동으로 분기되어 나와 측정되고 종종 되돌아가, 거의 연속적인 데이터를 주는 것.
  • 앳라인 / 오프라인(at-line / off-line) — 빼낸 시료에 대해 측정하는 것으로, 가까이서 곧바로(앳라인) 또는 나중에 별도의 실험실에서(오프라인) 측정.
  • 청징 및 포집(clarification and capture) — 정제 전에 수확된 배양액에서 세포와 잔해를 제거하는 것. 탁도, 압력, 유량을 내보냅니다.
  • 크로마토그래피(chromatography) — 혼합물을 수지로 채워진 컬럼에 통과시켜 정제하는 것. UV, 전도도, pH 추적선을 내보냅니다.
  • 풀링 결정(pooling decision) — 컬럼에서 정제된 제품을 모으기 시작하고 멈출 시점을 선택하는 것.
  • 접선 흐름 여과(tangential flow filtration, TFF) — 막을 가로지르는 여과로 농축하거나 완충액을 교환하는 것. 플럭스와 막간차압을 내보냅니다.
  • 충전·마감(fill-finish) — 벌크 약물을 바이알이나 주사기에 채우는 것. 충전 중량, 비전 이미지, 환경 데이터를 내보냅니다.
  • 품질관리(quality control, QC) — 배치의 정체성과 품질을 확인하는 분석 실험실. 오프라인 데이터의 원형.
  • 소프트 센서(soft sensor) — 온라인 신호와 드문드문한 앳라인 또는 오프라인 값을 융합하여, 어떤 프로브도 직접 측정하지 못하는 공정 변수를 추정하는 모델.
  • 배치(batch) — 정의된 하나의 제품 수량.
  • 배치 계보(batch genealogy, 계통) — 하나의 배치에 대해 모든 조리대의 데이터를 연결하는, 사슬로 엮인 추적 가능한 기록.
  • 통합 연속 바이오공정(integrated continuous bioprocessing) — 정상 상태에서 운전되는 연결된 단위 조작들로, 개별적인 배치가 아니라 데이터 스트림을 생성하는 것.

이 다음은

우리는 공장을 데이터를 생성하는 조리대들의 사슬로 둘러보았고, 이 모든 데이터의 일차적 원천이 물리적 사물 — 프로브, 검출기, 카메라, 그리고 실험실 분석기 — 임을 보았습니다. 다음 장 데이터 소스로서의 기기와 센서는 그 기기들로 완전히 줌인합니다. 어디서 측정하는지(인라인, 온라인, 앳라인, 오프라인)에 따라 기기를 분류하고, 공정 분석 기술과 라만 및 NIR 같은 분광 센서를 제대로 소개하며, 각 기기가 어떻게 특징적인 데이터 모양 — 스칼라, 분광, 크로마토그래피, 또는 이미지 — 을 만들어내는지, 그리고 나머지 데이터 스택이 이를 받아들이도록 어떻게 구축되어야 하는지를 보여줍니다.