본문으로 건너뛰기

포획 크로마토그래피와 풀링 문제 모델링

📍 현재 위치: 제4부 · 모델링한 하류 — 제13장. 청징된 수확물이 정제 준비를 마쳤습니다. 이 장에서는 가장 처음이자 가장 중요한 정제 단계를 모델링하며, 수확 장이 우리에게 남긴 개별화(individuation) 경고를 곧바로 현금화합니다.

청징(clarification)은 우리에게 숙주세포단백질, DNA, 그 밖의 불순물이 여전히 가득한 청징된 수확물을 건네주었습니다. 프로테인 A 포획 크로마토그래피(Protein A capture chromatography)는 모든 것을 바꾸는 단계입니다. 항체를 특이적으로 결합하는 수지로 채워진 컬럼이 나머지를 모두 씻어 보내고, 정제된 제품을 농축된 풀로 방출합니다 — 우리가 진행 중인 캠페인에서는 PApool-001이 그것입니다. 보통 한 번의 작업으로 불순물의 대부분을 제거합니다. 이 단계는 또한 풀링 문제(pooling problem)의 정전(正典)적 본거지이기도 합니다. 단 하나의 포획 단계가 여러 주기로 운전되어 각 주기마다 로딩과 용출을 반복하고, 그 모두가 하나의 풀로 합쳐집니다 — 그래서 처음으로 어떤 물질이 한 부모가 아니라 여럿에서 derivedFrom 관계를 갖게 됩니다. 수확 장이 이 경우가 다가오고 있다고 약속했고, 여기서 우리는 그것을 모델링합니다.

쉽게 말하면

아침 내내 올리브유를 배치 단위로 짜내어, 매 압착분을 하나의 큰 드럼에 부어 넣는다고 상상해 보세요. 드럼의 기름은 모든 아침의 압착분에서 나온 것이지 하나에서 나온 것이 아닙니다 — 그래서 드럼에서 문제를 추적해야 할 일이 생기면, "이건 어디서 온 거지?"라는 질문에는 여러 답이 있고, 각 압착분을 기록해 두는 편이 좋습니다. 포획 크로마토그래피는 그 압착들처럼 주기로 작동하여, 하나의 용기로 풀링됩니다. 이 장은 그 여럿이-하나로 합쳐지는 계보를 정직하게 모델링하고, 더 미묘한 추적도 마주합니다. 압착기 자체 — 수지 — 가 여러 제품에 걸쳐 재사용되므로, 직전 제품의 흔적을 다음 제품으로 실어 나를 수 있다는 점입니다.

이 장에서 다루는 내용

우리는 포획을 이제는 표준이 된 하나의-공정이-물질을-변환한다는 형태를 가진 단위 공정(unit operation)으로 모델링하고, 단순한 부모-자식 간선을 깨뜨리는 풀링 문제 — 하나의 풀이 여러 주기에서 유도되는 — 를 해결합니다. 수지(resin)를 결합 성향(disposition)을 지닌 지속적 장비로 모델링하고, PApool-001 노드를 해부하며, 포획이 도입하는 두 계보를 정면으로 다룹니다. 풀의 뒤로 갈라지는 분기와, 배치를 가로지르는 수지의 재사용이 만들어내는 실제 이월(carryover) 계보입니다.

풀링: 하나의 물질, 여러 부모

포획 단계는 일련의 주기로 운전됩니다. 컬럼이 한 번의 로딩으로 담을 수 있는 양에 한계가 있기 때문입니다. 각 주기는 수확물의 일부에서 항체를 결합하여 용출하고, 그 용출액들이 합쳐져 포획 풀(capture pool)이 됩니다 [1]. 이를 단일 단위 공정으로 순진하게 모델링하면, 풀은 그저 배치에서 derivedFrom 관계를 갖습니다 — 사실이지만 정보가 손실됩니다. 정직하게 모델링하면, 풀은 각 주기의 용출액에서 derivedFrom 관계를 갖고, 각 용출액은 그것이 처리한 로드에서 유도되므로, 계보는 뒤로 분기합니다. 하나의 PApool-001, 여러 부모 용출액입니다. 이것이 바로 수확 장이 표시해 둔 여러-부모 경우이며, 그래프는 이를 무리 없이 처리합니다. derivedFrom은 애초에 하나의 부모로 제한된 적이 없기 때문입니다 — 노드는 현실이 요구하는 만큼 많은 들어오는-계보 간선을 가질 수 있습니다. 로드 가능한 데이터셋에서 이것은 우리가 서술하는 패턴이 아니라 우리가 인스턴스화하는 개체들입니다. 세 개의 주기 용출액(bp:ELU-001a, bp:ELU-001b, bp:ELU-001c)이 각각 청징된 수확물 bp:CLAR-001에서 derivedFrom 관계를 갖고, PApool-001은 그중 어느 것을 풀링했는지를 bp:includedFractionderivedFrom의 유형화된 하위 속성 — 을 통해 정확히 기록합니다. 그래서 조사가 "어떤 로드가 이 풀에 기여했는가?"를 물을 때, 그 답은 크로마토그래피 작업일지가 아니라 그래프 안에 있습니다. 청징된 수확물로 가는 풀의 대표 간선 또한 직접 단언되므로, 주기 세부가 그 아래에 보존되면서도 거친 사슬은 여전히 도달 가능하게 유지됩니다.

# instances.ttl — the capture pool, with its cycle-level provenance preserved.
bp:ELU-001a a bp:CycleEluate ; rdfs:label "capture cycle 1 eluate" ; bp:derivedFrom bp:CLAR-001 .
bp:ELU-001b a bp:CycleEluate ; rdfs:label "capture cycle 2 eluate" ; bp:derivedFrom bp:CLAR-001 .
bp:ELU-001c a bp:CycleEluate ; rdfs:label "capture cycle 3 eluate (excluded by pooling)" ; bp:derivedFrom bp:CLAR-001 .

bp:PApool-001 a bp:CapturePool ;
bp:derivedFrom bp:CLAR-001 ; # transitive headline lineage (entailed via the eluates too)
bp:fromBatch bp:BATCH-2026-001 ;
bp:includedFraction bp:ELU-001a , bp:ELU-001b ; # which cycles pooled — answerable, not collapsed
bp:participatesIn bp:CAP-001 .

실시간 풀링 결정(pooling decision)은 이를 더 날카롭게 만듭니다. 공장은 점점 온라인 측정을 사용하여, 주기별로 어떤 용출 분획이 풀링하기에 충분히 순수한지를 결정합니다 [3]. 그 결정 자체가 모델링되는 사건입니다 — 측정된 속성에 근거하여 어떤 분획이 포함되거나 제외되었다는 — 그리고 그것을 포착한다는 것은 풀의 조성이 단지 기록될 뿐만 아니라 설명된다는 뜻입니다. 공정 개발(process-development)affectsQuality 지식이 여기서 공장과 만납니다. 풀링을 결정하는 기준은 작동 중인 관리 전략(control strategy)입니다.

수지는 지속되고, 지속은 이월을 뜻한다

포획은 앞선 단계들이 부각하지 않았던 한 가지 개체를 도입합니다. 재사용되는 소모품(consumable)입니다. 프로테인 A 수지는 비싸며, 폐기 전까지 여러 배치에 걸쳐 많은 주기 동안 사용됩니다. BFO 용어로 그것은 물질 개체(material entity) — 장비 — 이며, 항체를 결합하는 성향(disposition)을 지닙니다(분자의 개발용이성(developability)과 같은 실현가능-개체 개념입니다). 그리고 결정적으로 그것은 배치를 가로질러 지속됩니다. 그 지속성은 제품 사슬만으로는 놓치는 계보를 만들어냅니다. 수지 로트 RESIN-PA-007BATCH-2026-001의 포획에 사용되었고 동시에 이전 배치에도 사용되었으므로, 그 수지에서의 오염이나 열화는 제품 계보를 공유하지 않는 배치들을 연결합니다. 수지를 자체 사용 이력을 가진 추적 개체로 모델링하면, 그래프는 "어떤 배치들이 이 수지를 공유했는가?"에 답할 수 있습니다 — 소모품을 익명의 공급품으로 취급하면 보이지 않는 이월(carryover) 질문입니다. 이는 지식 그래프 장(knowledge-graph chapter)이 세포 은행에 대해 보여준 것과 동일한 영향 분석 역량으로, 이제 공유 컬럼에 적용됩니다.

align.ttl이 단언하는 그대로의 이 정렬(alignment) 간선들은, 특정 잎 노드들을 정직하게 로컬로 남겨 두면서 단계, 컬럼, 수지, 그리고 결합 성향을 위로 접지합니다.

# align.ttl — the capture step and its equipment grounded UP (excerpt).
bp:CaptureChromatography rdfs:subClassOf iof:CaptureStep . # IOF biopharma 'capture step' (Released, Release_202602)
bp:ChromatographyColumn rdfs:subClassOf iof:ChromatographyColumn . # IOF biopharma 'chromatography column' (Released)
bp:ChromatographyResin rdfs:subClassOf iof:ChromatographyMedium . # IOF biopharma 'chromatography medium' (the stationary-phase resin)
bp:Disposition rdfs:subClassOf obo:BFO_0000016 . # BFO 2020 'disposition' (the resin's binding disposition; verified via OLS4)
bp:hasDisposition rdfs:subPropertyOf obo:RO_0000053 . # RO 'bearer of' (the resin bears the disposition)
bp:includedFraction rdfs:subPropertyOf bp:derivedFrom . # a typed sub-property of derivedFrom (itself RO 'derives from')
# bp:CaptureColumn and bp:ResinLot stay ILLUSTRATIVE leaves — no settled 1:1 IOF term for a Protein A
# capture column or a single resin lot — so they inherit the anchors above rather than being faked.

PApool-001 포획-풀 노드를 해부하는 신원 카드: 유형 행(프로테인 A 포획 풀, 물질 개체); includedFraction이 주기-용출액 부모 ELU-001a와 ELU-001b로 뒤로 분기하고, 각 용출액이 청징된 수확물에서 유도되며, 주기 3이 제외되었음을 표시하는 풀링-결정 주석이 달린 풀링 블록; 포획 단계의 크로마토그래피 단위 공정으로 유형화된 공정 행; 결합 성향과 주기 횟수, 수명 한계(이월 계보)를 가진 재사용 수지 로트 RESIN-PrA-07을 가리키는 수지 행; 입증된 품질로서 풀 위의 공정 중 숙주세포단백질 결과; 그리고 이 풀이 바이러스 안전성과 폴리싱으로 이어진다는 전방 주석. 포획 풀을 펼쳐 보다: 여러 주기 용출액에서 유도되고(뒤로의 분기), 배치를 가로질러 재사용된 수지 위에서 생산되며(이월 계보), 불순물 감소와 수율 품질을 지닌 물질 — 풀링과 소모품 출처가 뭉뚱그려지지 않고 모델링되었다. 저자가 AI의 도움을 받아 직접 제작한 그림입니다.

두 개의 띠. 위쪽의 풀링 분기: 세 개의 주기 용출액 ELU-001a, ELU-001b, 그리고 제외된 ELU-001c가 각각 청징된 수확물에서 유도되어 풀링-결정 사건 POOL-DEC-001로 들어가고, 그 사건은 주기 1과 2에서만 포획 풀 PApool-001(공정 중 HCP 850 ppm)을 출력한다. 아래쪽의 이월 계보: 생산 배치 BATCH-2026-001과 점선으로 표시된 예시용 다른 배치가 모두 재사용 수지 로트 RESIN-PrA-07(200주기 중 38주기 사용)을 사용하여, 제품 계보를 공유하지 않는 배치들을 연결한다. 포획의 두 계보를 나란히 놓고 보다: 주기 용출액들이 뒤로 분기하여 하나의 PApool-001로 풀링되며 풀링 결정에 의해 주기 3이 제외되고, 재사용된 수지 로트가 어떤 제품 계보도 잇지 못하는 배치들을 연결한다 — 제품 사슬만으로는 놓치는 이월이다. 저자가 AI의 도움을 받아 직접 제작한 그림입니다.

미해결 과제: 규모에서의 풀링 출처와 소모품 계보

풀링과 이월 모델은 원칙적으로 옳고 실무적으로 진정 어렵습니다. 그 어려움은 충실도 대 노력의 문제입니다. 모든 주기, 모든 분획, 모든 풀링 결정, 그리고 모든 소모품의 전체 사용 이력을 기록하는 것은 막대한 양의 세밀한 데이터이며, 공장은 으레 거칠게 모델링합니다 — 하나의 풀, 하나의 부모 배치, 익명의 수지 — 더 세밀한 모델은 포착하고 유지하는 비용이 더 들기 때문입니다. 문제는 거친 모델이 정확히 가장 중요한 경우에 조용히 정보를 잃는다는 것입니다. 조사가 어떤 로드 또는 어떤 분획이 불순물을 실어 왔는지, 또는 어떤 이전 배치가 수지를 공유했는지 알아야 할 때, 그 답은 모델링 시점에 버려졌습니다. 계보의 완전성과 그것을 포착하는 비용 사이에는 실제로 해결되지 않은 긴장이 있고, "우리는 완전한 추적성을 갖추고 있다"는 말은 배치 수준에서는 흔히 참이지만 주기와 소모품 수준에서는 거짓입니다.

소모품 계보는 이를 가중시킵니다. 수지는 정적이지 않습니다 — 열화되고, 주기 사이마다 세정되며, 결국 퇴역합니다 — 그래서 한 캠페인에 걸친 그것의 "정체성"은 세포주가 가진 것과 동일한 생물체의 무름(living-thing softness)을 지닙니다. 주기 200의 수지는 주기 1의 수지와 같은 개체일까요? 그리고 세정 밸리데이션(이월이 임계치 미만임을 입증하는 것)은 세정 공정에 관한 검증된 주장이지 배치별 측정이 아닙니다 — 바이러스 안전성 장(viral-safety chapter)이 이제 중심에 놓으려는 것과 동일한 검증-대-측정 간극입니다. 그러므로 정직한 기준은, 포획의 두 계보 — 풀링과 이월 — 가 모델링 가능하고 중요하지만, 정확히 그곳에서 편안한 배치 수준 추적성이 얇아진다는 것입니다. 배치 경계에서 멈추는 그래프는 자신만만한 계보를 제시하면서도 실제로는 주기 수준이나 소모품 수준의 질문에 답하지 못할 수 있습니다.

왜 중요한가

포획은 하류 추적성이 세부에서 얻어지거나 잃어지는 곳입니다. 풀을 그것의 실제 주기에서 유도되는 것으로, 수지를 추적되고 재사용되는 개체로 모델링하면, 그래프는 조사가 실제로 던지는 법의학적 질문 — 어떤 로드, 어떤 분획, 어떤 공유 소모품 — 에 탐색(traversal)으로 답할 수 있습니다. 그것들을 단일한 배치 수준 간선과 익명의 공급품으로 뭉뚱그리면, 계보는 완전해 보이면서도 조용히 가장 어려운 질문에 답하지 못하게 됩니다. 수확 장이 제기한 풀링 문제는 예외적인 경우가 아닙니다. 그것은 하류의 정상적인 형태이고, 포획은 모델이 거기에 부응하거나 아니면 그것을 호도하는 곳입니다.

실제 현장에서는

세정 밸리데이션을 거치고 점점 온라인 풀링 결정을 동반하는, 재사용 수지 위에서 풀링된 주기로 운전되는 프로테인 A 포획은 표준 상업용 항체 정제입니다 [1][2][3]. 공장은 이미 세정과 수명 한계를 위해 수지 로트와 주기 횟수를 추적하고 있으므로, 그래프가 필요로 하는 개체들은 대체로 이미 존재합니다. 고르지 않은 것은 그것들을 로그로 보관하는 대신 계보로 연결하여, "어떤 배치들이 이 수지를 공유했는가?"가 발굴 작업이 아니라 질의가 되게 하는 일입니다. 오픈소스 하류 장(open-source downstream chapter)은 이 스키드 신호들을 포착하고, 여기서 모델링한 풀링과 소모품 계보는 바로 그 포착된 신호들을 답할 수 있는 법의학적 기록으로 바꾸는 구조입니다.

핵심 용어

  • 포획 크로마토그래피(capture chromatography) — 항체를 특이적으로 결합하고 정제되고 농축된 풀을 용출하는 프로테인 A 단계로, 첫 번째 주요 정제이다.
  • 풀링 문제(pooling problem) — 포획 풀이 여러 주기 용출액에서 유도되어 derivedFrom 계보를 뒤로 분기시키는 것으로, 주기들을 뭉뚱그리지 않고 실제 물질로 기록하여 다룬다.
  • 풀링 결정(pooling decision) — 어떤 분획이 합치기에 충분히 순수한지를 주기별로, 흔히 온라인으로 선택하는 것으로, 풀의 조성을 설명하는 모델링되는 사건이다.
  • 수지(소모품, resin/consumable) — 결합 성향을 지닌 지속적 물질 개체인 크로마토그래피 매질로, 배치를 가로질러 재사용된다.
  • 이월 계보(carryover lineage) — 공유 소모품이 만들어내는 계보로, 같은 수지를 사용한 배치들은 제품 계보가 없어도 연결되어 배치 간 영향 분석을 가능하게 한다.
  • 검증 대 측정(validated versus measured) — 세정(이월 관리)은 공정에 관한 검증된 주장이지 배치별 측정이 아니며, 하류에서 반복되는 간극이다.

다음 이야기

제품은 포획되어 대체로 정제되었고, 그 주기들에서 풀링되었습니다. 다음 장 바이러스 안전성 모델링: 위험을 줄이는 단계로서의 불활성화와 여과에서는, 애초에 결코 없었기를 바라는 오염물질을 제거하고 불활성화하는 것이 그 전부인 목적인 단계들을 모델링합니다 — 모델이 부재, 위험 감소, 그리고 검증된 제거 주장과 측정된 결과의 차이를 표현하도록 강제하는, 포획이 방금 예고한 검증-대-측정 간극입니다.