본문으로 건너뛰기

세포주와 세포 은행 계보 모델링

📍 현재 위치: 제2부 · 발견과 개발의 모델링 — 6장. 선도 분자는 정해졌습니다. 이제 그것을 만들어 낼 살아 있는 공장을 모델링하며, 이 책의 모든 계보 사슬이 시작되는 가장 뿌리의 존재에 도달합니다.

이 책의 모든 derivedFrom 간선은 결국 여기를 가리킵니다. 의약품 완제품(drug product)은 원료의약품(drug substance)에서, 그것은 포획 풀(capture pool)에서, 그것은 BATCH-2026-001에서, 그것은 시드 트레인(seed train)에서, 그것은 WCB-CHO-001 — 얼린, 조작된 세포가 담긴 바이알 — 에서 나왔습니다. 세포주는 제조 계보가 시작되는 곳이며, 그래서 그래프에서 가장 올바르게 모델링해야 할 노드이기도 합니다. 그 동일성에 오류가 생기면 거기서 내려온 모든 배치로 전파되기 때문입니다. 또한 정직하게 모델링하기 가장 어려운 노드이기도 한데, 용기나 레시피와 달리 세포주는 살아 있고, 살아 있는 것은 돌연변이하고 표류하며 하나의 동일성에 고정되기를 거부하기 때문입니다.

쉽게 말하면

빵집의 사워도우 스타터는 모든 빵 덩어리의 조상입니다. 마스터 단지를 하나 보관해 두고, 거기서 매일 빵을 굽는 데 쓸 워킹 단지들을 만듭니다. 모든 빵 덩어리는 워킹 단지를 거쳐 마스터로 거슬러 올라갑니다. 만약 마스터가 잘못 표시되어 — 알고 있던 것과 사실은 다른 배양이라면 — 모든 빵이 틀린 것이 되고, 몇 달 동안 그 사실을 모를 수도 있습니다. 세포주(cell line)는 바이오제약의 스타터이고, 세포 은행 위계(cell-bank hierarchy)는 그것을 추적 가능하게 유지하는 마스터-워킹 단지 시스템입니다. 이 장은 그 계통을 모델링하며 — 단지와 달리 살아 있는 배양은 서서히 변한다는 사실과 마주합니다.

이 장에서 다루는 내용

우리는 숙주 생물(host organism)을 문자열이 아니라 분류학 IRI로, 조작된 세포주와 그 클론(clone)을 존재로, 그리고 그것을 만들어 낸 형질주입(transfection)을 occurrent로 모델링합니다. 그런 다음 세포 은행 위계 — 연구, 마스터, 워킹 은행 — 를, 그 뿌리가 캠페인 전체를 닻으로 붙드는 derivedFrom 계통으로 모델링하고, WCB-CHO-001 노드를 해부한 뒤, 살아 있는 존재의 동일성과 유전적 안정성을 표현하는 진정으로 미해결된 문제로 마무리합니다.

숙주를 "CHO"가 아니라 그 분류학으로 명명하라

대부분의 치료용 항체는 CHO 세포 — 중국 햄스터 난소(Chinese hamster ovary) 세포, 주력 일꾼 포유류 숙주 — 에서 만들어집니다 [4]. "CHO"는 문자열이고, 문자열은 표류합니다. 어떤 시스템은 "CHO"라 적고, 다른 시스템은 "CHO-K1"이라, 또 다른 시스템은 "Chinese hamster ovary"라 적습니다. 모델은 대신 숙주 생물을 NCBI Taxonomy IRI로 명명해야 합니다. Cricetulus griseus는 생물학 전반에서 쓰이는 안정적인 분류군 식별자를 가지고 있어서, 숙주가 여기서나 어떤 유전체 데이터베이스에서나 같은 존재가 됩니다 [1]. 그리고 특정 세포주는 세포주 온톨로지(Cell Line Ontology, CLO) 안에 자리를 가지는데, 이는 확립된 세포주에 안정적인 식별자를 부여하고 그것을 기원 생물과 관계 짓습니다 [2]. 이것은 표적 장에서 본, 만들지 말고 빌려라(borrow-don't-build)라는 동일한 규율입니다. 생물과 세포주 유형은 공개 IRI를 가진 공공 지식이며, 새로 발행할 가치가 있는 로컬 존재는 오직 조작된, 프로그램 고유의 세포주뿐입니다.

그 조작된 세포주는 형질주입(transfection) — 항체 유전자를 숙주에 도입하는 것 — 에 의해 만들어지며, 이는 지난 장의 선도 서열expresses하는 새 물질, 즉 세포주를 산출하는 occurrent입니다. 형질주입을, 숙주 세포와 유전 구성체를 참여자로 삼는 프로세스로 모델링한다는 것은, 그래프가 이 세포주가 단지 존재한다는 사실만이 아니라 어떻게 생겨났는지를 기록한다는 뜻입니다. 수많은 후보 중에서 선택된, 살아남은 단 하나의 고생산 클론(clone)이 그다음 모든 은행 작업의 조상이 됩니다.

세포 은행 위계는 계통이며, 그 뿌리가 모든 것을 닻으로 붙든다

규제 대상 제조는 세포가 담긴 단지 하나로 작동하지 않습니다. 살아 있는 배양에는 안전한 세대 수가 한정되어 있기 때문에, 잘 정비된 위계로 작동합니다 [3]. 작은 연구 세포 은행(research cell bank, RCB)이 철저히 특성 규명된 마스터 세포 은행(master cell bank, MCB)을 낳고, 거기서 일상 제조용 워킹 세포 은행(working cell banks, WCBs)이 인출됩니다. 각 생산 캠페인은 WCB 바이알 하나를 해동합니다. 모델링하면 이것은 하류 계보와 똑같은 derivedFrom 사슬 — WCB-CHO-001 derivedFrom MCB-CHO-001 derivedFrom RCB-... — 이며, derivedFrom이 제1부의 전이적 속성(transitive property)이기 때문에, 추론기(reasoner)는 이 WCB에서 나온 모든 배치가 전이적으로 MCB와 원래 클론에서도 유래함을 압니다. 이 사슬의 뿌리는 캠페인 전체에서 가장 하중을 지는 식별자입니다. 지식 그래프 장동일한 WCB-CHO-001로 추적되는 모든 배치가 바로 세포 은행 수준의 조사를 단 한 번의 질의로 답할 수 있게 만드는 것이라고 짚었습니다. 이 뿌리를 올바르게 잡으면 계통 질문은 사소해지고, 잘못 잡으면 불가능해집니다. 로드 가능한 데이터셋에서 이 뿌리는 단 하나의 노드로, 실제 세포주 온톨로지 용어로 유형이 정해진 채 derivedFrom 사슬의 맨 앞에 서 있습니다:

# align.ttl + instances.ttl — the cell-bank lineage, typed to the real CHO line and host taxon.
bp:WorkingCellBank rdfs:subClassOf obo:CLO_0002421 . # CLO 'CHO cell' (Chinese hamster ovary line)
bp:HostOrganism rdfs:subClassOf obo:NCBITaxon_10029 . # NCBI Taxonomy 'Cricetulus griseus' (verified via OLS4)

bp:RCB-CHO-001 a bp:ResearchCellBank ; bp:passageNumber 2 .
bp:MCB-CHO-001 a bp:MasterCellBank ;
bp:derivedFrom bp:RCB-CHO-001 ; bp:hasClone bp:CLONE-7 ; bp:passageNumber 5 .
bp:WCB-CHO-001 a bp:WorkingCellBank ; # the anchor root of the whole genealogy
bp:derivedFrom bp:MCB-CHO-001 ;
bp:hasHostOrganism bp:CHO-host ; # the host as a taxon IRI, not the string "CHO"
bp:expresses bp:mAb-A ;
bp:passageNumber 8 ;
bp:hasCharacterization bp:CR-identity , bp:CR-sterility , bp:CR-viral , bp:CR-genetic .

전체 실타래의 뿌리로서 세포 은행 계보를 그린 히어로 도해: 맨 위에서 형질주입 프로세스가 항체 구성체를 (Cricetulus griseus의 NCBI Taxonomy IRI로 표시된) CHO 숙주 세포에 도입해 조작된 세포주와 선택된 클론을 만들고, 이어서 derivedFrom 사슬이 워킹 세포 은행 WCB-CHO-001, 마스터 세포 은행 MCB-CHO-001, 연구 세포 은행 RCB-CHO-001을 한 줄로 잇는데, 워킹 은행은 마스터에서, 마스터는 연구 은행에서 파생됩니다. WCB-CHO-001에는 닻이 되는 뿌리(anchor root)라고 표시되어 있고, 거기서 계보는 아래쪽 줄을 따라 SEED-001, 생물반응기 배치 BATCH-2026-001, 원료의약품 DS-001, 완제의약품 DP-001로 이어지며 각각이 앞 노드로부터 derivedFrom됩니다. 은행에는 passageCount 펜던트가 달려 있어, 이 노드가 이후 모든 배치가 전이적으로 유래하는 닻임을 보여 줍니다. 숙주 분류군과 클론은 빌려 온 공공 IRI로 표시되어 있습니다. 실타래가 뿌리내린 곳: 형질주입이 조작된 세포주를 만들고, 클론은 연구·마스터·워킹 은행을 거치며 derivedFrom 계통으로 은행에 보관되며, WCB-CHO-001은 이후 모든 하류 배치가 전이적으로 거슬러 올라가는 닻이 됩니다. 저자가 AI의 도움을 받아 직접 제작한 그림입니다.

세포 은행 노드의 해부

WCB-CHO-001을 분해해 보면, 이 노드가 어째서 그래프의 어떤 물질보다 더 많은 특성 규명을 짊어지는지가 드러납니다. 그것은 워킹 세포 은행으로 유형이 정해지고, 자신의 마스터 은행을 derivedFrom하며, 그 숙주는 문자열 "CHO"가 아니라 Cricetulus griseusNCBI Taxonomy IRI로 명명됩니다. 또한 선도 서열을 expresses하여 발견으로 다시 묶이고, 자신이 내려온 클론 동일성을 지니며, 일군의 특성 규명 결과 — 동일성, 무균성, 바이러스 안전성, 유전적 안정성 — 를 담는데, 각각은 지난 장에서 개발성(developability)이 그러했듯 증거가 뒷받침된 quality입니다. 결정적으로, 그것은 세대/계대(generation/passage) 수도 함께 지닙니다. 마스터 은행 이후 세포가 몇 번 분열했는가는 세포를 얼마나 오래 키울 수 있는지를 한정하는 사실이며 — 시드 트레인바이오리액터 장이 필요로 할 수치이기 때문입니다.

WCB-CHO-001 노드를 펼친 신원 카드: 유형 행(워킹 세포 은행), MCB-CHO-001을 위로 가리키는 derivedFrom 행, 문자열 CHO가 아니라 Cricetulus griseus의 NCBI Taxonomy IRI를 가리키는 숙주-생물 행, 선도 항체 서열을 가리키는 expresses 행, 클론-동일성 행, 동일성·무균성·바이러스-안전성·유전적-안정성 결과를 각각 그 분석법과 함께 증거 뒷받침된 quality로 나열하는 특성 규명 블록, 그리고 세포를 얼마나 오래 배양할 수 있는지를 한정하는 것으로 표시된 세대/계대 수 행을 보여 줍니다. 옆쪽 주석은 이 노드를 그래프에서 가장 무겁게 특성 규명된 노드로 표시하는데, 여기서의 오류가 모든 후손으로 전파되기 때문입니다. 그래프에서 가장 많이 특성 규명된 노드: 워킹 세포 은행은 마스터 은행으로 올라가는 자신의 계통, 분류학 IRI로서의 숙주, 발현하는 서열, 그리고 증거가 뒷받침된 일련의 quality 결과를 짊어집니다 — 여기서의 어떤 오류든 그 아래 모든 배치가 물려받기 때문입니다. 저자가 AI의 도움을 받아 직접 제작한 그림입니다.

미해결 과제: 살아 있고 돌연변이하는 존재의 동일성

여기서 모델은 생물학과 마주치고 휘어집니다. 그래프의 모든 것은 노드가 안정적인 동일성을 가진다고 가정합니다 — WCB-CHO-001WCB-CHO-001입니다. 그러나 세포주는 세대를 거치며 돌연변이하고 표류하는(mutate and drift) 살아 있는 세포의 집단입니다. 워킹 은행은 마스터와 유전적으로 동일하지 않으며, 너무 오래 키운 배양은 생산성을 잃거나 산물 품질이 바뀔 수 있습니다. 그래프는 계대 수를 기록하고 안정성 결과를 연결할 수 있지만, 움직이는 집단을 가만히 멈춰 세울 수는 없습니다. "시간에 걸친 동일한 세포주"를 정직하게 모델링한다는 것은, 여기서의 동일성이 IRI가 암시하는 또렷한 동일함이 아니라 특성 규명으로 한정된 유용한 허구임을 받아들이는 것이며 — 제1부의 disjointness와 sameAs 장치가 "계대 60의 세포는 계대 5의 세포와 같은 존재인가?"에 깔끔한 답을 갖지 못한다는 것을 받아들이는 것입니다.

더 나쁘고, 역사적으로 실재하는 문제는 오인식(misidentification)입니다. 세포주는 수십 년 동안 생명과학 전반에 걸쳐 혼동되고 교차오염되어 왔으며, 잘못 표시된 세포주가 발표된 연구를 무효로 만들어 왔습니다 — 바로 그렇기 때문에 인증(authentication)과 세포주 온톨로지의 안정적인 식별자가 존재합니다 [2]. 제조 뿌리 노드에서 오인식된 세포주는 가능한 한 최악의 오류입니다. 완전한 확신을 가지고 단언되고, derivedFrom을 통해 모든 후손 배치로 전파되며, 그 어떤 하류 데이터 무결성도 그것을 잡아내지 못합니다. 모든 하류 사실이 잘못 식별된 뿌리에서 올바르게 유래되었기 때문입니다. 모델은 계통을 질의 가능하게 만들지만, 뿌리에 있는 존재가 라벨이 말하는 그것임을 인증하지는 못합니다. 그 인증은 온톨로지가 문서화할 수는 있어도 풀 수는 없는, 습식 실험실과 특성 규명과 거버넌스의 문제입니다 — 그래프 전체의 가장 밑바닥 토대에 있는, 정신이 번쩍 들게 하는 한계입니다.

왜 중요한가

세포 은행 뿌리는 그 올바름에 전체 계보가 의존하는 단 하나의 지점입니다. 잘 모델링하면 — 숙주를 분류학 IRI로, 계통을 전이적 derivedFrom 사슬로, 특성 규명을 증거 뒷받침된 quality로, 계대 수를 앞으로 운반하면 — 디지털 스레드 장이 돌리는 모든 하류 계보 및 영향 질의가 구성상 신뢰할 수 있게 됩니다. 부주의하게, 숙주를 문자열로 두고 은행 위계를 평평하게 뭉개서 모델링하면, 제조에서 가장 중요한 추적성 질문들이 모래 위에 놓이게 됩니다. 이것은 제1부의 값싼 규율이 가장 큰 배당을 치르는 노드이자, 그 한계가 가장 큰 결과를 낳는 노드입니다.

실제 현장에서는

세포 은행 위계와 그 특성 규명은 선택적인 모범 관행이 아니라, 세포 기질에 관한 규제 지침의 기대이며, 그래서 모든 실제 프로그램은 여기서 모델링한 그대로의 RCB/MCB/WCB 계통을 정확히 유지합니다 [3]. CHO 세포는 상업적 항체 생산을 지배하고, 그 유전체는 서열이 밝혀져 공개되어 있으며, 그것을 위한 안정적인 분류학 및 세포주 식별자가 이미 존재합니다 [1][4][5]. 여전히 고르지 못한 것은 제조 그래프를 그 공공 생물학적 동일성에 묶는 일입니다 — 숙주를 "CHO"가 아니라 그 NCBI 분류군으로 명명하고, 클론과 계대 동일성을 은행 관리 스프레드시트의 항목이 아니라 모델링된 사실로 운반하는 것 — 그렇게 해야 프로세스의 살아 있는 뿌리가 그것이 발현하는 단백질만큼이나 상호운용 가능해집니다.

핵심 용어

  • CHO 세포(CHO cells) — 중국 햄스터 난소 세포, 항체 생산을 위한 지배적인 포유류 숙주. 모델에서는 Cricetulus griseus의 NCBI Taxonomy IRI로 명명됩니다.
  • 세포주(Cell line) — 숙주를 형질주입해 만든, 조작되고 항체를 발현하는 세포주. 공공 숙주 생물과 구별되는, 새로 발행할 가치가 있는 프로그램 고유 존재입니다.
  • 클론(Clone) — 모든 은행 작업이 거기서 내려오는, 선택된 단 하나의 고생산 세포. 계보의 생물학적 조상입니다.
  • 세포 은행 위계(RCB / MCB / WCB) — 연구, 마스터, 워킹 은행. 그 뿌리가 모든 하류 배치를 닻으로 붙드는 전이적 derivedFrom 계통으로 모델링됩니다.
  • NCBI Taxonomy / 세포주 온톨로지(CLO) — 숙주 생물과 확립된 세포주에 빌려 쓸 안정적인 식별자를 부여하는 공공 온톨로지.
  • 계대 / 세대 수(Passage / generation count) — 마스터 은행 이후 몇 번 분열했는가. 세포를 얼마나 오래 배양할 수 있는지를 한정하며 앞으로 운반되는 사실입니다.
  • 유전적 표류 / 오인식(Genetic drift / misidentification) — 세포주 동일성에 대한 살아 있는 존재의 한계: 집단은 세대를 거치며 돌연변이하고, 잘못 표시된 뿌리는 모든 후손으로 조용히 전파됩니다.

다음 이야기

살아 있는 공장이 모델링되고 뿌리내렸습니다. 제3부는 그것을 따라 공장 안으로 들어갑니다. 다음 장, 시드 트레인과 계보의 시작 모델링에서는 WCB 바이알 하나를 해동해 확장 단계들을 거쳐 세포를 키우며 — 각 스케일업을 하나의 물질을 소비하고 다음 물질을 산출하는 프로세스로 모델링하고, 특정 생산 캠페인의 첫 derivedFrom 간선들을 깔며, 연속적인 생물학적 확장을 이산적인 그래프 노드로 어떻게 표현할지와 마주합니다.