바이오의약품과 그 데이터 그림자
📍 현재 위치: 1부, 1장 — 서문에서 바이오 제조의 두 가지 산물(분자와 그 데이터)을 만나보았으니, 이제 그 두 번째 산물을 자세히 들여다봅니다. 모든 배치(batch)가 드리우는 데이터 그림자입니다.
서문 — 같은 약을 두 번 만들기 — 에서 우리는 거의 철학적으로 들리는 주장을 했습니다. 바이오의약품(biologic)은 두 번 제조된다는 것입니다. 한 번은 살아있는 세포 안에서 길러지는 분자로서, 또 한 번은 그 분자가 우리가 말하는 바로 그것임을 증명하는 데이터의 집합으로서 말입니다. 이 장에서는 그 주장을 구체화합니다. 우리는 단 하나의 의약품 배치를 따라가며 그 그림자를 헤아려 볼 것입니다.
"그림자"라는 단어는 의도적입니다. 그림자는 사물 그 자체는 아니지만, 사물이 드리우는 것이며, 어디든 따라다니고, 그 형태에 관해 많은 것을 알려줍니다. 한 배치의 데이터 그림자(data shadow) 는 그 배치가 만들어지고 시험되는 동안 생성된 모든 숫자, 기록, 서명, 그리고 센서 트레이스(sensor trace)입니다. 이 장이 끝날 무렵이면 여러분은 그 그림자가 마지막에 덧붙여지는 선택적 서류 작업이 아님을 알게 될 것입니다. 그것은 규제적·과학적으로 실재하는 의미에서 제품의 일부입니다.
값비싼 와인 한 병을 떠올려 보세요. 잔에 담긴 와인이 제품입니다. 하지만 진지한 수집가는 그 출처(provenance) 도 원합니다. 포도가 어디서 자랐는지, 그해 날씨는 어땠는지, 누가 병입했는지, 어떻게 보관되었는지, 그리고 병이 한 번도 훼손되지 않았다는 증거 말입니다. 와인에게 그 서류 기록은 있으면 좋은 것입니다. 그러나 인체에 들어가는 바이오의약품에게 그 서류 기록은 법이며, 그 양은 어마어마합니다. 이 책은 바로 그 서류 기록에 관한 것입니다. 다만 이제 그것은 거의 종이가 아닙니다.
이 장에서 다루는 내용
- 바이오의약품의 복잡성이 왜 데이터를 이야기의 중심으로 밀어 올리는가
- 단 하나의 배치가 만들어내는 여러 종류의 데이터와, 대략 그 양은 얼마인가
- "문서화되지 않았다면 일어나지 않은 것이다"라는 법적 원칙
- 우리가 거듭 돌아올 네 가지 데이터 계열(family)
- 이 책 제목의 동사 — 관리하다(manage) — 가 왜 어려운 부분인가
만들어지는 방식으로 정의되는 분자
빠른 복습입니다. 나머지 모든 것이 여기서 따라 나오기 때문입니다. 바이오의약품(biologic) 은 크고 연약한 단백질 의약품 — 수천 개의 원자로 이루어진 분자 기계 — 으로, 일반적인 화학이 아니라 오직 살아있는 세포만이 만들어낼 수 있습니다. 우리가 거듭 사용할 예시는 단일클론항체(monoclonal antibody, mAb) 입니다. 이는 암 신호와 같이 체내의 특정한 하나의 표적에 들러붙도록 설계된 Y자 모양의 단백질입니다. (자매 가이드인 From Cell to Cure 는 그 생물학을 깊이 있게 다룹니다. 여기서는 그것이 데이터에 미치는 결과에 관심을 둡니다.)
아스피린 같은 저분자 의약품(small-molecule drug)은 정확한 화학식으로 쓸 수 있습니다. 바이오의약품은 그럴 수 없습니다. 너무 크고, 너무 유연하며, 세포가 길러내면서 붙이는 작은 당사슬(sugar chain)로 장식되어 있기 때문입니다. 같은 유전자를 가졌으나 배양 조건(pH, 온도, 영양분 수준)이 다른 두 공장은 미묘하게 다른 분자를 만들어낼 수 있습니다. 살아있는 세포가 단백질을 만든 뒤에 그것에 가하는 화학적 편집, 즉 번역 후 변형(post-translational modification, PTM) — 이를테면 세포의 상태에 따라 달라지는 당화(glycosylation)(당사슬을 붙이는 일) — 을 수행하기 때문입니다. 이것이 바로 업계가 "제품이 곧 공정이다(the product is the process)" 라는 문구를 반복하는 이유입니다. 제조 공정은 단순히 의약품을 만드는 데 그치지 않고, 그 의약품이 무엇인지를 정의하는 데 일조합니다 [1].
바로 그 한 가지 사실이, 데이터가 바이오 제조의 가장자리가 아니라 중심에 자리하는 이유입니다. 공정이 제품을 정의한다면, 공정의 기록이야말로 제품이 실제로 무엇인지에 대한 유일한 증거입니다. 현대의 규제적 사고는 이를 공식화했습니다. 품질 설계 기반(Quality by Design, QbD) — 품질을 사후에 시험으로 확인하는 것이 아니라 의도적으로 처음부터 구축하는 개발 철학 — 아래에서, 여러분은 어떤 공정 설정과 어떤 제품 속성이 진정으로 중요한지를 식별하고, 그것들이 서로 어떻게 관련되는지를 이해해야 합니다 [1]. 국제 가이드라인 ICH Q8(R2) 는 이를 기대 사항으로 전환했습니다. 제품이 무엇을 해야 하는지를 정의하고, 그 핵심 품질 속성(critical quality attributes) 을 식별하며, 이를 신뢰성 있게 구현하는 조건들의 설계 공간(design space) 을 그려내라는 것입니다 [2]. 이 단어들 하나하나가 실제로는 데이터에 대한 요구입니다.
단일 배치의 데이터 그림자
이제 하나의 배치 — 공장을 한 번 통과하며, 정제된 항체 수 킬로그램(이것이 원료의약품(drug substance) 입니다 — 바이알에 충전되기 전의 벌크 항체)을 생산하고, 충전/마감(fill/finish) 을 거쳐 완성된 완제의약품(drug product) 수만 바이알이 되는 — 를 그려 봅시다. 그것이 떨어뜨리는 데이터를 지켜보세요.
센서의 시계열 데이터(time-series). 바이오리액터(bioreactor)(세포가 자라는 대형 용기 — 예를 들어 Cytiva Xcellerex XDR 또는 Thermo Fisher HyPerforma 같은 2,000리터급 일회용 바이오리액터) 내부에서, 프로브(probe)는 온도, pH(산성도), 용존산소, 교반 속도 등을 측정합니다. 흔히 몇 초마다, 1주에서 3주에 걸쳐서 말입니다. 이 연속적인 흐름은 배치의 심장박동입니다. 업계가 이러한 핵심 품질 및 성능 속성을 실시간으로 측정하도록 밀어붙인 프레임워크가 FDA의 공정 분석 기술(Process Analytical Technology, PAT) 이니셔티브입니다 [3]. 단 하나의 바이오리액터도, 세포가 수확되기 전에 이미 수백만 개의 타임스탬프(timestamp)가 찍힌 측정값을 생성할 수 있습니다 — 10~20개의 프로브를 약 0.5Hz로 1주에서 3주에 걸쳐 샘플링하면, 배치당 천만 개를 훌쩍 넘는 점으로 어렵지 않게 불어납니다. 각 점은 타임스탬프가 찍힌 태그(tag) — BR101.Temp.PV, BR101.pH.PV — 로 도착하여, OSIsoft PI(AVEVA)나 Rockwell FactoryTalk 같은 공정 히스토리언(Historian) 데이터베이스에 쌓입니다. 몇 개의 행은 다음과 같습니다.
timestamp,tag,value,unit,quality
2026-06-13T14:03:00Z,BR101.Temp.PV,37.0,degC,Good
2026-06-13T14:03:00Z,BR101.pH.PV,7.05,pH,Good
2026-06-13T14:03:00Z,BR101.DO.PV,42.3,%sat,Good
2026-06-13T14:03:02Z,BR101.Temp.PV,37.0,degC,Good
2026-06-13T14:03:02Z,BR101.pH.PV,7.04,pH,Good
알람과 이벤트. 값이 범위를 벗어나거나, 작업자가 밸브를 열거나, 펌프가 작동할 때마다 제어 시스템은 그것을 기록합니다 — 무슨 일이, 언제, 그리고 흔히 누가 그것을 일으켰는지까지.
전자 배치 기록(electronic batch record, EBR). 이것은 배치의 마스터 서사입니다. 따랐던 단계별 레시피, 첨가된 물질, 확인된 파라미터, 그리고 각 단계에서의 사람의 서명입니다. 이는 제조 실행 시스템(Manufacturing Execution System, MES) 안에 존재하며, 상용 예로는 Körber PAS-X, Siemens Opcenter Execution Pharma, Rockwell PharmaSuite 등이 있습니다. 이는 뒤의 장들에서 제대로 만나게 될 것입니다. 지금은 나머지 데이터가 매달리는 척추라는 점만 알아두면 됩니다.
분석 결과. 물질이 수확되고 정제되면, 품질관리(Quality Control, QC) 실험실이 그것을 시험합니다 — 동일성, 순도, 역가(potency), 안전성에 대해서요. 각 시험은 결과를 만들어내고, 각 결과 뒤에는 원시 기기 파일(raw instrument file) 이 자리합니다. 이는 크로마토그래프(chromatograph)나 질량분석기(mass spectrometer)의 원본 출력물로, 흔히 크고 독점적인 디지털 파일입니다 — 예를 들어 단 한 번의 고성능 액체 크로마토그래피(high-performance liquid chromatography, HPLC) 런은 흔히 5~100MB 크기의, 벤더별 .ch 파일이나 .d 디렉터리로 저장됩니다.
환경 모니터링. 청정실(cleanroom)은 끊임없이 감시됩니다 — 공기 중 입자, 미생물 시료, 온도, 습도 — 배치가 열려 있는 동안 주변이 청결하게 유지되었음을 증명하기 위해서요.
물질 계보(material genealogy). 모든 원자재, 배양 배지, 필터, 그리고 일회용(single-use) 플라스틱 백은 로트 번호(lot number), 공급업체, 그리고 증명서를 지니고 있습니다. 완성된 바이알을, 그것에 닿았던 모든 성분과 소모품까지 거슬러 연결하는 실타래가 그 계보(genealogy), 즉 혈통입니다.
단일 배치의 데이터 그림자: 매우 다른 종류의 독립적인 데이터 흐름들이, 모두 같은 런(run)을 묘사합니다.
단일 배치의 데이터 그림자: 여러 출처가 하나의 전자배치기록(EBR)으로 연결됩니다.
저자 원본 도해(AI 보조로 제작).
양뿐만 아니라 다양성에 주목하세요. 깔끔한 숫자 흐름이 큰 바이너리 기기 파일 옆에, 사람이 서명한 양식 옆에, 공급업체 증명서 옆에 나란히 놓입니다. 그것들은 서로 다른 시스템에, 서로 다른 형식으로 존재하며, 그것들을 연결하는 것이 이 책의 고된 작업입니다. 그 연결을 가능하게 하기 위해 공유 표준이 존재합니다 — ISA-88(ANSI/ISA-88 로도 발행된, 레시피·절차·장비 계층을 정의하는 배치 제어 모델)은 배치에 공통 구조를 부여하고, OPC UA(Open Platform Communications Unified Architecture)는 기기와 히스토리언이 이러한 태그 측정값을 벤더 간에 주고받게 하는 현대적 프로토콜입니다 — 다만 이를 시설 전체에 적용하는 것이 진짜 고된 노동입니다.
문서화되지 않았다면 일어나지 않은 것이다
평범한 업무에서는 일을 하고 나서 서류 작업이 뒤따르는 귀찮은 일입니다. 의약품 제조에서는 이 규칙이 뒤집힙니다. 기록은 일이 올바르게 수행되었다는 증거 그 자체이며, 기록이 없으면 그 일은 마치 일어나지 않은 것처럼 취급됩니다. 이것이 cGMP — 현행 우수 제조 관리 기준(current Good Manufacturing Practice), 즉 의약품이 어떻게 만들어지는지를 규율하는 규제 체계 — 의 핵심입니다.
미국에서는 21 CFR Part 211 이 이를 명시합니다. 이는 마스터 생산 기록(master production record)(승인된 레시피), 모든 배치에 대한 배치 생산 및 관리 기록(batch production and control record)(실제 수행된 내역), 시험 결과의 기록, 그리고 백업 데이터의 보호를 요구합니다 — 이 모두는 배치가 출하된 후 수년간 보관됩니다 [4]. 데이터 그림자는 호의가 아닙니다. 그것은 배치마다의 법적 의무입니다.
기록은 또한 신뢰할 수 있어야 하며, 이는 단지 존재하는 것과는 별개의 문제입니다. 데이터 무결성(data integrity) 에 관한 FDA의 가이던스는 신뢰할 수 있는 기록이 갖추어야 할 자질들을 설명하며, 이는 흔히 ALCOA 라는 약어로 요약됩니다 — 귀속 가능성(Attributable), 가독성(Legible), 동시성(Contemporaneous), 원본성(Original), 정확성(Accurate) — 이는 누가 무엇을 언제 바꾸었는지를 포착하는 감사 추적(audit trail) 으로 뒷받침됩니다 [5]. 규제 당국은 이제 이 다섯 가지를 ALCOA+ 로 확장하여 네 가지 자질(완전성(Complete), 일관성(Consistent), 영속성(Enduring), 가용성(Available))을 덧붙입니다. 그 전체 집합은 데이터 무결성과 ALCOA+ 에서 다시 다룹니다. 여기서 가장 중요한 단어는 동시성(Contemporaneous) 입니다. 행위를 일어나는 그 순간에 기록해야 하며, 나중에 기억으로 재구성해서는 안 됩니다. 한 시간 뒤에 적은 측정값은, 규제 당국의 눈에는 다르고 더 약한 종류의 증거입니다.
"동시성"이야말로 오늘날 바이오 제조의 상당 부분이 노트가 아니라 검증된 컴퓨터 시스템을 통해 이루어지는 이유입니다. 측정값을 얻는 그 즉시 스스로 타임스탬프를 찍는 센서는 가능한 한 가장 강력한 증인입니다. 그 숫자를 나중에 사람이 로그북에 옮겨 적는 것은 가장 약한 증인입니다. 현대 데이터 관리의 상당 부분은 기록을 그것이 태어나는 순간 가까이에 두기 위해 존재합니다.
이러한 기록 대부분이 이제 전자적이기 때문에, 두 번째 규칙이 적용됩니다. 21 CFR Part 11 은 전자 기록과 전자 서명(electronic records and electronic signatures) 이 종이와 잉크와 법적으로 동등하게 인정받는 조건을 규정합니다 [6]. 작업자가 배치 기록 시스템에서 "승인"을 클릭할 때, 그 클릭을 구속력 있게 만드는 것이 바로 Part 11 입니다. 같은 기대 사항이 미국 밖에도 존재합니다. 유럽연합에서는 EU GMP Annex 11 이 전산화 시스템(computerised system)을 규율하며, 이는 Part 11 과 매우 가까운 대응물입니다. 따라서 대서양 양안에서 판매되는 제품은 둘 다를 충족해야 합니다.
네 가지 데이터 계열
그림자는 거대하지만, 형체가 없는 것은 아닙니다. 이 책 전반에 걸쳐 우리는 데이터를 네 가지 계열(family)로 분류할 것입니다. 지금 간단히 만나보세요. 각각은 뒤에서 별도로 다루어집니다.
-
공정 데이터 — CPP. 핵심 공정 파라미터(Critical Process Parameter, CPP) 는 너무 많이 변하면 제품을 바꿔버리는 설정입니다 — 바이오리액터 온도, pH, 공급 속도(feed rate). 이것들은 "우리가 어떻게 만들었는가"의 숫자이며, 대부분 위의 센서 시계열 데이터입니다. 어떤 파라미터가 진정으로 핵심적인지를 식별하는 것이 바로 ICH Q8 이 요구하는 QbD 작업입니다 [2].
-
품질 데이터 — CQA. 핵심 품질 속성(Critical Quality Attribute, CQA) 은 의약품을 안전하고 효과적으로 유지하기 위해 한계 내에 머물러야 하는 제품 자체의 속성입니다 — 순도, 역가, 항체에 붙은 당 장식의 패턴. 이것들은 QC 실험실에서 나오는 "우리가 무엇을 만들었는가"의 숫자입니다 — 그리고 이를 만들어내는 분석 절차는 이제 자체적인 QbD 가이드라인인 ICH Q14(Analytical Procedure Development, 분석 절차 개발) 를 갖추고 있으며, 이는 방법 검증(method validation) 가이드라인인 ICH Q2 의 동반 문서입니다. 업계에 잘 알려진 A-Mab 사례 연구는 여러 팀이 항체의 CQA와 CPP를 체계적으로 순위 매기는 작업의 실제 예시입니다 [9].
-
메타데이터(metadata). 데이터 에 관한 데이터입니다: 단위, 타임스탬프, 기기, 작업자, 교정(calibration) 상태. 헐벗은 숫자 — "37" — 은 무의미합니다. 섭씨 37도, 프로브 TT-101로 측정, 지난 화요일에 교정, 14:03 에 라는 것은 정보입니다. (프로브 태그는 장비별 명명 체계를 따릅니다 —
BR-01-TT-01은 바이오리액터 유닛 01, 온도 전송기(temperature transmitter) 01 을 뜻할 수 있습니다 — 그리고 정확한 규약은 모든 시스템이 같은 이름을 같은 방식으로 읽도록 시설의 데이터 사전(data dictionary) 에 고정되어 있어야 합니다.) 메타데이터와, 그것을 보호하는 감사 추적은 위의 무결성 규칙과, GAMP 5 — 규제 산업에서 전산화 시스템을 검증하기 위한 표준 가이드 — 에 기술된 위험 기반(risk-based) 시스템 통제의 핵심입니다 [10]. -
마스터 데이터(master data). 배치마다 바뀌지 않는 안정적인 참조 정보입니다: 승인된 레시피, 제품 규격, 물질 목록, 장비 등록부. 공정 데이터와 품질 데이터가 한 배치의 이야기라면, 마스터 데이터는 모든 배치가 공유하는 변치 않는 등장인물입니다.
지금은 이 네 가지를 느슨하게 쥐고 계세요. 요점은 단지 그림자에 구조가 있다는 것, 그리고 그 부분들에 이름을 붙이는 것이 그것을 관리하는 첫걸음이라는 것입니다.
왜 "관리"가 핵심 단어인가
우리는 이 책을 바이오 제조에서 데이터 기록하기 라고 부를 수도 있었습니다. 그러지 않았는데, 기록은 쉬운 부분이기 때문입니다. 어려운 부분은 동사 관리하다(manage) 가 함의하는 모든 것입니다.
데이터는 생성되는 순간에 충실하게, 그리고 동시적으로 포착(captured) 되어야 합니다. 그것은 맥락화(contextualized) 되어야 합니다 — 숫자를 사실로 바꾸는 메타데이터와 결합되어서요. 그것은 조용히 변경되거나 손실될 수 없도록 보호(protected) 되어, 위의 무결성 및 전자 기록 규칙을 충족해야 합니다 [5][6]. 그것은 자신의 조각들을 담고 있는 여러 시스템에 걸쳐 연결(connected) 되어, 바이알의 계보가 실제로 추적될 수 있어야 합니다. 그리고 그것은 보유(retained) 되어야 합니다 — 21 CFR Part 211 의 규제상 최소 보관 기간은 배치 유효기한 이후 1년이지만 [4], 실제로 기업들은 흔히 10년 이상 보관합니다. 안전성 문제는 의약품이 출하된 지 한참 후에 떠오를 수 있기 때문입니다.
이는 벅찬 과제이며, 업계는 점점 더 공정 데이터를 규제적 부담이 아니라 진정한 자산으로 — 분석, 공정 이해, 그리고 이 분야를 재편하고 있는 예측 모델(model) 의 연료로 — 다루고 있습니다 [7][8]. 잘 관리된 데이터 그림자는 감사에서 배치를 방어하는 데 그치지 않습니다. 그것은 다음 배치를 더 잘 만드는 법을 여러분에게 가르쳐 줍니다.
왜 중요한가
이 장에서 단 하나의 생각을 가져간다면, 이것을 가져가세요: 데이터 그림자는 분자만큼이나 제품에 필수적이다. 분자를 잃으면 한 배치를 잃습니다. 데이터를 잃거나 — 또는 그것을 신뢰할 수 있게 만들지 못하면 — 어떤 배치도 여러분이 주장하는 그것임을 더 이상 증명할 수 없게 되고, 이는 제품 전체를 멈춰 세울 수 있습니다. 규제 당국은 의약품을 맛보게 해달라고 요청하지 않습니다. 그들은 그 기록을 보여달라고 요청합니다 [4][5]. 그림자는 바이오의약품이 자기 자신임을 증명하는 방식입니다.
실제 현장에서

충전된 완제의약품 바이알. 모든 바이알 뒤에는, 그것이 어떻게 만들어지고 시험되었는지를 증명하는 훨씬 더 방대한 양의 데이터가 서 있습니다.
Vials. Image by CSIRO, https://commons.wikimedia.org/wiki/File:CSIRO_ScienceImage_11474_Vials.jpg, licensed under CC BY 3.0 (https://creativecommons.org/licenses/by/3.0/), via Wikimedia Commons.
데이터 그림자는 업계가 현대화함에 따라 더욱 커집니다. 미국의 NIIMBL 연구소(National Institute for Innovation in Manufacturing Biopharmaceuticals, 바이오의약품 제조 혁신을 위한 국립 연구소)는, 델라웨어 대학교(University of Delaware)에 함께 들어서는 SABRE 센터 — 진보된 공정을 규모 확대하고 위험을 줄이며 NIIMBL을 지원하기 위한 cGMP 바이오 제조·인력 양성 시범 시설 — 와 함께 연속·집약형(continuous and intensified) 공정을 발전시키는 데 일조하고 있습니다. 여기서 세포는 단일 유가식(fed-batch) 탱크 — 채워서 한 번 끝까지 운전한 뒤 비우는 용기 — 에서가 아니라 끊임없이 생산합니다. 연속 공정은 곧 연속적인 데이터를 의미합니다 — 깔끔한 "배치의 끝" 순간이 없으므로, 센서 흐름은 결코 멈추지 않으며, 실시간 PAT 측정과 실시간 무결성에 대한 필요가 절실해집니다 [3]. 실제 현장(plant floor)에서 이 데이터는 잘 다져진 경로를 따라갑니다. 바이오리액터의 프로브가 제어 시스템(Siemens SIMATIC 또는 Emerson DeltaV 같은 SCADA 소프트웨어를 구동하는 PLC)에 공급되고, 이 제어 시스템은 태그 측정값을 히스토리언(OSIsoft PI, AVEVA)으로 흘려보내며 MES 배치 기록(Körber PAS-X, Siemens Opcenter)에 표시합니다. 한편 QC 실험실의 크로마토그래프와 질량분석기는 그 원시 파일을 Waters Empower 나 Thermo Chromeleon 같은 크로마토그래피 데이터 시스템(chromatography data system, CDS)에 적재합니다. 동시에, GAMP 5 같은 프레임워크는 이 모든 데이터를 포착하는 바로 그 컴퓨터 시스템에 대해 위험 기반의 수명주기(lifecycle) 관점을 향해 이 분야를 밀어붙입니다 [10]. 그림자는 줄어들고 있지 않습니다. 그것을 잘 관리하는 것이 현대 바이오 제조를 정의하는 공학적 과제가 되어가고 있습니다.
핵심 용어
- 데이터 그림자(data shadow) — 배치가 생성하는 기록의 전체 집합: 센서 트레이스, 배치 기록, 시험 결과, 서명; 분자만큼이나 제품에 필수적이다.
- 바이오의약품(biologic) — 화학만으로가 아니라 살아있는 세포가 만드는 크고 복잡한 단백질 의약품.
- 단일클론항체(monoclonal antibody, mAb) — 모든 사본이 동일하며, 특정한 하나의 표적에 들러붙도록 설계된 Y자 모양의 단백질.
- 원료의약품(drug substance) — 바이알에 충전되기 전의 정제된 벌크 항체.
- 완제의약품(drug product) — 충전/마감 단계에서 원료의약품으로부터 생산된, 완성되어 충전된 의약품 바이알.
- 제품이 곧 공정이다(the product is the process) — 바이오의약품이 만들어지는 방식이 그것이 무엇인지를 정의하는 데 일조한다는 원칙.
- 품질 설계 기반(Quality by Design, QbD) — 어떤 파라미터와 속성이 중요한지를 이해함으로써 공정에 품질을 의도적으로 구축하는 것.
- 바이오리액터(bioreactor) — 제품을 만들기 위해 살아있는 세포를 기르는 용기.
- 유가식(fed-batch) — 바이오리액터를 채워서 한 번 끝까지 운전한 뒤 비우는 전통적인 배치 방식(연속 공정과 대비됨).
- 전자 배치 기록(electronic batch record, EBR) — 한 배치가 어떻게 만들어졌는지에 대한, 실제로 수행된 디지털 내역으로, 제조 실행 시스템(Manufacturing Execution System, MES) 안에 보관된다.
- 히스토리언(Historian) — 기기와 제어 시스템에서 나오는, 타임스탬프가 찍힌 공정 측정값(태그)의 흐름을 저장하도록 만들어진 데이터베이스.
- 번역 후 변형(post-translational modification, PTM) — 살아있는 세포가 단백질을 만든 뒤에 그것에 가하는 화학적 편집; 당사슬을 붙이는 당화(glycosylation)가 항체의 대표적인 예이다.
- PAT(Process Analytical Technology, 공정 분석 기술) — 핵심 품질 및 공정 속성을 실시간으로 측정하기 위한 FDA 프레임워크.
- cGMP(current Good Manufacturing Practice, 현행 우수 제조 관리 기준) — 의약품이 어떻게 제조되어야 하는지를 규율하는 규제.
- ALCOA — 기록이 갖추어야 할 다섯 가지 데이터 무결성 자질: 귀속 가능성(Attributable), 가독성(Legible), 동시성(Contemporaneous), 원본성(Original), 정확성(Accurate). 규제 당국은 이제 이를 ALCOA+ 로 확장하여 네 가지 자질(완전성(Complete), 일관성(Consistent), 영속성(Enduring), 가용성(Available))을 더한다. 전체 내용은 데이터 무결성과 ALCOA+ 에서 다룬다.
- 감사 추적(audit trail) — 누가 어떤 데이터를 언제 바꾸었는지에 대한 보안 로그.
- 핵심 공정 파라미터(Critical Process Parameter, CPP) — 너무 많이 변하면 제품을 바꾸는 공정 설정.
- 핵심 품질 속성(Critical Quality Attribute, CQA) — 제품이 안전하고 효과적이기 위해 한계 내에 머물러야 하는 제품의 속성.
- 메타데이터(metadata) — 데이터에 관한 데이터: 단위, 타임스탬프, 기기, 작업자; 헐벗은 숫자를 사실로 바꾸는 것.
- 마스터 데이터(master data) — 배치 간에 공유되는 안정적인 참조 정보: 레시피, 규격, 장비 등록부.
- 물질 계보(material genealogy) — 완성된 바이알을 그것에 닿았던 모든 성분과 소모품까지 거슬러 연결하는 추적 가능한 혈통.
이 다음은
우리는 그림자를 위에서 내려다보며 그 규모, 다양성, 법적 무게를 보았습니다. 그러나 그림자는 개별 점들로 이루어져 있으며, 데이터 관리를 진정으로 이해하는 유일한 방법은 그중 하나를 따라가는 것입니다. 다음 장 데이터 한 점의 생애주기(The Lifecycle of a Data Point) 에서 우리는 끝까지 확대해 들어갑니다. 센서나 분석가가 단일 측정값을 만들어내는 순간부터 — 포착, 처리, 맥락화, 의사결정, 보유, 그리고 아카이빙(archival)을 거치며 — 그것을 추적할 것입니다. 그 과정에서 우리는 원시 데이터(raw data) 와 메타데이터(metadata) 사이에 선을 긋고, 이후의 모든 것의 핵심에 있는 개념과 마주할 것입니다: 맥락 없는 데이터는 그저 잡음일 뿐이다.