머리말 — 같은 약을 두 번 만든다는 것
📍 현재 위치: 바로 문 앞입니다. 약을 만드는 단 한 단계라도 시작하기 전에, 이 책이 정말로 무엇에 관한 것인지 — 그리고 왜 바이오의약품이 사실상 두 번 만들어지는지 — 함께 짚어 봅시다.
환영합니다. 이 책은 눈에 보이지 않는 무언가에 관한 책입니다. 현대의 약이 제조될 때, 생산 라인에서는 두 가지 제품이 나옵니다. 하나는 손에 쥘 수 있습니다. 바이알(vial) 속의 맑은 액체, 살아 있는 세포가 키워 낸 단백질이지요. 다른 하나는 결코 손에 쥘 수 없습니다 — 그것은 그 액체가 어떻게 만들어졌는지에 대한 완전한 기록, 즉 그 바이알 안에 라벨에 적힌 바로 그것이 정확히 들어 있음을 증명하는 모든 측정값과 서명과 시험 결과입니다. 이 두 번째 제품이 바로 데이터(data) 이며, 이것을 잘 관리하는 것이 환자에게 도달하는 약과 그러지 못하는 약의 차이를 가릅니다.
이 책을 읽는 데는 아무런 배경지식도 필요 없습니다. 공장에 한 번도 발을 들여 본 적 없고, 규정을 읽어 본 적도 없으며, 데이터베이스를 생각해 본 적도 없다면, 당신이야말로 우리가 염두에 두고 쓴 바로 그 독자입니다. 우리는 전문 용어가 처음 나올 때마다 그 뜻을 정의하고, 각 장의 끝에 있는 핵심 용어 상자에서 다시 한번 정리해 드리겠습니다.
심사위원이 두 가지를 하는 대회에 케이크를 구워 출품한다고 상상해 보세요. 심사위원은 케이크를 맛보는 동시에 당신의 노트를 읽습니다 — 모든 재료의 무게, 오븐의 온도, 시간 한 분 한 분까지, 당신이 만들어 가며 서명하고 날짜를 적은 그 노트 말입니다. 맛있는 케이크만으로는 충분하지 않습니다. 노트의 한 페이지가 빠져 있다면, 케이크가 아무리 완벽해도 실격입니다. 그리고 흠잡을 데 없는 노트라도 맛 심사에서 떨어진 케이크를 구해 줄 수는 없습니다. 규제 대상인 의약품 제조에서는 케이크가 그렇듯 노트 역시 제품 그 자체이며 — 둘 다 합격해야 합니다. 이 책은 바로 그 노트를 지키는 일에 관한 책입니다.
이 장에서 다루는 내용
머리말을 빠르게 짚어 보면 다음과 같습니다. 이 책이 누구를 위한 것인지와 우리가 당신에게 하는 약속, 데이터는 그 자체로 하나의 제조된 제품이라는 핵심 발상, 이 책의 다섯 부(part)가 서로 어떻게 맞물리는지, 이 책이 동반 공정 가이드인 From Cell to Cure 와 어떤 관계인지, 그리고 모든 페이지에서 보게 될 인용·용어집·이중 언어 같은 몇 가지 규칙입니다.
우리의 약속: 모든 주장은 추적 가능합니다
이 책은 어조는 대중서이고 엄밀함은 교과서입니다. 이 두 목표는 서로 충돌할 수 있어서, 우리는 한 가지 규칙을 세웠습니다. 자명하지 않은 모든 주장은 — 모든 숫자, 모든 규제 사실, 모든 "연구에 따르면"은 — 이런 작은 대괄호 표시를 답니다 [1]. 그것을 클릭하면 단 하나의 참고문헌(References) 페이지에 도달하는데, 그 페이지에는 해당 진술의 근거가 되는 정확한 동료 심사 논문이나 규제 문서가 나열되어 있습니다. 자명하지 않은 주장이라면 어디서든 그 출처로 따라가 직접 확인할 수 있습니다.
데이터는 제품의 쌍둥이입니다
이 책 전체가 의지하는 핵심 발상은 이렇습니다.
바이오의약품(biologic) — 순수한 화학이 아니라 살아 있는 세포가 만들어 내는 약으로, 단일클론항체(monoclonal antibody)(조작된 세포가 수십억 개씩 키워 낸 똑같은 하나의 항체 단백질로, 단 하나의 표적 분자 — 항원(antigen) — 에 결합합니다)가 그 예입니다 — 은 같은 방식으로 두 번 만들기가 어렵습니다. 그것은 조립되는 게 아니라 키워지는 것이므로, 그것을 만드는 방식 자체가 그것이 실제로 무엇인지를 정의하는 데 한몫을 합니다. 이 과제에 대한 규제 분야의 답이 설계기반 품질(Quality by Design, QbD) 이라 불리는 것인데, 이는 공정에 대한 깊고 기록된 이해를 분자 그 자체만큼이나 제품에 필수적인 것으로 다룹니다. 즉, 어떤 공정 설정이 핵심 공정 변수(critical process parameters, CPPs) 이고 어떤 측정 가능한 제품 특성이 핵심 품질 특성(critical quality attributes, CQAs) 인지를 식별한 다음, 그 둘을 잇는 데이터를 확보하는 것입니다 [1]. 다시 말해, 현대의 의약품 제조는 단지 분자를 생산하는 데 그치지 않습니다. 그것은 그 분자에 대한 지식 을, 기록된 형태로 생산합니다.
그 지식은 방대합니다. 단 하나의 배치(batch)는 끊임없는 센서 측정값의 흔적을 남깁니다 — 온도, 산소, 산도(酸度) 등을 실시간으로 포착하여, 품질을 제조가 끝난 뒤에만이 아니라 제조 도중 에 판단할 수 있게 하지요. 규제 당국은 이 접근을 공정 분석 기술(Process Analytical Technology, PAT) 이라 부릅니다 [2]. 각각의 측정값은 작고 구조화된 하나의 사실입니다. 바이오리액터에서 나온 단 하나의 온도 측정점은 tag=BR101.Temp.PV, value=37.2, unit=°C, timestamp=2026-06-14T14:32:07Z, status=OK 처럼 저장될 수 있습니다 — 이름이 붙은 태그(tag)(여기서는 ISA-95/ISA-88 장비 계층과 흔히 쓰이는 OPC/히스토리안 공정값(.PV) 속성에서 볼 수 있는 종류의, 구조화되고 계층적인 명명 규칙을 따릅니다), 값, 단위, 정확한 시각, 그리고 품질 플래그입니다. 이런 사실이 수백만 개씩 쌓입니다. 여기에 실험실 시험 결과, 단계별 배치 기록, 사람의 서명까지 더하면, 약 그 자체와 나란히 흘러가는 두 번째 산물이 생겨납니다. 우리는 이것을 그 분자의 데이터 그림자(data shadow) 라고 부릅니다.
하나의 공정, 두 개의 제품 — 분자와 그 데이터 그림자는 함께 만들어지고, 함께 평가되며, 함께 출하됩니다.
저자 원본 도해(AI 보조로 제작).
여기서 따라 나오는 냉엄한 결과는 이렇습니다. 규제 대상 공정에서는, 효과적으로 기록되지 않은 배치는 일어나지 않은 것이다. 어떤 배치가 양호함을 증명하는 데이터가 빠져 있거나, 불완전하거나, 신뢰할 수 없다면, 탱크 속 분자가 완벽하더라도 그 약은 출하될 수 없습니다. 데이터는 제품에 관한 서류가 아닙니다. 그것은 하나의 제품입니다.
이 책을 읽는 법: 다섯 개의 부
이 책은 다섯 개의 부로 나뉘어 전해지는 하나의 연속된 논증입니다. 처음부터 끝까지 쭉 읽어도 되고, 필요한 부로 건너뛰어도 됩니다.
- Part I — 왜 데이터가 제품의 쌍둥이인가 — 방금 만난 발상을 풀어냅니다. 한 배치의 데이터 그림자가 무엇을 담고 있는지, 그리고 왜 기록되지 않은 배치는 일어나지 않은 것인지.
- Part II — 출처, 시스템, 아키텍처 — 데이터가 태어나는 곳(센서, 장비, 사람)과 그것을 공장 전체에 걸쳐 포착하고 저장하는 시스템.
- Part III — 무결성, 규정 준수, 검증 — 환자의 안전을 걸 만큼 데이터를 신뢰할 수 있게 만드는 규칙들, 그리고 그 신뢰가 어떻게 입증되는지.
- Part IV — 의미론과 디지털 스레드 — 데이터를 단지 저장 되는 것을 넘어 의미 있는 것으로 만들기: 공유된 어휘와 연결을 통해, 그것을 읽는 모든 시스템과 사람에게 하나의 숫자가 같은 것을 뜻하게 하기.
- Part V — 분석과 미래 — 데이터가 깨끗하고, 연결되어 있으며, 신뢰할 수 있게 되었을 때 비로소 가능해지는 것들, 공정 통찰에서부터 내일의 공장에 이르기까지.
다섯 개의 부 전체를 관통하는 한 가닥의 실이 있으니, 바로 FAIR 원칙(FAIR principles) 입니다. 이는 좋은 과학 데이터라면 찾을 수 있고(Findable), 접근할 수 있고(Accessible), 상호운용 가능하며(Interoperable), 재사용 가능해야(Reusable) 한다는, 널리 채택된 지침 원칙입니다 — 서랍 속에, 혹은 한 기계만이 읽을 수 있는 형식에 갇혀 있어서는 안 된다는 것이지요 [3]. FAIR를 마음에 새겨 두십시오. 우리는 이것으로 자주 되돌아올 것입니다.
생물학을 먼저 알고 싶다면
이 책에는 동반서가 있습니다. 바로 From Cell to Cure 로, 바이오의약품을 만드는 실제 물리적 공정 — 표적을 고르고, 세포를 만들고, 바이오리액터(bioreactor)(살아 있는 세포가 약을 생산하는 따뜻한 탱크)에서 그것을 키우고, 그 결과물을 정제하여 바이알에 충전하는 일 — 에 대한 입문 가이드입니다. 그 가이드는 약이 어떻게 만들어지는가 에 답합니다. 이 책은 데이터가 어떻게 만들어지고 관리되는가 에 답합니다.
따라가는 데 그 가이드가 꼭 필요한 것은 아닙니다 — 우리는 각 공정 단계가 관련될 때마다 그것을 다시 소개할 테니까요. 하지만 데이터보다 생물학과 장비를 먼저 만나고 싶다면, 거기서 시작하세요. From Cell to Cure 가이드가 이 책의 동반 권이며, 두 책은 나란히 두고 읽도록 설계되었습니다.
이 책 전체에 걸쳐, 우리는 기초를 가르치기 위해 바이오의약품을 만드는 표준적인 상업적 방식에 기대고, 더 연속적인 현대의 접근이 어디서 다른지를 짚어 드립니다. 미국에서는 NIIMBL 연구소와 델라웨어 대학교(University of Delaware)에 건설 중인 그 SABRE 파일럿 시설이 그 현대적 경로를 발전시키기 위한 것이며, 실제 사례 절에서 이들을 만나게 됩니다.
몇 가지 규칙
이것들은 모든 페이지에 등장하므로, 한 번 알아 두는 것이 좋습니다.
- 인용. [2] 같은 본문 표시는 참고문헌 페이지로 연결됩니다. 화면에 보이는 번호는 각 장 안에서만 통하며 매 장마다 [1]에서 다시 시작합니다.
- 핵심 용어. 각 장은 그 장에서 소개한 용어들의 짧은 용어집으로 끝나므로, 위로 다시 스크롤해 올라갈 필요가 없습니다.
- 어드모니션(admonition). 색이 있는 상자는 도움이 되는 곁가지 설명을 표시합니다. 윗부분의 쉬운 우리말 비유에는
tip, 유용한 맥락에는note, 오해가 정말로 해를 끼칠 수 있는 곳에는caution을 씁니다. - 이중 언어. 이 책은 영어와 한국어(Korean)로 출간되어, 독자가 어느 한쪽 언어로든 따라 읽을 수 있습니다.
- 상표. 이 책에 언급된 제품명 및 회사명(Siemens, gPROMS, AspenTech, Aspen Hybrid Models, DataHow, DataHowLab, OPC UA, GAMP, PI System, Sartorius, Thermo Fisher, Cytiva, Waters, Agilent, AVEVA, OSIsoft, InfoPlus.21을 포함하되 이에 한정되지 않습니다)은 각 소유자의 상표 또는 등록 상표일 수 있으며, 식별 및 편집 목적으로만 사용될 뿐 어떠한 보증(endorsement)을 주장하지 않습니다.
이 책은 의약품 제조에서 데이터 관리를 어떻게 생각 해야 하는지를 가르칩니다. 이 책은 규제 자문이 아니며, 검증된 절차도 아닙니다. 실제 제조 의사결정은 현행 공식 지침과 당신 조직의 승인된 공정을 따라야 합니다.
왜 중요한가
단 하나만 기억해야 한다면, 이것으로 하십시오. 데이터를 관리하는 일은 제조의 사무적인 꼬리가 아니라 — 그것이 곧 제조의 절반입니다. 분자와 그 데이터 그림자는 함께 만들어지고, 함께 평가되며, 함께 출하됩니다. 데이터를 뒤늦은 일거리로 취급하면 물리적으로는 멀쩡하지만 법적으로도 과학적으로도 출하할 수 없는 배치를 떠안을 위험이 있습니다. 반면 데이터를 하나의 제품으로 — 분자와 똑같은 정성으로 설계하고, 만들고, 품질을 점검한 것으로 — 취급하면, 규제 승인에서 환자의 신뢰에 이르기까지 그 아래의 모든 것이 단단한 토대 위에 서게 됩니다. 이어지는 모든 장은 근본적으로 그 신뢰를 얻어 내는 일에 관한 것입니다.
실제 사례
이것은 이론상의 문제가 아닙니다. Part I을 떠받치는 설계기반 품질 체계는 규제 과학에서 곧바로 나온 것으로 — ICH 가이드라인 Q8(R2), Q9, Q10에 제시되어 있습니다 — 공정 데이터를 부산물이 아니라 제품의 핵심으로 다시 규정했습니다 [1]. 실시간 인-프로세스 측정 — PAT — 으로 향하는 흐름 또한, 마지막에 검사하는 대신 제조 도중에 품질을 만들어 넣으려는 규제 당국에서 비롯되었으며, FDA의 2004년 PAT 지침(FDA 2004 PAT guidance)에 성문화되었습니다 [2]. 그리고 우리가 데이터를 저장하고 연결하는 방식을 형성하는 FAIR 원칙 은 더 넓은 과학계에서 시작되어 이후 산업과 정부 전반으로 퍼져 나갔습니다 [3].
이러한 발상들은 실제 장비와 실제 소프트웨어 위에서 실현됩니다. 세포를 키우는 바이오리액터는 Sartorius, Thermo Fisher, Cytiva 같은 공급업체에서 나오고, 제품을 정제하는 크로마토그래피(chromatography) 시스템은 Cytiva, Waters, Agilent에서 나옵니다. 각 장비의 끊임없는 측정값 — 온도, pH, 용존 산소(dissolved oxygen) — 은 데이터 그림자의 일부를 이루는 촘촘한 센서 스트림(sensor stream)이 됩니다. 그 스트림들은 허공으로 사라지지 않습니다. 공정 히스토리안(process historian)(예: AVEVA/OSIsoft PI System이나 AspenTech InfoPlus.21)이 그것을 포착하고, 제조 실행 시스템(Manufacturing Execution System, MES) 이 조율하며, 실험실 정보 관리 시스템(Laboratory Information Management System, LIMS) 에 보관된 실험실 결과가 거기에 합쳐집니다. 그리고 환자가 거기에 의지하기에, 그 데이터 그림자 전체는 구속력 있는 규칙의 지배를 받습니다. 전자 기록과 전자 서명은 FDA의 21 CFR Part 11 과 EU의 Annex 11 을 충족해야 하며, 컴퓨터 시스템은 GAMP 5(ISPE) 같은 지침에 따라 검증됩니다 — 이 책이 처음부터 끝까지 되돌아오는 규제와 체계들입니다.
NIIMBL(미국 바이오의약품 제조 혁신 연구소, U.S. National Institute for Innovation in Manufacturing Biopharmaceuticals) 같은 민관 협력 사업은 이러한 발상들을 현대 바이오 제조로 가져갑니다. 그 SABRE 파일럿 시설 — 제조 혁신을 확대 적용하고(scale up) 위험을 줄이며 인력을 양성하기 위한, 델라웨어 대학교(University of Delaware)의 우수제조관리기준(cGMP, current Good Manufacturing Practice — 약을 만들기 위해 지켜야 하는 구속력 있는 품질 규칙) 공장 — 은 그 작업을 뒷받침하기 위해 건설 중입니다. 이 책의 주제들은 약을 만드는 사람들이 매일같이 마주하는 생생한 현실의 관심사입니다.
핵심 용어
- 바이오의약품(biologic) — 순수한 화학이 아니라 살아 있는 세포가 만들어 내는 약.
- 단일클론항체(mAb) — 조작된 세포가 엄청난 수로 키워 낸 똑같은 하나의 항체 단백질로, 몸속 단 하나의 표적 분자(항원, antigen)에 결합합니다.
- 바이오리액터(bioreactor) — 살아 있는 세포를 키워 약을 생산하게 하는 따뜻한 탱크.
- 배치(batch) / 로트(lot) — 정해진 양의 제품을 만드는 한 번의 완전한 제조 실행.
- 데이터 그림자(data shadow) — 한 배치와 나란히 생성되는, 기록된 데이터(센서 흔적, 시험 결과, 배치 기록, 서명)의 전체 묶음.
- 설계기반 품질(QbD) — 기록된 공정 이해를 제품 그 자체에 필수적인 것으로 다루는 체계.
- 핵심 공정 변수(CPP) — 제품 품질에 영향을 미치므로 반드시 통제해야 하는 공정 설정.
- 핵심 품질 특성(CQA) — 약이 안전하고 효과적이려면 한계 안에 머물러야 하는, 측정 가능한 제품 특성.
- 공정 분석 기술(PAT) — 핵심 특성을 제조가 끝난 뒤에만이 아니라 제조 도중에 실시간으로 측정하는 것.
- FAIR 원칙(FAIR principles) — 데이터는 찾을 수 있고, 접근할 수 있고, 상호운용 가능하며, 재사용 가능해야 한다는 원칙.
- NIIMBL / SABRE — 현대 바이오 제조를 발전시키는 미국의 민관 연구소와, 델라웨어 대학교에 건설 중인 그 cGMP 파일럿 시설.
- 우수제조관리기준(cGMP, current Good Manufacturing Practice) — 약을 제조하려면 시설이 반드시 따라야 하는, 법적 구속력을 가진 품질 규칙.
- 참고문헌 페이지(References page) — 모든 본문 인용 표시가 그 출처로 연결되는 단 하나의 페이지.
이 다음은
우리는 모든 1그램의 약이 분자 그 자체만큼이나 필수적인 데이터 그림자 를 드리운다고 주장했습니다. 다음 장 바이오의약품과 그 데이터 그림자는 그것을 구체화합니다. 단 하나의 배치가 만들어 내는 데이터의 규모와 여러 유형 — 센서 흔적, 배치 기록, 시험 결과, 서명 — 을 짚어 가며, 규제 대상 제조의 핵심에 있는 문서화의 명령, 즉 이 산업을 수십 년간 이끌어 온 규칙을 소개합니다. 기록되지 않았다면, 일어나지 않은 것이다.