본문으로 건너뛰기

설계 공간을 모델링하기: CPP, CQA, 그리고 그래프로서의 QbD

📍 현재 위치: 제2부 · 발견과 개발, 모델링됨 — 제7장. 분자와 그 살아 있는 공장은 모델링되었습니다. 이제 우리는 분자를 제어 가능한 공정으로 바꾸는 지식을 모델링하고 — QbD가 사실은 온톨로지라는 서문의 주장을 실현합니다.

서문은 품질 설계 기반(Quality by Design, QbD) — 기록된 공정 이해를 제품의 일부로 취급하는 체계 — 이 이름만 다를 뿐 온톨로지라고 약속했습니다. 이 장이 바로 그 약속을 실현하는 장입니다. 공정 개발은 팀이 어떤 손잡이가 중요한지를 배우는 곳입니다. 즉 어떤 핵심 공정 변수(critical process parameters, CPPs)가 어떤 핵심 품질 속성(critical quality attributes, CQAs)을, 그리고 어떤 범위에서 좌우하는지를 배웁니다. 그 지식은 분자 자체를 제외하면 프로그램이 생산하는 가장 값진 것이지만, 보통은 어떤 기계도 읽을 수 없는 개발 보고서 속에 살아 있습니다. 우리는 그것을 대신 기계가 질의할 수 있는 그래프로 모델링합니다.

쉽게 말하면

훌륭한 요리사는 오븐 온도가 크러스트에 영향을 주고, 휴지 시간이 식감에 영향을 주며, 각각의 안전한 범위가 어디까지인지를 압니다. 그것을 노트에 산문으로 적어 두면, 노트 전체를 읽은 사람만이 쓸 수 있습니다. 그것을 구조화된 지도로 적으면 — 이 손잡이저 결과에, 이런 한계 안에서 영향을 주고, 그것을 증명한 실험은 여기 있다 — 누구든, 어떤 컴퓨터든 "크러스트에 영향을 주는 게 뭐지?"라고 물어 답을 얻을 수 있습니다. QbD는 약을 만들기 위한 바로 그 구조화된 지도입니다. 이 장은 그것을 산문에서 질의 가능한 그래프로 바꿉니다.

이 장에서 다루는 내용

우리는 QbD 어휘 — 공정 변수, 품질 속성, 임계성, 설계 공간(design space), 그리고 관리 전략(control strategy) — 을 엔터티와 관계로 모델링하면서, 공리 장이 도입한 affectsQuality 관계를 확장해 나갑니다. 우리는 관계를 신뢰할 만하게 만드는 증거(연구, 범위, 위험 수준)를 부착하고, 하나의 CPP-CQA 연결을 해부하며, 정직한 한계와 마주합니다. 그래프는 어떤 변수가 중요한지를 색인할 수 있지만, 정확히 어떻게 중요한지를 말해 주는 연속적인 응답 표면(response surface)을 담을 수는 없다는 한계입니다.

임계성은 그래프가 숨길 것이 아니라 기록해야 할 판단이다

공정 변수(process parameter)는 여러분이 고를 수 있는 모든 설정 — 공급 속도, 온도, pH, 용존 산소 — 입니다. 품질 속성(quality attribute)은 제품의 측정 가능한 모든 특성 — 단량체 순도(monomer purity), 글리코실화(glycosylation), 전하 변이체(charge variants) — 입니다. 둘 중 어느 하나를 핵심으로 만드는 것은 하나의 판단입니다. 어떤 변수가 그럴듯한 한계 안에서 변할 때 어떤 CQA에 의미 있게 영향을 준다면 그 변수는 CPP이고, 어떤 속성이 안전성이나 유효성에 영향을 준다면 그 속성은 CQA입니다 [1]. 순진한 모델은 임계성을 클래스 이름에 박아 넣고 넘어갑니다. 더 나은 모델은 임계성을 출처(provenance)를 갖춘 평가된 품질(assessed quality)로 취급합니다. 즉 이 변수는 임계성이 높으며(hasCriticality high), 그것은 특정 위험 평가에 의해 결정되었고, 왜냐하면 이 CQA에 영향을 주기 때문이라는 식입니다. 결론뿐 아니라 판단 자체를 모델링하는 것이 바로 그래프로 하여금 "왜 공급 속도가 CPP인가?"에 답하게 하고, 누군가 그것을 재평가하는 날에도 살아남게 합니다. 임계성은 ICH Q9 분야인 품질 위험 관리(quality risk management)의 산출물이며, 그것을 만들어 낸 평가 자체가 보존할 가치가 있는 엔터티입니다 [2].

affectsQuality, 그 증거를 부착한 채로

QbD의 핵심은 하나의 관계입니다. CPP가 CQA에 영향을 준다는 것입니다. ProcessParameter에서 QualityAttribute로 가는 객체 속성 bp:affectsQuality로 선언하면, bp:FeedRate bp:affectsQuality bp:MonomerPct라는 사실은 보고서 속의 한 문장이기를 멈추고 질의 가능한 간선(edge)이 됩니다. 그래서 "어떤 변수가 단량체 순도에 영향을 주는가?"는 이렇게 모델링하는 모든 프로그램을 가로지르는 한 줄짜리 질의가 됩니다. 하지만 간선만으로는 뒷받침 없는 주장에 불과합니다. 공정 지식을 신뢰할 만하게 만드는 것은 증거이므로, 모델은 그것을 관계에 매답니다. 연결을 확립한 실험 계획법(design-of-experiments, DoE) 연구, 변수가 제어되는 검증된 허용 범위(proven acceptable range, PAR)와 그보다 좁은 정상 운영 범위(normal operating range, NOR), 그리고 효과의 강도나 방향입니다. 관계에 그 증거를 더한 것이 "우리는 공급 속도가 중요하다고 믿는다"와 "공급 속도는 연구 DOE-07에 따라 단량체 순도에 영향을 주며, PAR의 0.30–0.50으로, NOR 0.35–0.45로 제어된다"의 차이입니다 — 조사자, 감사자, 혹은 소프트 센서 모델이 딛고 설 수 있는 사실입니다. 선언하고 단언하기만 하면, 그 하나의 간선이면 충분합니다.

# bioproc.ttl + instances.ttl — QbD's core relation, declared and then asserted.
bp:affectsQuality a owl:ObjectProperty ;
rdfs:domain bp:ProcessParameter ; rdfs:range bp:QualityAttribute .
bp:FeedRate a bp:ProcessParameter .
bp:MonomerPct-CQA a bp:QualityAttribute .
bp:FeedRate bp:affectsQuality bp:MonomerPct-CQA . # the prose claim, now a queryable edge

그리고 "어떤 변수가 단량체 순도에 영향을 주는가?"라는 질문은, 적재 가능한 그래프 위에서 한 줄짜리 질의와 한 행짜리 답이 됩니다.

# affects-quality.rq
PREFIX bp: <https://example.org/bioproc#>
SELECT ?parameter ?attribute WHERE {
?parameter bp:affectsQuality ?attribute .
?attribute a bp:QualityAttribute .
}
affectsQuality edges: [('FeedRate', 'MonomerPct-CQA'), ('Temperature', 'MonomerPct-CQA')]

그 헐벗은 간선은 거기에 매단 증거만큼만 신뢰할 수 있으며, 데이터셋에서 그 증거는 실재합니다 — 임계성 평가, 두 범위, 연결을 확립한 연구, 그리고 그래프가 저장하지 않는 표면을 가리키는 포인터입니다.

# instances.ttl — the same parameter, now with its evidence, ranges, criticality, and model pointer.
bp:FeedRate
bp:hasCriticality bp:CRIT-FeedRate ; # assessed HIGH...
bp:hasNormalOperatingRange bp:NOR-FeedRate ; # NOR 0.35-0.45
bp:hasProvenAcceptableRange bp:PAR-FeedRate ; # PAR 0.30-0.50 (wider)
bp:establishedBy bp:DOE-07 . # ...by design-of-experiments study DOE-07
bp:CRIT-FeedRate a bp:Criticality ; bp:criticalityLevel "high" ; bp:establishedBy bp:RA-01 .
bp:NOR-FeedRate a bp:NormalOperatingRange ; bp:norLow 0.35 ; bp:norHigh 0.45 .
bp:PAR-FeedRate a bp:ProvenAcceptableRange ; bp:parLow 0.30 ; bp:parHigh 0.50 .
bp:DESIGNSPACE-mAb-A a bp:DesignSpace ; bp:referencesModel bp:RSM-feedrate-monomer . # the surface lives in the model file

하나의 CPP-CQA 관계를 해부한 신분증: 공정 변수 bp에 대한 주어 행, 술어 행 bp, 품질 속성 bp에 대한 목적어 행, 연결을 확립한 실험 계획법 연구 DOE-07과 QUDT 타입의 구간으로 표현된 검증된 허용 범위 및 그보다 좁은 정상 운영 범위, 그리고 효과의 방향과 크기를 부착한 증거 블록, 명명된 위험 평가에 의해 그 변수를 CPP로 표시하는 임계성 행, 그리고 전체 응답 표면은 그래프가 아니라 참조된 모델 파일에 산다는 점을 적어 둔 포인터 행으로 구성되어 있다. 공정 지식의 한 단위: affectsQuality 간선은 그것을 증명한 연구, 그것을 한정하는 범위, 그리고 그 변수를 핵심으로 만든 위험 평가를 함께 실어 나릅니다 — 그래서 개발에서 가장 값진 지식은 한 문단이 아니라 하나의 사실이 됩니다. 저자가 AI의 도움을 받아 직접 제작한 그림입니다.

설계 공간은 하나의 영역이고, 그래프는 그 색인이다

여러 affectsQuality 관계를 그 범위와 함께 모아 놓으면 설계 공간(design space)에 다가가게 됩니다. 허용 가능한 제품을 산출하는 것으로 입증된 변수 설정들의 다차원 영역입니다 [1]. 그 안에 머무르면 품질이 보장됩니다. 그것이 QbD의 거래 전부입니다. 그래프가 설계 공간을 담아야 한다고 생각하기 쉽습니다. 하지만 그래서는 안 되며, 그 이유를 보면 제1부가 가르친 모든 것이 더 날카로워집니다. 설계 공간은 서로 영향을 주고받는 여러 변수에 걸친 연속적인 표면 — 데이터로부터 적합된 응답 표면 — 입니다. 연속적인 표면을 주어-술어-목적어 트리플로 평면화하면 그래프가 수백만 개의 무의미한 행으로 부풀어 오르고도 여전히 표면의 형태를 잃게 됩니다. 정확히 지식 그래프 장이 스펙트럼과 크로마토그램에 대해 그었던 경계입니다.

그래서 분업은 시리즈 전체를 관통하는 바로 그것과 동일합니다. 그래프는 구조와 의도를 담고 — 어떤 변수가 어떤 속성에 영향을 주는지, 그 범위, 그 증거, 그 임계성을 — 응답 표면은 IRI로 참조되는 모델 산출물로 둡니다. 그래프는 공급 속도와 온도가 함께 단량체 순도에 영향을 준다는 사실을 말하고, 연구를 명명하며, 범위를 한정하고, 정확히 어떻게인지를 말해 주는 적합된 모델을 가리킵니다. 그래프는 공정 지식의 탐색 가능한 색인이고, 모델 파일은 표면의 창고입니다. 이것이 그래프를 작고, 질의 가능하고, 정직하게 유지하며, 여기서 모델링한 설계 공간이 자매편의 하이브리드 및 ML 모델과 깔끔한 이음매에서 만나는 이유입니다. 그래프는 관계를 색인하고, 모델은 값을 계산합니다.

두 층으로 된 도식: 위층은 지식 그래프 뷰로, 공정 변수 노드(공급 속도, 온도, pH, 용존 산소)가 affectsQuality 간선으로 품질 속성 노드(단량체 순도, 글리코실화, 전하 변이체)에 연결되며 각 간선에는 DoE 연구와 범위가 태그로 붙어 있고, 관리 전략 노드가 이들을 하나로 묶는다. 아래층은 참조된 모델 산출물로, 설계 공간이라 이름 붙은 다차원 응답 표면으로 나타나며, 트리플로 평면화되는 대신 단 하나의 IRI 포인터로 그래프에 연결된다. 캡션에는 그래프는 어떤 변수가 중요한지를 색인하고 모델 파일은 얼마나 중요한지를 담는다고 적혀 있다. 두 층, 하나의 이음매: 그래프는 affectsQuality 관계, 범위, 관리 전략을 질의 가능한 사실로 담고, 적합된 응답 표면을 IRI로 가리킵니다 — 설계 공간을 저장하려 하는 대신 색인하는 것입니다. 저자가 AI의 도움을 받아 직접 제작한 그림입니다.

관리 전략은 지식이 행동이 되는 곳이다

무엇이 중요한지 아는 것은 그것을 제어하는 것과 같지 않습니다. 관리 전략(control strategy)은 함께 품질을 보장하는 계획된 관리 묶음 — 변수 범위, 공정 중 시험, CQA를 점검하는 분석 방법 — 입니다 [3]. 모델링하면 그것은 그래프 전체를 하나로 묶습니다. 각 관리는 CPP를 제어하고(controls), CQA를 검증하며(verifies), 분석 방법을 사용합니다(usesMethod). 이것이 레시피로서 공장에 전달되는 산출물이며, 그것을 문서가 아니라 관계로 모델링한다는 것은 하류의 출하 게이트가 관리 전략 안의 모든 CQA에 실제로 결과가 있는지를 기계적으로 점검할 수 있다는 뜻입니다 — 개발 의도에서 제조 증거에 이르는 고리를 닫는 것입니다.

# instances.ttl — the control strategy as relations, not a document.
bp:CS-mAb-A a bp:ControlStrategy ; bp:hasControl bp:CTRL-monomer .
bp:CTRL-monomer a bp:Control ;
bp:controls bp:FeedRate ; # holds the CPP within its range...
bp:verifies bp:MonomerPct-CQA ; # ...to assure the CQA...
bp:usesMethod bp:SEC-Method . # ...checked by the validated SEC method

미해결 과제: 상호작용, 그리고 구조적 모델의 한계

정직한 어려움은 두 가지이며, 둘 다 구조적 모델이 포착할 수 없는 것에 관한 이야기입니다. 첫째는 상호작용(interaction)입니다. 변수들은 좀처럼 단독으로 작용하지 않습니다 — 공급 속도와 온도는 오직 조합으로서만 중요할 수 있고, 가능한 상호작용의 수는 변수가 늘어남에 따라 조합론적으로 폭발합니다. 그래프는 상호작용이 존재한다고 단언하고 연구를 가리킬 수 있지만, 상호작용의 형태를 표현할 수는 없습니다. 그것은 다시, 그래프가 참조만 하는 응답 표면에 삽니다. affectsQuality 간선을 한 번에 한 변수씩 나열하는 모델은 공정이 실제보다 단순하다고 슬며시 암시할 수 있으며, 결합 효과도 함께 모델링하고 — 그것이 알려지지 않은 곳에 표시를 다는 — 규율은 건너뛰기 쉽습니다.

둘째는 입증된(proven) 설계 공간과 모델링된(modeled) 설계 공간 사이의 간극입니다. 규제상의 설계 공간 검증은 어렵고, 진화 중이며, 데이터에 굶주려 있습니다. 아름답게 모델링된 affectsQuality 관계의 그래프는 각 간선 뒤의 연구만큼만 참이며, 초기 공정 지식은 정의상 불완전합니다. 그래프는 공정 이해를 읽을 수 있고 질의 가능하게 만들며, 이는 묻혀 있는 보고서에 비해 진정한 진전입니다 — 하지만 읽을 수 있다는 것이 완전하거나 옳다는 것과 같지는 않습니다. 공리 장이 일관성과 참 사이에 그었던 바로 그 구분입니다. 모델은 프로그램이 무엇을 왜 믿는지에 대한 정직한 지도입니다. 그것은 그 믿음이 진실의 전부라고 인증하지 않으며, 그렇지 않은 척하는 것이 자신만만한 그래프가 미성숙한 공정을 숨기는 방식입니다.

왜 중요한가

공정 지식은 데이터 사업 전체를 정당화하는 자산이며, 그래프는 그것이 갇혀 있기를 멈추는 곳입니다. 증거와 범위를 갖춘 affectsQuality 관계로 모델링하면, QbD 지식은 질의 가능해지고("이 CQA에 영향을 주는 게 뭐지?"), 점검 가능해지며(모든 CQA에 관리와 결과가 있는가?), 이식 가능해집니다(보고서를 다시 읽는 것이 아니라 사실로서 새 사이트로 이전됩니다). 그것은 또한 ML 및 소프트 센서 모델이 꽂히는 기반이 됩니다. 설계 공간을 존중하는 하이브리드 모델은 설계 공간이 기계가 읽을 수 있는 어딘가에 표현되어 있어야 하기 때문입니다. 이 장은 서문의 "공정 이해"가 컴퓨터가 담을 수 있는 무언가가 되는 곳입니다.

실제 현장에서는

QbD, 설계 공간, CPP와 CQA, 그리고 관리 전략은 이 책이 지어낸 말이 아닙니다 — 그것들은 규제 당국과 산업계가 공유하는 ICH 품질 가이드라인의 어휘이며, 바로 그렇기에 이를 공유 온톨로지로 모델링하는 것이 억지스럽기는커녕 자연스럽습니다 [1][2][3]. 개발 팀이 확립하는 관계들은 이미 그들의 머릿속과 보고서 속에서 하나의 그래프입니다. 이 장이 주장하는 움직임은 그 그래프를 기계가 순회할 수 있는 형태로 적어 내려가는 것입니다. 제약 품질 시스템에서 지식 관리에 대한 기대도 같은 방향을 가리킵니다 — 매번 다시 도출되는 것이 아니라 생애주기 전반에 걸쳐 재사용 가능한 자산으로 포착된 공정 이해를 향해 — 그리고 질의 가능한 CPP-CQA 그래프는 그 발상의 가장 직접적인 구현입니다 [3].

핵심 용어

  • 핵심 공정 변수(critical process parameter, CPP) — 그 변동이 품질 속성에 의미 있게 영향을 주는 공정 설정. 그 임계성을 평가되고 증거가 뒷받침하는 품질로서 모델링한다.
  • 핵심 품질 속성(critical quality attribute, CQA) — 안전성이나 유효성에 영향을 주어 한계 안에 머물러야 하는 측정 가능한 제품 특성.
  • affectsQuality — 변수에서 품질 속성으로 가는 핵심 QbD 관계로, DoE 증거, 범위, 효과를 부착된 사실로 실어 나른다.
  • 설계 공간(design space) — 허용 가능한 제품을 산출하는 것으로 입증된 설정들의 다차원 영역. 그래프가 색인하고, 참조된 응답 표면 모델로 저장하며, 트리플로 평면화하지 않는다.
  • 검증된 허용 범위(proven acceptable range, PAR) / 정상 운영 범위(normal operating range, NOR) — 변수에 대한 더 넓은 검증된 구간과 더 좁은 일상 운영 구간. QUDT 타입의 범위로 모델링한다.
  • 관리 전략(control strategy) — 품질을 보장하는 계획된 관리, 시험, 방법의 묶음. 변수, 속성, 방법, 단계를 한데 묶는 관계로 모델링한다.
  • 품질 위험 관리(quality risk management) — 임계성을 평가하는 ICH Q9 분야. 그 평가는 결론만이 아니라 그 자체가 모델링된 엔터티다.

다음 이야기

우리는 공정이 무엇을 달성해야 하는지, 그리고 그것이 어떻게 제어되는지를 모델링할 수 있습니다. 하지만 관리 전략 안의 모든 CQA는 측정으로 점검되고, 측정에는 그 자체의 풍부한 구조가 있습니다. 다음 장 분석 방법과 결과 모델링하기: Allotrope와 OBI는 품질을 검증하는 방법들을 모델링합니다 — 발생자(occurrent)로서의 분석, 계획(plan)으로서의 방법, 타입이 있고 벤더 중립적인 사실로서의 결과 — 그리고 출하 수치는 그래프에 속하지만 그 뒤의 스펙트럼은 그렇지 않은 경계와 마주합니다.