본문으로 건너뛰기

제조 현장과 디지털 트윈: 온톨로지가 아직 도착 중인 곳

📍 현재 위치: 7부 · 오늘날 산업 현장의 온톨로지 — 29장. 앞선 장들은 실험실규제 경계가 의미론적으로 성숙해 있음을 확인했습니다. 이제 우리는 생산 현장으로 걸어 들어갑니다. 이 책이 쌓아 올린 모델이, 가장 늦게 다다른 그 장소를 만나는 곳입니다.

실험실에는 Allotrope와 SiLA가 있고, 규제 경계에는 IDMP와 구조화된 제출 자료가 있습니다. 둘 다 정형 의미론이 이미 실질적인 일을 해내는 곳입니다. GMP 생산 현장 — 바이오리액터, 크로마토그래피 스키드, 그리고 이들을 한데 엮는 제조실행시스템 — 은 다릅니다. 그곳은 공장에서 계측이 가장 촘촘하면서도 온톨로지화는 가장 덜 된 부분입니다. 데이터는 방대하고 걸린 것은 가장 큰데도, 오늘날 현장에서 실제로 작동하는 "의미론"은 온톨로지가 전혀 아닙니다.

이 장은 그 프런티어에 대해 정직합니다. 그곳에서 실제로 상용 가동되는 모델은 두 종류이며, 둘 중 어느 것도 정형 온톨로지가 아닙니다. 하나는 제조 현장 데이터를 시스템 사이로 옮기는 구조화된 정보 모델(structured information models)이고, 다른 하나는 어떤 배치가 좋은 배치들과 닮았는지를 판정하는 통계 모델(statistical models)입니다. 정형 온톨로지 계층 — 이 책이 스물여덟 장에 걸쳐 쌓아 온 그런 종류 — 은 도착하고 있지만, 개념 증명(proof of concept), 컨소시엄 파일럿, 학술 릴리스의 형태로 도착합니다. 이 두 세계를 구분해 내는 것이 이 장의 요체입니다.

쉽게 말하면

흠 없이 돌아가는 분주한 주방을 그려 보십시오. 주문은 모든 스테이션이 이해하는 고정된 형식의 인쇄 전표를 타고 흐르고, 총주방장은 완벽한 한 접시의 사진을 기준으로 모든 요리를 판정합니다. 잘 돌아갑니다 — 그런데 정작 "요리"가 무엇인지, 그것이 재료와 어떻게 관계 맺는지, 왜 이 소스가 지난주의 레시피와 같은 레시피로 간주되는지를 아무도 적어 두지 않았습니다. 전표와 기준 사진은 추론을 돌릴 수 있는 요리책이 아닙니다. 바이오의약품 공장의 현장이 바로 그 주방입니다. 전표와 기준 사진은 넘쳐 나지만, 요리책은 이제 막 쓰기 시작했을 뿐입니다.

이 장에서 다루는 내용

우리는 흐리기 쉬운 세 가지를 분리합니다. 첫째, 구조화된 정보 모델(structured information models)ISA-95/IEC 62264 계층 구조와 그 B2MML XML 직렬화, 제조실행시스템(MES) 마스터 배치 레코드, 그리고 자산 프레임워크(asset-framework) 맥락화 계층 — 으로, 상용 가동되지만 정형 OWL 온톨로지는 아닙니다. 둘째, 통계 모델(statistical models) — "골든 배치(golden batch)" 위에 구축된 다변량 지속적 공정 검증(Continued Process Verification, CPV) 접근 — 으로, 이는 의미론이 아니라 수학입니다. 셋째, 진정으로 온톨로지적인 작업 — 상호운용성 파일럿(Asset Administration Shell, SiLA 2, OPC UA LADS, SOSA/SSN), 바이오공정 온톨로지 그 자체(BioPhorum, MCBO, IOF Biopharma 참조 온톨로지), 그리고 누군가는 언젠가 그 위에 서기를 바라는 디지털 트윈(digital twins) — 입니다. 이 장 내내 모든 도입 주장에는 성숙도 배지가 붙습니다. 이 현장에서는 출시됨제안됨 사이의 간극이야말로 가장 중요한 사실이기 때문입니다.

현장 기술을 성숙도로 나눈 3열 원장. 초록 상용 열은 ISA-95/B2MML, MES 마스터 배치 기록, CPV/골든 배치, SOSA/SSN을 나열하며 '데이터를 옮기고 측정할 뿐 의미는 아니다'라는 평결을 단다. 호박색 파일럿 열은 자산 관리 셸, SiLA 2/AnIML, OPC UA LADS, BioPhorum 온톨로지, 디지털 트윈을 나열하며 현장을 향해 손을 뻗지만 아직 출시되지 않았다고 적는다. 보라 학술/제안 열은 MCBO, NIST 디지털 트윈 프레임워크, IOF 바이오파마 온톨로지를 나열하며 어느 것도 명명된 상용 도입처가 없다. 아래 분홍 띠는 현장의 의미가 여전히 독점·통계 모델에 살고 형식 계층이 빠진 조각이라고 진술한다. 성숙도로 정렬한 GMP 현장: 구조화·통계 모델은 오늘날 상용으로 돌아가는 반면, 형식적 바이오공정 온톨로지와 온톨로지에 기반한 디지털 트윈은 여전히 파일럿과 학술 작업이다. 저자가 AI의 도움을 받아 직접 제작한 그림입니다.

실제로 가동되는 것: 구조화된 모델과 통계 모델

명백히 상용 가동 중인 것에서 출발합시다 — 그리고 그중 어느 것도 이 책이 말하는 의미의 온톨로지가 아니라는 점에 주목하십시오.

현장을 잇는 결합 조직은 ISA-95(전사-제어 통합을 위한 ISA-95/IEC 62264 표준)와 그 XML 직렬화인 B2MML(Business To Manufacturing Markup Language)입니다. 둘은 함께 ERP 시스템과 MES가 Level 3과 Level 4 사이의 정보 — 무엇을, 얼마만큼, 어느 주문에 맞춰 만들지 — 를 교환하는 어휘와 메시지 형상을 정의합니다. 바이오의약품 공장이 운용할 법한 주요 MES 플랫폼 — Körber PAS-X, Siemens Opcenter, Rockwell FactoryTalk PharmaSuite, AVEVA, Dassault Apriso, SAP Digital Manufacturing — 은 모두 이 계층 위에 세워집니다. 문서화된 Genentech 사례는 SAP IDoc을 B2MML로 통합했고, 이 패턴은 충분히 흔해져 SAP은 이후 B2MML 콘텐츠 패키지를 출시했습니다 [1]. 이것은 상용 가동 중인 의미론적 정보 모델(semantic information model in production)입니다 — 그러나 추론기를 돌릴 수 있는 정형 OWL 온톨로지가 아니라 구조화된 XML 스키마입니다. (상용 단계)

그 곁에는 MES 마스터 배치 레코드(master batch record, MBR) — 전자 레시피와 그것이 생성하는 실행본 배치 레코드 — 가 자리합니다. 이곳이 바로 우리 러닝 예제의 bp:BATCH-2026-001이 실제 현장에 실제로 존재하는 곳입니다. bp:SEED-001로 향하는 derivedFrom 엣지를 가진 RDF 노드로서가 아니라, 독점 MES 데이터베이스의 한 행으로, 벤더 자체 모델 안에 인코딩된 계보로서 말입니다. 관계는 실재합니다. 형식론은 이식 가능하지 않습니다.

두 번째 상용 등급 모델은 통계적입니다. 지속적 공정 검증(Continued Process Verification) — FDA의 공정 검증 3단계로, 공정이 검증된 상태에 머물러 있다는 지속적 보증 — 은 오늘날 골든 배치(golden batch)(과거의 양호한 가동에서 증류해 낸 기준 프로파일) 위의 다변량 통계(multivariate statistics)로 구현됩니다. 배포된 수학은 주성분 분석과 부분 최소제곱(PCA/PLS)이며, Hotelling의 T 제곱 통계량과 Q 잔차 통계량이 라이브 배치가 정상 운전의 매니폴드에서 벗어날 때 이를 표시합니다. 이것은 상용 도구에 패키징되어 있고 — MilliporeSigma의 Bio4C ProcessPad, Sartorius/Umetrics SIMCA — 한 ISPE 사례는 이를 5,000-L 세포 배양 배치에 적용했습니다 [11]. 그것은 "이 배치가 좋은 배치들과 닮았는가?"에 진짜 엄정함으로 답합니다. 그러나 그것은 온톨로지가 아니라 통계적 데이터 모델(statistical data model, not an ontology)입니다. 거리를 계산할 뿐, 의미를 표상하지는 않습니다. (상용 단계)

계층무엇인가정형 온톨로지인가?성숙도
ISA-95 / B2MMLERP↔MES 교환을 위한 XML 정보 모델아니오 (구조화된 XML)(상용 단계)
MES 마스터 배치 레코드독점 전자 레시피 + 계보아니오 (벤더 모델)(상용 단계)
CPV / 골든 배치다변량 통계 (PCA/PLS)아니오 (통계적)(상용 단계)
AAS, SiLA 2, OPC UA LADS상호운용성 / 트윈 메타모델부분적 / 매핑 가능(파일럿 단계)
SOSA/SSN센서 텔레메트리 온톨로지예 (W3C/OGC)(표준으로서 상용 단계)
MCBO, NIST DT, IOF Biopharma정형 바이오공정 온톨로지예 (BFO/IOF)(학술 단계 / 제안 단계)

상호운용성 파일럿: 현장으로 손을 뻗는 메타모델

생산 현장 한 계층 위에서, 현장 데이터를 온톨로지가 붙잡을 수 있을 만큼 이식 가능하게 만들어 줄 일군의 표준이 파일럿 중입니다.

Asset Administration Shell(AAS)는 Industrie 4.0의 디지털 트윈 메타모델 — 자산의 속성과 역량을 기술하는 표준화된 컨테이너로, OPC UA에 매핑 가능 — 입니다. ISPE의 Pharma 4.0 Plug & Produce 분과위원회는 검증된 실험실 장비를 AAS와 디지털 트윈으로 통합하는 개념 증명을 발표했습니다(2023) — 상용 배치가 아니라 개념 보고서 단계입니다 [2]. (파일럿 단계)

SiLA 2(Standardization in Lab Automation, 버전 2)는 실험실 장비 연결을 위한 개방형 무로열티 표준으로, 분석 데이터를 위한 AnIML과 짝을 이룹니다. 그것은 초기 파일럿 배치 단계에 있습니다. Tecan의 FluentControl을 위한 오픈소스 SiLA 2 커넥터가 Tecan, UniteLabs, Roche의 지원으로 2024년 출시되었고, Roche의 "AC/DC" 콘셉트는 바젤 R&D 환경에서 SiLA 2 드라이버를 사용합니다 [3]. 이 커넥터가 사이트 인수 시험(Site Acceptance Testing)을 통과해 Roche 전반으로 확대되었다는 추가 주장은 공개 근거에서 확인되지 않았으므로, 이는 논외로 둡니다. (파일럿 단계)

OPC UA LADS(OPC 30500, Laboratory and Analytical Device Standard) — 실험실·분석 장비를 위한 최초의 OPC UA 동반 사양으로, 2023년 12월경 출시 — 는 2025년 한 해커톤에서 Allotrope Foundation Ontology 및 ASM과 함께 종단 간으로 시연되어, 통신 표준(전선 위의 라이브 데이터)과 데이터 표준(문서화되고 구조화된 결과)을 하나로 묶었습니다. 공개된 산출물은 명시적으로 출시 제품이 아니라 개념 증명 시뮬레이터입니다 [4]. (파일럿 단계)

마지막으로 SOSA/SSN — W3C/OGC Semantic Sensor Network 온톨로지 — 은 센서, PAT, 바이오리액터 텔레메트리를 의미론적으로 모델링하는 표준적이고 벤더 중립적인 방식입니다 [5]. 그것은 AVEVA PI Asset Framework 같은 자산 프레임워크가 제공하는 독점 맥락화에 대응하는 정형 온톨로지 짝이며 — 이 책의 생산 바이오리액터 장이 모델링한 프로브 측정값의 자연스러운 거처입니다. SOSA/SSN은 성숙한 상용 등급 표준이지만, 특히 제약 현장에서의 도입은 여전히 미미합니다. (표준으로서 상용 단계; 제약 현장 도입은 미미)

바이오공정 온톨로지 그 자체

이제 정형 온톨로지 — 현장의 의미를 실제로 표상하게 될 것들 — 입니다. 그것들은 존재하고, 좋은 작업이며, 그러나 그중 단 하나도 바이오의약품 제조에서 이름이 명시된 상용 배치를 갖고 있지 않습니다.

BioPhorum 바이오제조 온톨로지(biomanufacturing ontology)("Big Data to Smart Data", 2023년 11월)는 바이오제조 공정 데이터를 위한 시스템 독립적 온톨로지입니다. 그것은 NC State의 BTEC에서 검증되었는데, 그곳에서 다섯 대의 바이오리액터에 걸친 OD-프로브 교정 워크플로를 네 시간에서 삼십 분으로 단축했다고 보고되었습니다 [6]. 그 수치는 단일 컨소시엄 개념 증명 데이터포인트입니다 — 대표 지표가 아니라 하나의 검증 사례로 읽으십시오. (파일럿 단계)

두 개의 학술 온톨로지는 이 책 자체의 토대를 직접 적용합니다. NIST의 "Towards Ontologizing a Digital Twin Framework for Manufacturing"(2023)은 BFOIOF Core를 사용해 ISO 23247 디지털 트윈 프레임워크를 정형화하며, 바이오리액터를 그 작업된 바이오제조 예제로 삼습니다 [8]. 그리고 MCBO(Mammalian Cell Bioprocessing Ontology, 포유류 세포 바이오공정 온톨로지)는 2026년 초 bioRxiv에 게시된 BFO + IOF Core 허브-앤-스포크 온톨로지로 — 아직 동료 심사를 거치지 않았으며 — 723개의 큐레이션된 세포 배양 인스턴스에 대해 SPARQL 역량 질의로 검증되었고 방화벽 내부 사용을 위해 MIT 라이선스로 배포되었으며, 이름이 명시된 산업 배치는 없습니다 [9]. 이것들은 정확히 우리 bp: 그래프가 그 작은 사촌뻘인 그런 종류의 모델입니다. BFO에 기초하고, IOF에 정렬되며, 질의 가능합니다. (학술 단계)

조율된 참조 노력에 가장 가까운 것은 OAGi/NIIMBL IOF Biopharma 온톨로지 — ISA-88과 ISA-95에 기대어 BFO 및 IOF Core에 정렬된 참조 온톨로지 — 입니다. 공개 릴리스가 2024년 12월에 나왔고, 더 큰 정형 릴리스가 2025년 말로 발표되었습니다 [10]. Pistoia Alliance의 CMC Process Ontology가 이것들을 임포트한다는 주장은 Pistoia 자체 릴리스로 입증되지 않으며, 그 릴리스는 ISA-88/95만을 인용합니다 — 따라서 우리는 그 연결을 단언하지 않습니다. (제안 단계)

그 위에 올라선 디지털 트윈

헤드라인을 장식하는 디지털 트윈은 실재하고 인상적입니다 — 그리고 그것들은 정형 온톨로지가 아니라 하이브리드 기계론·기계학습 모델 위에 세워집니다. Samsung Biologics의 삼중 양식 바이오리액터 트윈은 전산 유체 역학, 제1원리 동역학, 다변량/ML 모델링을 결합합니다. GSK의 폐루프 백신 트윈(2019년부터 Siemens 및 Atos와 함께 구축)은 단일 공정을 둘러싼 제어 루프를 닫습니다 [7]. 둘 다 단일 단위 공정으로 범위가 한정되어 있으며, GSK 사례의 "폐루프" 규정은 2019년 무렵의 벤더 PR에 근거하므로 이는 벤더 주장으로 읽으십시오. 수학은 성숙해 있습니다. 그러나 그 아래의 의미론 — 한 트윈의 모델이 다른 트윈의 모델과 같은 것을 의미하게 해 줄 부분 — 이 빠진 계층입니다. (파일럿 단계)

미해결 과제: 현장의 의미는 여전히 독점 모델과 통계 모델 속에 산다

정직한 요약은 불편합니다. GMP 제조 현장에서 작동하는 의미론은 구조화되어 있고(B2MML, MES 배치 레코드, 자산 프레임워크) 통계적입니다(골든 배치 CPV 모델). 정형 온톨로지 계층은 이름이 명시된 상용 거처가 없는 개념 증명들과 학술 온톨로지들의 프런티어입니다. 두 가지 구체적 간극이 이 책이 앞서 도달했던 판단을 되울립니다. 첫째, 연속 공정의 개별화(continuous-processing individuation): 제품이 이산적인 로트가 아니라 연속적으로 흐를 때, 우리 bp:BATCH-2026-001이 의지했던 깔끔한 배치 및 단위 공정 경계가 녹아 없어지고, 연속 라인에서 시간으로 한정된 로트에 대한 정착된 온톨로지는 아직 존재하지 않습니다. 둘째, 데이터 표준화 병목(data-standardization bottleneck) — 디지털 트윈 문헌 전반에서, 모델링도 수학도 아닌 FAIR하고 의미론적인 데이터 표준화가 트윈과 제조 AI를 확장하는 데 있어 으뜸 장애물로 거듭 지목됩니다. 그 "모델링은 풀렸고, 데이터는 풀리지 않았다"는 틀짓기는 단일 리뷰에 크게 기대고 있으니, 확립된 사실이 아니라 옹호할 만한 견해로 다루십시오.

왜 중요한가

이곳이 이 책의 모델이 가장 가혹한 현실을 만나는 지점입니다. 우리 bp: 그래프는 단위 공정을 derivedFrom 엣지와 부착된 CQA를 지닌 깔끔한 공정 노드로 다루었습니다. 실제 현장은 여전히 그 동일한 관계를 독점 마스터 배치 레코드나 통계적 골든 배치 모델에 인코딩합니다 — 둘 다 작동하지만, 둘 중 어느 것도 추론하거나 공유할 수 있는, 거버넌스되고 검증된 온톨로지가 아닙니다. 현장의 의미를 정형 모델로 바꾸는 일은 미완성이며, 그 이유는 영리함의 부족이 아닙니다. 그것은 규율의 부족입니다 — 공유 식별자, FAIR 데이터, 검증된 어휘 말입니다. 이 책의 마무리 장들이 기술이 아니라 규율을 다루는 것은 바로 그 때문입니다.

실제 현장에서는

현장에서 실제로 출시되는 것과 파일럿에 머무는 것은 깔끔하게 갈라지며, 그 근거는 조사 곳곳에 흩어 두기보다 한곳에 모아 둘 가치가 있습니다. 상용 단계(production)에서는: ISA-95/B2MML 정보 모델이 ERP와 MES 사이로 작업을 옮기며, Genentech의 SAP IDoc 대 B2MML 통합이 SAP으로 하여금 B2MML 콘텐츠 패키지를 출시하게 만들 만큼 구체적입니다 [1]. MES 마스터 배치 레코드는 이 책이 bp:BATCH-2026-001 derivedFrom bp:SEED-001로 모델링하는 계보를, 그리고 거기서 출하된 bp:DS-001bp:DP-001 로트에 이르기까지를 담지만, 이식 가능한 그래프가 아니라 벤더 독점 스키마 안에 담습니다. 그리고 골든 배치 위의 다변량 CPV가 상용 도구에서 돌아가며, 한 ISPE 사례는 이를 5,000-L 세포 배양 배치에 적용했습니다 [11]. 파일럿 단계(piloted)에서는: BioPhorum 바이오제조 온톨로지가 NC State의 BTEC에서 단일 OD-프로브 교정 개념 증명으로 검증되었고 [6], Samsung Biologics와 GSK의 디지털 트윈은 실재하지만 각각 하나의 단위 공정으로 범위가 한정되어 있으며 정형 온톨로지가 아니라 하이브리드 기계론·ML 모델 위에 세워집니다 [7]. 학술 단계 또는 제안 단계(academic or proposed)에서는: MCBO, NIST 디지털 트윈 프레임워크, 그리고 OAGi/NIIMBL IOF Biopharma 참조 온톨로지 — BFO와 IOF에 기초한, 정확히 이 책의 bp: 그래프가 속한 그 계열 — 가 아직 이름이 명시된 상용 배치를 갖고 있지 않습니다 [8][9][10]. 패턴은 일관됩니다: 구조화 모델과 통계 모델은 출시되고, 정형적이고 공유 가능한 의미론 계층은 여전히 도착 중인 그것입니다.

핵심 용어

  • ISA-95 / B2MML — 전사-제어 통합을 위한 IEC 62264 표준과 그 XML 직렬화. ERP와 MES 사이로 데이터를 옮기는, 정형 온톨로지가 아닌 구조화된 정보 모델.
  • 마스터 배치 레코드(master batch record, MBR) — MES가 실행하는 전자 레시피와 그것이 생성하는 실행본 레코드. 배치 계보를 벤더 독점 모델 안에 담는다.
  • 지속적 공정 검증(Continued Process Verification, CPV) — FDA의 공정 검증 3단계. 실제 현장에서는 의미론적 모델이 아니라 다변량 통계 모델(골든 배치 위의 PCA/PLS)이다.
  • 골든 배치(golden batch) — 과거의 양호한 가동에서 증류해 낸 기준 프로파일로, 라이브 배치를 통계적 거리로 비교하는 기준이 된다.
  • Asset Administration Shell(AAS) — 자산의 속성과 역량을 위한 Industrie 4.0 표준화 디지털 트윈 메타모델로, ISPE를 통해 제약용으로 파일럿되었다.
  • SiLA 2 / AnIML — 실험실 장비 연결과 분석 데이터를 위한 개방형 무로열티 표준으로, 초기 파일럿 배치 단계에 있다.
  • OPC UA LADS — OPC 30500, 실험실·분석 장비를 위한 최초의 OPC UA 동반 사양으로, 개념 증명으로 시연되었다.
  • SOSA/SSN — W3C/OGC Semantic Sensor Network 온톨로지. 센서와 PAT 텔레메트리를 모델링하는 벤더 중립적 정형 방식으로, 독점 자산 프레임워크에 대응한다.
  • 디지털 트윈(digital twin) — 물리 자산의 라이브 전산 모델. 오늘날 바이오제조 현장에서는 정형 온톨로지가 아니라 하이브리드 기계론·ML 모델 위에 세워진다.
  • MCBO — Mammalian Cell Bioprocessing Ontology(포유류 세포 바이오공정 온톨로지). 큐레이션된 세포 배양 인스턴스에 대해 검증된 BFO + IOF Core 학술 온톨로지로, 이름이 명시된 산업 배치는 없다.

다음 이야기

현장은 우리에게 수학은 성숙했으나 의미는 아직 도착 중인 프런티어를 보여 주었습니다 — 그리고 빠진 계층을 분명히 이름했습니다: 거버넌스되고, 공유되며, 의미론적인 데이터 말입니다. 마지막 장은 그 계층이 마침내 존재할 때 무엇이 가능해지는지를 묻습니다. 다음 장 프런티어: AI의 그라운드 트루스로서의 온톨로지는 온톨로지가 도착하고 있는 곳에서, 그 도착이 왜 가장 중요한가로 시선을 돌립니다: 틀리는 것이 선택지가 아닌 공정에 대해 기계학습과 거대 언어 모델을 정직하게 붙들어 두는 검증 가능한 그라운드 트루스로서 말입니다.