본문으로 건너뛰기

표준 기관: 바이오파마의 공유 어휘를 실제로 만드는 주체

📍 현재 위치: 7부 · 오늘날 산업 현장의 온톨로지 — 24장. 6부는 단 하나의 항체 배치 위에서 전체 모델을 조립하고, 거버넌스를 적용하고, FAIR로 측정했습니다. 이제 우리 자신의 예시라는 작업대를 떠나, 앞선 장들이 조용히 전제로만 깔아 두었던 실증적 질문을 던질 차례입니다.

스물세 장 동안 우리는 공유 표준(the shared standard)이라는 안심되는 표현에 기대 왔습니다. bp:DS-001을 IDMP 물질 식별자에 묶었고, 우리 클래스를 BFO에 정렬했으며, 중간 단계 골격을 IOF Core에서 빌려 왔고, SHACL로 검증했습니다. 그때마다 우리는 마치 어떤 권위 있는 어휘가 그저 존재하며 가져다 쓰이기를 기다리고 있다는 듯이 말했습니다. 이제는 그 어휘를 누가 쓰는지에 대해 솔직해질 때입니다 — 그 답이 실제 공장이 자신의 의미론을 어떻게 설계해야 하는지를 다시 짜기 때문입니다.

짧게 말하면, 그 어휘 중 소프트웨어 벤더에서 나온 것은 거의 없습니다. 바이오파마에서 공유 의미의 엔진은 비경쟁 컨소시엄(pre-competitive consortia)입니다. 경쟁사들이 경쟁우위를 주지 않는 부분 — 단어, 파일 형식, 식별자 — 에 노력을 모으는 동맹으로, 바로 그렇게 함으로써 대신 과학으로 경쟁하려는 것입니다. 각 컨소시엄은 공정의 한 조각을 소유합니다. 그러나 어느 곳도 전체를 소유하지는 않습니다. 그 결과는 수렴하고는 있으나 느리게 수렴하는 누더기입니다.

쉽게 말하면

같은 것을 필요로 하는 경쟁 식당 열두 곳을 떠올려 보십시오. 그들에게 필요한 것은 합의된 재료 이름 목록입니다. 그래야 공급업체가 말하는 "정백당(caster sugar)"이 모든 주방에서 같은 것을 뜻합니다. 어느 한 식당이 그 목록을 소유해서는 안 됩니다 — 다른 식당들이 결코 믿지 않을 테니까요 — 그래서 그들은 함께 목록을 관리할 모임을 만듭니다. 바이오파마에는 그런 모임이 하나가 아니라 여럿 있고, 저마다 식료품 창고의 다른 통로를 정리합니다. 하나는 실험실 기기, 하나는 원료의약품, 하나는 레시피, 하나는 배송 라벨을 맡습니다. 음식은 괜찮습니다. 문제는 그 통로들을 채운 모임이 서로 다르고, 선반이 어디서 끝나는지에 대해 늘 합의하지는 않는다는 데 있습니다.

이 장에서 다루는 내용

이 장은 어휘 자체가 아니라 컨소시엄(consortia)의 지도입니다 — 어휘 자체는 다음 장이 따로 다룹니다. 우리는 처음부터 끝까지 하나의 구분을 단단히 유지합니다. 진정한 형식 온톨로지(ontology)는 추론기가 그 위에서 실행될 수 있는 OWL/RDF 산물인 반면, 구조화된 정보 모델(structured information model)은 형식 논리 의미론 없이 데이터를 조직하는 XML 또는 객체 스키마입니다. 둘은 혼동하기 쉽지만 결코 혼동해서는 안 됩니다. 우리는 선도적인 형식 온톨로지 컨소시엄으로 Allotrope FoundationPistoia Alliance를 둘러보고, ISA-88과 ISA-95 뒤의 구조화 모델 기관으로 MESA International, OPC Foundation, PROFIBUS & PROFINET International을, 성숙도 프레임워크 저자로 ISPEBioPhorum을, 식별 및 신생 바이오제조 온톨로지를 위해 GS1OAGi/NIIMBL 협업을 함께 살핍니다. 모든 채택 주장에는 굵은 괄호로 성숙도 배지가 붙습니다. 발표된 명세와 배포된 명세는 몇 년씩 떨어져 있기 때문입니다.

바이오파마 표준 컨소시엄을 그들이 담당하는 계층별로 보여 주는 3열 카드 지도: 분석 실험실 열(Allotrope Foundation, Pistoia Alliance), 제조 공정 열(MESA International, OPC Foundation, PROFIBUS·PROFINET International, ISA-88·ISA-95 백본 주석 포함), 그리고 엔터프라이즈·식별 열(ISPE, BioPhorum, GS1, OAGi·NIIMBL). 각 카드는 상용 단계는 초록, 파일럿 단계는 호박색, 제안 단계는 보라색으로 표시됩니다. 각 사전경쟁 컨소시엄은 바이오파마 공유 어휘의 한 구역을 담당하며 그 성숙도에 따라 색으로 구분된다 — 어느 한 기관도 전체를 소유하지 않는다. 저자가 AI의 도움을 받아 직접 제작한 그림입니다.

형식 온톨로지 컨소시엄

이 책이 전제해 온 진짜 OWL-과-BFO 작업을 하는 컨소시엄은 둘입니다.

Allotrope Foundation은 실험실 데이터 영역에서 산업적으로 가장 널리 채택된 형식 온톨로지 노력입니다 (상용 단계). 2012년 6월 4일에 독립 법인으로 설립되었으며, IQ 컨소시엄 — 제약 개발의 혁신과 품질을 위한 국제 컨소시엄(International Consortium for Innovation and Quality in Pharmaceutical Development) — 에서 분사했습니다 [1]. Allotrope는 세 부분으로 이루어진 프레임워크를 발행합니다. AFO(Allotrope Foundation Ontology), 즉 분석 및 실험실 데이터를 위한 BFO 정렬 통제 어휘; ADM(Allotrope Data Models); 그리고 ADF(Allotrope Data Format), 즉 HDF5 기반 바이너리 데이터 컨테이너로 그 v1.0은 2015년 10월에 출시되었습니다 [2]. 그 무게는 회원사에서 나옵니다. 아홉 곳의 Foundation Member — Amgen, BASF, Bayer, Boehringer Ingelheim, Dow, Genentech, GSK, Johnson & Johnson, Merck & Co. — 와, Agilent, Bruker, SCIEX, Shimadzu, Benchling, BIOVIA 같은 기기 벤더가 별도의 Partner Network 계층에 자리합니다 [1]. 앞선 장에서 우리 98.611 % 단량체 같은 SEC 결과를 위해 통제 용어를 가져온다고 말했을 때, AFO야말로 그때 염두에 둔 종류의 어휘였습니다.

Pistoia Alliance는 더 폭넓게 비경쟁 제약 온톨로지를 위한 핵심 매개체입니다 (구성요소별로 파일럿 단계에서 상용 단계). 2008년에 이탈리아 Pistoia에서 열린 학회에서 만난 AstraZeneca, GSK, Novartis, Pfizer의 대표들에 의해 설립되었으며, 지금은 200곳이 넘는 회원을 보고합니다 [4]. 그 포트폴리오는, 작업이 미완인 곳에서조차, 이 산업이 무엇을 표준화하려 하는지를 보여 주는 유용한 색인입니다.

프로젝트표준화 대상성숙도
IDMP Ontology (IDMP-O)물질 및 제품 식별; v1.0은 2024년 1월 24일 공개, 오픈소스, 11개 제약사 공동 개발 [3]구성요소별로 (상용 단계)
Unified Data Model (UDM)개방형 화학반응 교환; v6.0 2021년 1월, MIT 라이선스(상용 단계)
Methods Hub기계 판독 가능한 분석법 이전(파일럿 단계)
Pharma General Ontology (PGO)"FAIR 사일로" 문제 — 한 회사 안에서는 FAIR하지만 회사 간에는 그렇지 않은 데이터 — 를 겨냥한 공유 상위 수준 참조(제안 단계)
CMC Process OntologyISA-88 정렬 공정 어휘; v1.0은 2026년 중반경으로 발표 [5](제안 단계)

IDMP-O는 실제 공장에서 우리 bp:DS-001 뒤에 자리하는 바로 그것입니다. 제조사가 규제 대상 물질 정체성을 표현하기 위해 사용하는 형식 온톨로지인 것이죠. PGO는 그 솔직함 때문에 짚어 둘 만합니다. 그것은 한 회사 안의 FAIR가 회사 간에는 불충분하다는 것이 입증되었기 때문에 존재하며, 이는 6부의 FAIR 점수 매기기가 우리 모델이 파트너의 모델과 만나는 순간 드러냈을 바로 그 간극입니다.

구조화 모델 기관

다음 계층은 형식 온톨로지가 아니라 정보 모델(model)을 만들어 냅니다 — 그리고 그 구분이 여기서 제 몫을 합니다. OWL 위에서 추론기를 돌릴 수 있는 방식으로 XML 스키마 위에서 추론기를 돌릴 수는 없기 때문입니다.

그 척추는 ISA 표준군입니다. 배치 레시피 구조를 위한 ISA-88과, 제조실행시스템을 기업과 연결하기 위한 ISA-95(IEC/ISO 62264로도 발행됨)로, 후자는 설비·자재·인력을 위한 객체 모델을 갖추고 있습니다 (상용 단계) [6]. 이 표준들은 자신의 객체를 산문과 표로 기술합니다. 그것을 기계가 교환하는 무언가로 바꾸는 일은 구현체의 몫입니다.

MESA International은 그 구현을 B2MML(Business to Manufacturing Markup Language)로 제공합니다. ISA-95 표준군을 무료, W3C-XSD로 렌더링한 것입니다. 최신판은 2020년 11월 24일에 발표된 B2MML Version 7(V0700)로, 2018년 ISA-95 판본에 정렬하고 최초의 B2MML-JSON 명세를 추가했습니다 [6]. B2MML은 제약 분야에서 사실상의 MES 교환 계층으로 널리 묘사됩니다 — 그러나 그 평판은 대체로 발표된 채택 데이터가 아니라 시스템 통합업체의 주장에 기대고 있으며, 그렇게 읽혀야 합니다 (상용 단계, 벤더·통합업체 자가보고).

B2MML이 트랜잭션 데이터를 나르는 곳에서, OPC FoundationOPC UA for ISA-95 Common Object Model (OPC 10030)을 통해 실시간 의미론을 더합니다. 2013년 11월 6일자 Release 1.00으로, B2MML이 시스템 사이로 옮기는 바로 그 객체 어휘를 살아 있는 설비가 직접 말할 수 있게 해 주는 동반 명세입니다 (상용 단계) [7].

더 새롭고, 모듈형 공장을 더 정조준한 것은 Module Type Package (MTP)입니다. VDI/VDE/NAMUR 2658로 표준화되었고 OPC UA에 AutomationML을 더해 구축되어 "플러그 앤 프로듀스(plug-and-produce)" 모듈형 자동화를 가능하게 합니다. 그 거버넌스는 2021년 11월에 NAMUR, ZVEI와 공동으로 PROFIBUS & PROFINET International (PI)로 이관되었고, MTP V2.0.0은 2024년 가을에 출시되었으며, 이 작업은 IEC 63280으로 국제화되고 있습니다 (파일럿 단계) [8]. 제약과 바이오테크는 MTP에서 거듭 가장 큰 관심을 보이는 부문으로 인용됩니다 — 합리적인 의지의 신호이되, 아직 광범위한 상용 사용의 신호는 아닙니다.

성숙도 프레임워크 기관

세 번째 종류의 컨소시엄은 어휘가 아니라 그것을 사용하는 데서 당신이 얼마나 멀리 왔는지를 표준화합니다. 이들은 프레임워크이며, 그 성숙도 배지는 (프레임워크로서 상용 단계)입니다 — 프레임워크 자체가 실재하고 사용된다는 뜻이지, 어느 특정 공장이 그 최상위 단계에 도달했다는 뜻은 아닙니다.

ISPE는 Pharma 4.0 작업을 발행합니다. 2023년 12월에 출시된 Baseline Guide Vol 8 (Pharma 4.0, 1st edition)으로, ICH Q10을 확장하고 35개 사용 사례를 포함합니다 [9]. 여기에는 acatech Industrie 4.0 Maturity Index를 기반으로 한 성숙도 모델 및 자가진단이 담겨 있으며 — 이것은 여섯 단계 모델이므로 흔한 "5단계"라는 줄임말은 부정확합니다 — 네 가지 운영 모델 차원, 즉 자원(Resources), 조직과 프로세스(Organization and Processes), 정보 시스템(Information Systems), 문화(Culture)에 걸쳐 있습니다 [9].

BioPhorumDigital Plant Maturity Model (DPMM)을 유지합니다. 종이 기반 운영에서 자기 최적화 자율 공장에 이르는 5단계 모델입니다. DPMM V3는 2023년 10월에 발행되어 QC와 QMS 차원을 분리하고 공정 개발(Process Development) 차원을 추가했으며, 보안 차원의 이름을 "Cybersecurity"로 바꾸었습니다 [10]. 인용되는 것을 보게 될 한 수치에 대해 주의할 점이 있습니다. 회원의 약 80%가 DPMM을 사용한다는 자주 인용되는 주장은 이전의, V3 이전 도구로 거슬러 올라갑니다 — 그것을 현재 측정치가 아니라 과거의 자가보고 근거로 다루십시오 (프레임워크로서 상용 단계) [10].

식별, 그리고 가장 새로운 진입자

식별을 위한 수렴된 척추는 GS1입니다. 2D DataMatrix에 인코딩된 GTIN, 일련번호, GLN과, 이벤트 교환을 위한 EPCIS — 이제 의약품 일련화(serialization)를 떠받치는 표준들입니다 (상용 단계) [11]. 미국 DSCSA 제조사 단속은 2025년 5월 27일에 시작되었고, EU의 위조의약품지침(Falsified Medicines Directive)은 2019년 2월 9일부터 시행 중입니다. 정확성을 위해 한 가지 미묘한 점이 중요합니다. DSCSA는 상호운용 가능한 전자 추적성을 의무화하지만 GS1을 유일하게 허용되는 형식으로 지명하지는 않습니다 — 그 요구를 충족하기 위해 GS1 EPCIS를 선택한 것은 산업입니다 [11].

가장 새로운 진입자는 형식 온톨로지를 도로 가리킵니다. 2024년 6월, NIIMBL은 자사 Big Data Program의 온톨로지를 Open Applications Group (OAGi)에 기여하여, BFO와 IOF Core에 정렬된 오픈소스 바이오파마 제조 온톨로지를 공동 개발하기로 했습니다 (제안 단계) [12]. 그 노력에는 발행된 짝이 있습니다. IOF 바이오제약 도메인 온톨로지 자체입니다. 2026년 2월 릴리스(Release_202602)에 비추어 감사해 보면, 이 온톨로지는 171개의 Released 클래스 — 단위공정 44개, QbD 파라미터 17개, 그리고 장비·물질·레시피 용어 — 를 정의하며, 오늘날 존재하는 바이오공정 내부의 가장 완전한 형식 어휘이자 이 책의 실행 예제가 이제 공정 단계를 묶는 대상입니다. 이것은 이 책이 구축해 온 모델과 가장 직접적으로 이어지는 작업이며 — 그러나 발행되고 Released된 상태임에도, 이 부가 거듭 맴도는 그 한 가지, 곧 실제로 그것에 의존하는 상용 환경의 공장을 여전히 원합니다. 어휘는 도입보다 빨리 도착했고, 그것이 바로 산업 간 바이오제조 의미론이 아직 얼마나 어린지를 가장 분명하게 보여 주는 표지입니다.

미해결 과제: 발표된 명세가 곧 채택된 명세는 아니다

비경쟁 합의는 느리고 부분적이며, 위의 지도가 그 이유를 보여 줍니다. 통로마다 다른 기관이 소유합니다 — Allotrope는 실험실, Pistoia는 물질, MESA와 PI는 레시피와 공장 현장, GS1은 포장을 — 그리고 그 조각들은 어떤 곳에서는 겹치고 어떤 곳에서는 간극을 남깁니다. 더 나쁜 것은, 날짜들이 반복되는 이야기를 들려준다는 점입니다. 명세는 보통 광범위한 채택보다 몇 년 앞서 발표되므로, 표준의 존재는 길 건너 공장이 실제로 그것을 말하는지에 대해 거의 알려 주지 않습니다. 이 장이 발표된 배포 데이터를 찾을 수 없었던 곳은, 부재의 증거가 아니라 공개 근거에서 확인되지 않음으로 보고됩니다. 컨소시엄들은 진정으로 어려운 부분 — 거버넌스가 적용된 공유 어휘를 만들어 내는 일 — 을 해냈지만, 어느 컨소시엄도 그 사용을 강제할 수는 없습니다. 이미 존재하는 것에 산업 전체를 수렴시키는 일은 미완이며, 대체로 거버넌스가 불가능한 작업입니다.

왜 중요한가

앞선 장들이 "공유 표준"에 묶었던 모든 용어는, 실제로는 어떤 컨소시엄의 의도적이고 거버넌스가 적용된 노동입니다. 누가 어느 조각을 소유하는지 아는 것은 사소한 잡지식이 아닙니다 — 그것은 공장이 어휘를 가져오는 것과 어휘를 재발명하는 것 사이의 차이입니다. 그것은 당신만의 분석 용어를 쓰는 대신 AFO를 재사용할 곳이 어디인지, IDMP-O가 bp:DS-001 뒤의 물질 정체성을 이미 인코딩하고 있는 곳이 어디인지, 그리고 — 마찬가지로 중요하게 — 솔직히 아직 가져올 표준이 없어서 빈 땅 위에 짓고 있는 곳이 어디인지를 알려 줍니다. 이 책을 관통하는 줄기는 기록을 압박 속에서 추론할 수 있는 지식으로 바꾸는 것입니다. 그 지식은 이 기관들이 유지하는 어휘만큼만 공유 가능합니다.

실제 현장에서는

단지 발표된 것이 아니라 실제로 배포된 것을 기준으로 정렬하면 지도는 더 좁아집니다 — 그리고 그 채택 현실을 한곳에 모아 두는 것이 가치 있습니다. Allotrope Foundation Ontology는 이 영역에서 산업적으로 가장 널리 채택된 형식 온톨로지 노력으로, 아홉 곳의 제약 Foundation Member와 벤더 Partner Network가 떠받칩니다 [1]. GS1과 EPCIS는 명백히 상용 단계에 있으며 이제는 법적으로도 핵심 역할을 합니다. 미국 DSCSA 제조사 단속은 2025년 5월 27일에 시작되었고 EU 위조의약품지침(Falsified Medicines Directive)은 2019년 2월 9일부터 시행 중입니다 — bp:DP-001 로트의 GTIN과 DataMatrix가 올라타는 일련화 계층입니다 [11]. B2MML은 사실상의 MES 교환 계층이지만, 그 근거는 발표된 채택 데이터가 아니라 시스템 통합업체의 주장입니다 — 실재하되 그 단서를 달아 읽어야 합니다 [6]. 프레임워크들은 진짜이지만 그 최상위 단계는 여전히 지향에 머뭅니다. BioPhorum이 자주 인용하는 "회원의 약 80%가 DPMM을 사용한다"는 V3 이전 도구로 거슬러 올라가므로, 현재 측정치가 아니라 과거의 자가보고 근거이고 [10], MTP에서 제약이 보이는 가장 큰 관심은 의지의 신호이지 광범위한 상용 사용의 신호가 아닙니다 [8]. 그리고 이 책과 가장 이어지는 작업 — 실행 예제의 bp:BATCH-2026-001과 그 공정 단계가 이제 묶이는 OAGi/NIIMBL IOF 바이오파마 온톨로지 — 은 발행되고 Released되었지만 여전히 그것에 의존하는 상용 환경의 공장을 원합니다 [12]. 일관된 형태는 이렇습니다. 어휘는 도입보다 몇 년 앞서 도착하며, 발표된 표준은 길 건너 공장이 실제로 그것을 말하는지에 대해 거의 알려 주지 않습니다.

핵심 용어

  • 비경쟁 컨소시엄(pre-competitive consortium) — 회원들이 다른 곳에서 경쟁할 수 있도록, 공유되고 차별화되지 않는 자산(어휘, 형식, 식별자)에 노력을 모으는 경쟁사들의 동맹.
  • 형식 온톨로지 대 구조화된 정보 모델(formal ontology vs. structured information model) — 전자는 추론기가 그 위에서 작동할 수 있는 OWL/RDF 산물이고, 후자는 XML 스키마처럼 형식 논리 의미론 없이 데이터를 조직한다.
  • Allotrope Foundation — AFO, ADM, 그리고 ADF 데이터 컨테이너 뒤의 컨소시엄; 실험실 데이터를 위한 가장 산업적으로 널리 채택된 형식 온톨로지 노력 (상용 단계).
  • Pistoia Alliance — 핵심 비경쟁 제약 컨소시엄; IDMP-O, UDM, Methods Hub, PGO, CMC Process Ontology의 본거지.
  • B2MML — MESA International의 무료 XML 및 JSON 구현으로 ISA-95 정보 모델을 구현한 것; 통합업체 근거에 기대어 사실상의 제약 MES 교환 계층으로 널리 주장됨.
  • OPC 10030 — ISA-95 공통 객체 모델을 실시간 설비 데이터에 매핑하는 OPC UA 동반 명세.
  • Module Type Package (MTP) — VDI/VDE/NAMUR 2658, 플러그 앤 프로듀스 모듈형 자동화를 위한 OPC UA 및 AutomationML 패키지로, 이제 PI가 거버넌스를 맡고 IEC 63280으로 국제화되고 있다.
  • Digital Plant Maturity Model (DPMM) — 공장을 종이 기반에서 자기 최적화 자율 운영까지 평가하는 BioPhorum의 5단계 프레임워크.
  • GS1과 EPCIS — 산업이 DSCSA와 FMD 일련화 의무를 충족하기 위해 선택한 식별 및 이벤트 교환 표준(GTIN, GLN, DataMatrix, EPCIS).

다음 이야기

우리는 만드는 주체를 지도로 그렸습니다. 다음으로 우리는 그들의 산물을 펼쳐 봅니다. 다음 장 실제로 쓰이는 어휘: AFO에서 IDMP까지는 컨소시엄에서 산물 그 자체로 내려갑니다 — AFO가 분석 결과에 대해 실제로 무엇을 말하는지, IDMP-O가 물질을 어떻게 구조화하는지, 그리고 이 어휘들이 이 책 전반에서 모델링해 온 바로 그 배치, 풀, 의약품에 어떻게 부착되는지를 다룹니다.