본문으로 건너뛰기

연결성과 상호운용성 표준

📍 현재 위치: 지난 장에서는 참조 아키텍처로 시스템들을 정리했다면, 이번 장에서는 데이터가 실제로 그 시스템들 사이를 오갈 수 있도록 공통의 언어를 부여합니다.

지난 장에서는 ISA-95 / 퍼듀(Purdue) 계층 구조를 사용해 공장을 여러 계층으로 쌓아 올렸습니다. 맨 아래에는 센서가, 맨 위에는 전사 시스템이 있었죠. 그리고 운영 기술(operational technology, OT)과 정보 기술(information technology, IT)이 에지에서 클라우드로 이어지는 경로를 따라 어떻게 수렴하고 있는지 살펴보았습니다. 하지만 깔끔하게 정리된 계층 다이어그램 그 자체만으로는 데이터가 흐르지 않습니다. 생물반응기(bioreactor)의 제어기, 크로마토그래피 스키드(skid), 실험실 분광계(spectrometer), 그리고 공장의 제조 시스템이 그 다이어그램 위에 완벽하게 배치되어 있어도 숫자 하나조차 주고받지 못할 수 있습니다. 각각이 자기만의 사적인 방언을 쓰도록 만들어졌기 때문입니다. 이번 장은 이들이 서로 대화할 수 있게 해 주는 합의 — 즉 표준(standards) — 에 관한 이야기입니다.

쉽게 말하면

모든 의사, 간호사, 기계가 서로 다른 언어를 쓰는 거대한 병원을 떠올려 보세요. 사람 한 쌍마다 통역사를 한 명씩 고용할 수도 있겠지만, 100명이라면 통역사가 수천 명이 필요하고, 새 간호사 한 명을 들이면 100명을 더 고용해야 합니다. 더 똑똑한 해법은 모두가 배우는 하나의 공통 언어를 정하는 것입니다. 연결성 표준은 기계들을 위한 바로 그 공통 언어입니다. 함정은 이것입니다. 같은 언어를 말한다는 것이 서로를 이해한다는 것과 같지는 않다는 점이고, 바로 그 간극이 이번 장 끝부분의 핵심입니다.

이번 장에서 다루는 내용

우리는 데이터를 공장 현장에서 위쪽으로 따라갑니다. 먼저 공정(process) 장비를 연결하는 표준(OPC UA와 MTP), 그다음 실험실(laboratory)(SiLA 2, AnIML, Allotrope), 이어서 비즈니스(business) 계층(ISA-95 / B2MML), 그리고 마지막으로 이 모든 것이 드러내는 구분 — 바이트를 옮기는 것과 의미를 보존하는 것의 차이 — 을 살펴봅니다.

점대점 통합이 무너지는 이유

시스템을 연결하는 단순한 방법은 점대점(point-to-point) 방식입니다. 대화가 필요한 한 쌍마다 맞춤형 소프트웨어 — 즉 인터페이스(interface) — 를 작성하는 것이죠. 시스템 두 개에는 인터페이스 하나가 필요합니다. 하지만 가능한 쌍의 수는 대략 시스템 수의 제곱에 비례해 늘어나므로, 시스템 열 개에는 최대 마흔다섯 개의 인터페이스가, 스무 개에는 백구십 개가 필요할 수 있습니다. 엔지니어들은 이것을 **n² 문제(n² problem)**라고 부릅니다. 연결 비용이 공장이 커지는 속도보다 더 빠르게 폭발한다는 뜻입니다. 더 나쁜 것은, 각 인터페이스가 독점적이고 취약하다는 점입니다. 장비 하나만 바꿔도 그것에 닿아 있는 모든 인터페이스가 깨집니다.

같은 네 개의 시스템을 두 가지 방식으로 연결한 모습: 맞춤형 연결이 뒤엉킨 형태와 하나의 공통 표준을 쓰는 형태. 저자 작성 도해.

전송 표준이 하위 계층에서 바이트를 실어 나르고, 의미 표준이 상위 계층에서 의미를 보존하는 모습을 보여 주는 계층 다이어그램 각 연결성 표준이 자리하는 곳: 전송 표준은 바이트를 옮기고, 의미 표준은 뜻을 보존합니다. 저자 원본 도해(AI 보조로 제작).

공통 표준은 그 엉킴을 시스템당 단 하나의 연결로 줄여 줍니다. 이것이 표준의 경제적 논거 전체입니다. 표준은 이차(quadratic) 문제를 일차(linear) 문제로 바꿔 줍니다.

공정 연결하기: OPC UA와 MTP

공정 장비를 연결하는 지배적인 표준은 OPC UA — OPC Unified Architecture로, 국제 표준 IEC 62541로 발행되었습니다 [1]. ("OPC"는 원래 OLE for Process Control을 뜻했지만, 현대의 표준은 그 약어를 넘어설 만큼 성장했습니다.) 지멘스(Siemens), ABB, 로크웰 오토메이션(Rockwell Automation) 같은 벤더들은 OPC UA가 내장된 산업용 제어 시스템을 출하하며, 자토리우스(Sartorius)와 에펜도르프(Eppendorf) 같은 바이오공정 장비 제조사들은 OPC UA 드라이버가 탑재된 생물반응기와 크로마토그래피 스키드를 출하합니다. 이 표준의 핵심 발상은 단순히 원시 숫자를 실어 나르는 것 이상을 한다는 데 있습니다. OPC UA는 **정보 모델(information model)**을 담아 운반합니다. 값 37.0 옆에, 이것이 온도이고 섭씨 단위로 측정되었으며 생물반응기 BR-101에 속하고 타임스탬프와 품질 플래그를 지닌다는 정보를 함께 싣는 것입니다. 이렇게 구조화되고 자기 기술적인 객체 공간을 **주소 공간(address space)**이라고 부릅니다 [1]. 그 주소 공간 안의 한 노드는 예컨대 ServerName/Bioreactor/BR101/Temperature/Value로 주소가 지정될 수 있으며, 단위(°C), 타임스탬프(2026-06-13T14:23:07.123Z), 그리고 품질 플래그(Good, Uncertain, 또는 Bad)에 대한 속성을 함께 담습니다. 수신 시스템은 각 숫자가 무슨 뜻인지 미리 들을 필요가 없습니다. 데이터가 스스로를 설명하기 때문입니다.

OPC UA는 플랫폼 중립적이며 안전한 공장 네트워크를 위해 설계되었습니다. 이러한 강점 때문에 비교 공학 연구들은 이를 이른바 인더스트리 4.0(Industry 4.0, 디지털화되고 네트워크로 연결된 제조로의 전환)의 기준 연결성 프로토콜로 벤치마킹하며, MQTT 같은 더 가벼운 메시징 프로토콜과 견주어 그 성능을 시험합니다 [9]. 그러한 보안성과 자기 기술성은 규제 측면의 이점도 함께 가져옵니다. FDA 데이터 무결성 지침과 EU Annex 11에 따라 시스템 사이에 전송되는 데이터는 귀속 가능(attributable)하고 변조되지 않은 상태를 유지해야 하는데, OPC UA의 구조화된 주소 공간과 내장 보안은 그 관리 연속성(chain of custody)을 전자적으로 보존하는 데 도움을 줍니다.

참고

*플러그 앤 프로듀스(plug-and-produce)*라는 표현은 *플러그 앤 플레이(plug-and-play)*의 공장 버전입니다. 새 장비를 연결하면 손으로 작성한 통합 작업을 거의 하지 않고도 작동하는 것이죠. 표준이 바로 이것을 가능하게 합니다.

OPC UA는 기계들이 어떻게 대화하는지를 해결합니다. 두 번째 표준은 생산 모듈(module) 전체를 어떻게 기술해 블록을 쌓듯 조립할 수 있게 할지를 다룹니다. 바로 VDI/VDE/NAMUR 2658에 정의된 **모듈 타입 패키지(Module Type Package, MTP)**입니다 [2]. 표준에 따르면, 그러한 통합을 위해 설계된 모듈 — 예를 들어 자기 완결형 여과 스키드 — 은 MTP와 함께 출하됩니다. MTP는 그 모듈의 인터페이스, 서비스, 그리고 운영자 인터페이스(HMI)에 대한 기술을 담은 벤더 중립적 디지털 명세서입니다. 공장의 제어 시스템은 MTP를 읽어 그 모듈을 자동으로 통합하며, OPC UA를 통해 통신합니다 [2]. 이것이 **모듈형 플러그 앤 프로듀스(modular plug-and-produce)**입니다. 모든 것을 다시 엔지니어링하는 대신, 제조사가 교체 가능한 단위들로 생산 라인을 재구성할 수 있게 해 주죠. 바로 집약화되고 일회용(single-use) 방식인 바이오공정이 요구하는 그 유연성입니다. 자토리우스(Sartorius)와 폴(Pall)을 비롯한 장비 제조사들은 최근 몇 년 사이 크로마토그래피, 완충액 조제, 여과 같은 단계를 위한 MTP 호환 스키드를 출시했습니다.

실험실 연결하기: SiLA 2, AnIML, Allotrope

실험실은 자체적인 연결성 전통을 가지고 있습니다. 장비가 공정 장비보다도 훨씬 더 다양하기 때문입니다. 가장 중요한 표준은 세 가지입니다.

SiLA 2장치 통합(device integration) — 실험 장비를 어떻게 제어하고 그 값을 읽어 내는지 — 를 표준화합니다 [3]. 이 표준은 서비스 지향(service-oriented) 설계를 사용합니다. 각 장비가 자신의 기능을 네트워크 서비스로 노출하고(작고 독립적인 단위들이 각각 하나의 일을 맡는 마이크로서비스(microservice) 방식), 그 기능들이 기계가 읽을 수 있는 **기능 정의 언어(Feature Definition Language)**로 기술되어, 소프트웨어가 맞춤형 드라이버 없이도 장비가 무엇을 할 수 있는지 발견할 수 있게 합니다 [3]. 테칸(Tecan)과 해밀턴(Hamilton) 같은 실험실 자동화 벤더들은 자사 장비와 플랫폼에서 SiLA 2 지원을 진전시키고 있는 곳들에 속합니다. SiLA 2는 장비에 명령을 내리는 일을 관장합니다.

지금까지의 표준은 시스템들이 어떻게 대화하는지를 관장합니다. 하지만 장비가 만들어 내는 데이터 — 실제 숫자, 스펙트럼, 결과 — 에는 그 자체의 표준이 필요합니다. AnIML — Analytical Information Markup Language, ASTM(소위원회 E13.15)에서 개발한 개방형 XML 형식 — 은 초기의 토대가 된 노력이었으며, 안정적인 *코어(core)*에 측정 유형별로 끼워 넣을 수 있는 *기법 정의(technique definitions)*를 더한 구조로 되어 있습니다. 덕분에 서로 다른 방법에서 나온 결과들이 완전한 데이터 무결성(data integrity) 맥락을 갖춘 하나의 컨테이너를 공유하게 됩니다 [5]. 핵심은 모든 측정값이 파일 안에 자기 자신의 맥락을 함께 지닌다는 점입니다. 간소화한 AnIML 형식의 기록을 보면 이것이 구체적으로 와닿습니다.

<Result name="pH Measurement">
<SeriesSet>
<Series name="pH" dependency="dependent">
<IndividualValueSet>
<F>7.20</F>
</IndividualValueSet>
<Unit label="pH" />
</Series>
</SeriesSet>
<Method name="SOP-PH-001 pH Determination" />
<Instrument id="PH-METER-07" />
<Timestamp>2026-06-13T14:23:07.123Z</Timestamp>
</Result>

값, 그 단위, 그 값을 만들어 낸 방법, 장비, 그리고 측정 시각이 모두 함께 이동합니다. AnIML은 더 오래된 ASTM 분석 데이터 교환 규격들 — ANDI/NetCDF 분석 데이터 프로토콜로, 그 질량분석(mass-spectrometry) 쌍이 ASTM E2077 명세(specification)와 ASTM E2078 가이드(guide)입니다 — 에서 발전했습니다 [6].

가장 활발한 현대의 노력은 **앨로트로프 재단(Allotrope Foundation)**의 스택입니다. 이 스택은 앨로트로프 데이터 형식(Allotrope Data Format, ADF) — 원시 숫자와 맥락, 그리고 기술을 한데 담은 단일 파일 — 을 앨로트로프 단순 모델(Allotrope Simple Model, ASM) 및 일련의 온톨로지(ontologies) — 이름뿐 아니라 각 용어의 정의된 관계와 의미까지 고정하는 형식적이고 기계가 읽을 수 있는 어휘 체계, 곧 AFO(Allotrope Foundation Ontologies로 알려짐) — 와 짝지웁니다 [4]. 로슈(Roche) 같은 회원사와 애질런트(Agilent), 시마즈(Shimadzu) 같은 장비 제조사들이 이 재단을 통해 이러한 온톨로지에 기여하고 있습니다. 목표는 벤더에 구애받지 않는(vendor-agnostic) 분석 데이터입니다. 어느 회사의 장비가 그 결과를 만들어 냈든 같은 의미를 갖는 결과 말입니다 [4].

주의

실험실 정보 시스템을 위한 표준은 이들과는 별개입니다. ASTM E1578(실험실 정보학(laboratory informatics)을 위한 표준 가이드)은 실험실 정보 관리 시스템(LIMS)과 그에 관련된 실험실 소프트웨어 시스템(LES, ELN, SDMS, CDS) — 시료와 시험을 추적하는 소프트웨어 — 을 포괄하며, 통신 형식(wire format)이 아니라 공통 용어와 모범 사례를 제공합니다. 어떤 표준이 어떤 계층을 관장하는지 아는 것만으로도 상당한 혼란을 막을 수 있습니다.

비즈니스 연결하기: ISA-95와 B2MML

더 위로 올라가면, 공장의 MES(제조실행시스템 — 실제 생산을 운영하는 소프트웨어)가 ERP(전사적 자원 관리 — 주문, 재고, 재무를 위한 비즈니스 소프트웨어)와 정보를 주고받아야 합니다. 여기서의 합의가 바로 ISA-95이며, 국제적으로는 IEC 62264로 표준화되어 있습니다 [7]. ISA-95는 지난 장에서 계층 구조를 정리하는 데 사용한 바로 그 표준입니다. 여기서는 그 객체 모델(object models)생산 주문(production order), 자재 로트(material lot), *배치 기록(batch record)*에 대한 형식적 정의 — 을 사용합니다 [7].

이 객체들을 시스템 사이에 보내기 위해, 업계는 B2MML(Business To Manufacturing Markup Language)을 사용합니다. 이는 ERP/MES 데이터를 양방향으로 교환하기 위한 ISA-95 객체 모델의 XML 구현입니다 [7]. 비즈니스 시스템이 "제품 X 바이알 500개를 만들라"는 지시를 내리면, B2MML은 그 지시를 공장으로 내려보내고 결과를 다시 위로 보고하는 데 쓰이는 구조화된 메시지 형식입니다. 규제 대상 공장에서 이러한 전자 메시지는 진공 속에서 오갈 수 없습니다. 그러한 교환이 GMP 전자 기록을 생성하거나 변경하는 경우 21 CFR Part 11과 EU Annex 11은 변조 흔적이 남는(tamper-evident) 감사 추적(audit trail)을, 그리고 전자적으로 승인되는 기록에는 유효한 전자 서명(electronic signature)을 기대합니다. 그래서 연결성 계층과 규정 준수 계층은 함께 설계됩니다.

구문적 상호운용성과 의미적 상호운용성

지금까지의 모든 표준은 한 문제의 일부를 풀면서 더 깊은 문제를 드러냅니다. 상호운용성(interoperability) — 시스템들이 함께 작동하는 능력 — 에는 서로 다른 두 종류가 있습니다.

**구문적 상호운용성(syntactic interoperability)**은 시스템들이 *형식(format)*에 합의한다는 뜻입니다. 메시지가 파싱되고, 필드가 맞아떨어지며, 바이트가 온전히 도착하는 것이죠. **의미적 상호운용성(semantic interoperability)**은 시스템들이 *의미(meaning)*에 합의한다는 뜻입니다. 값이 같은 척도와 같은 단위로 표현된다는 것 [8], 그리고 한 시스템의 pH와 다른 시스템의 acidity가 같은 조건에서 동일한 물리량을 가리킨다는 것을 양쪽 모두가 합의하는 것입니다. 구문은 바이트를 옮기고, 의미는 뜻을 보존합니다.

이것은 말꼬리 잡기가 아닙니다. 두 장비가 모두 유효한 XML — 완벽한 구문 — 을 내보내면서도 같은 측정값에 서로 다른 이름표를 붙이거나 서로 다른 단위로 보고할 수 있고, 그러면 소프트웨어는 결코 합쳐서는 안 될 숫자들을 조용히 합쳐 버립니다. 한 분석기는 결과를 맨숫자 스칼라 7.2로 보고하는데, 다른 분석기는 이를 <pH units="pH_units" value="7.2"/>로 감싸는 경우를 떠올려 보세요. 두 데이터 피드를 병합하면서 단위 필드를 한 번도 확인하지 않는 프로그램은 서로 다른 스케일 팩터를 조용히 적용해, 어떤 오류도 표면에 드러나지 않은 채 병합된 데이터셋을 손상시킬 수 있습니다. 그 해법은 한 단계 더 깊은 곳에 있습니다. 바로 의미에 대한 기계가 읽을 수 있는 정의입니다. NIST의 UnitsML — AnIML 같은 형식 안에 모호하지 않은 측정 단위를 끼워 넣기 위한 마크업 — 은 그 의미 계층을 공급하는 구체적인 사례이며 [8], Allotrope 같은 표준이 온톨로지에 그토록 많은 투자를 하는 이유가 바로 이것입니다 [4].

왜 중요한가

데이터 관리에서 얻는 교훈은 연결성은 필요하지만 충분하지는 않다는 것입니다. OPC UA, MTP, SiLA 2, AnIML, Allotrope, B2MML을 도입하면 n² 문제를 푼 셈입니다. 이제 데이터가 공장과 실험실 전반에 걸쳐 저렴하고 안정적으로 흐릅니다. 하지만 흐르는 데이터가 신뢰할 수 있고 비교 가능한 데이터와 같지는 않습니다. 의미가 끝에서 끝까지 보존되지 않으면, 오해를 효율적으로 전달하는 빠른 파이프라인을 짓는 셈이 됩니다. 따라서 표준을 고르는 일은 두 부분으로 이루어진 결정입니다. 전송에 관한 선택(어떤 프로토콜을 쓸 것인가)과 의미에 관한 선택(어떤 의미의 어휘를 쓸 것인가)이며, 두 번째를 건너뛰는 것이 이 분야에서 가장 값비싼 실수입니다.

실제 산업 현장에서는

이 표준들은 이상에 머무는 것이 아니라, 실제로 가동되는 공장이 만들어지는 방식입니다. OPC UA는 새로운 공정 자동화의 기본 골격이고 [1][9], MTP 기반의 모듈형 단위는 주요 장비 벤더들이 출하하고 있으며 [2], SiLA 2와 Allotrope는 제약회사와 장비 제조사로 이루어진 산업 컨소시엄을 통해 발전하고 있습니다 [3][4]. 미국의 NIIMBL 연구소와 그 NIIMBL-NIST 실시간 실험 데이터 개념 증명(proof of concept)은 바로 이번 장이 드러낸 그 이음새에 존재합니다. 장비, 실험실, 협력 조직을 단순히 연결하는 데 그치지 않고 의미적으로 정렬하여, 한곳에서 측정된 숫자가 그것이 거쳐 가는 모든 곳에서 같은 뜻을 갖게 하는 것이죠. (인근에서는 NIIMBL의 SABRE 센터 — 파일럿 규모의 우수제조관리기준(cGMP, current Good Manufacturing Practice) 바이오제조 및 인력 양성 시설 — 가 이러한 진보된 바이오제조 방식을 규모 확대하고, 위험을 줄이며, 교육할 수 있는 터전을 마련해 주기 위해 개발되고 있습니다.) 그것이 이번 장에서 이 책의 제4부로 이어지는 다리입니다.

핵심 용어

  • 표준(standard) — 서로 다른 시스템이 같은 방식으로 데이터를 교환할 수 있게 해 주는, 발행되고 공유된 합의.
  • 점대점 통합(point-to-point integration) — 시스템을 쌍마다 하나의 맞춤형 인터페이스로 연결하는 방식; n² 문제를 겪는 구조.
  • n² 문제(n² problem) — 시스템이 늘어남에 따라 필요한 연결 수가 폭발하는 현상.
  • OPC UA (IEC 62541) — 지배적인 공정 연결성 표준으로, 단순한 원시 값이 아니라 자기 기술적인 정보 모델을 실어 나르는 표준.
  • 정보 모델 / 주소 공간(information model / address space) — OPC UA 내부에서 데이터를 구조화되고 자기 기술적으로 조직한 것.
  • 플러그 앤 프로듀스(plug-and-produce) — 손으로 작성하는 통합을 최소화하면서 장비를 추가할 수 있는 공장의 능력.
  • MTP (Module Type Package, VDI/VDE/NAMUR 2658) — 생산 모듈을 블록처럼 조립할 수 있게 해 주는 벤더 중립적 명세서.
  • SiLA 2 — 실험 장비를 통합하고 명령하기 위한 서비스 지향 표준.
  • AnIML — 분석 결과를 완전한 맥락과 함께 저장하기 위한, ASTM에서 개발한 개방형 XML 형식.
  • Allotrope (ADF / ASM / AFO) — 의미의 온톨로지를 포함해 벤더에 구애받지 않는 분석 데이터를 위한 현대적 스택.
  • ASTM E1578 — 실험실 정보학(laboratory informatics, LIMS 및 관련 시스템)을 위한 표준 가이드.
  • ISA-95 / IEC 62264 — 전사-제어 통합 표준과 그 객체 모델.
  • B2MML — ERP-MES 메시징을 양방향으로 하는 데 쓰이는 ISA-95의 XML 구현.
  • 구문적 상호운용성(syntactic interoperability) — 데이터 형식에 대한 합의.
  • 의미적 상호운용성(semantic interoperability) — 데이터 의미에 대한 합의.

이 다음은

표준은 데이터를 움직이게 하고, 올바른 의미 계층과 함께라면 데이터가 어디서나 같은 뜻을 갖게 합니다. 하지만 움직임과 의미만으로는 충분하지 않습니다. 흐르는 모든 숫자는 또한 신뢰할 수 있어야 합니다. 참임이 증명되고, 변조되지 않았으며, 누가 언제 기록했는지까지 추적할 수 있어야 하죠. 다음 장 데이터 무결성과 ALCOA+는 데이터를 믿을 수 있게 만드는 원칙들을 소개합니다. 귀속 가능(Attributable), 판독 가능(Legible), 동시 기록(Contemporaneous), 원본(Original), 정확(Accurate)에 더해 완전(Complete), 일관(Consistent), 영속(Enduring), 이용 가능(Available)까지, 그리고 감사 추적(audit trail)과 함께 업계 전체를 재편한 데이터 무결성 집행의 물결을 다룹니다.