용어집
📍 빠른 참고: 이 페이지는 스택 전체를 위한 휴대용 사전입니다. 책이 쌓아 올리는 모든 프로토콜, 계층, 규제를 담았습니다. 즐겨찾기 해 두고, 어떤 단어가 헷갈릴 때마다 언제든 다시 찾아오세요.
오픈소스 바이오공정 데이터 플랫폼을 구축하려면 세 가지 어휘 체계가 한꺼번에 끌려 들어옵니다. 즉 현장(plant-floor) 프로토콜, 데이터베이스 엔지니어링, 그리고 제약 규제입니다. 이 책에서 가장 중요한 용어들을 쉬운 말로 정리했고, 찾기 쉽도록 영어 단어 기준으로 알파벳 순서로 나열했습니다(EN 순서와 동일). 각 항목은 평이한 말로 된 출발점이며, 연결된 장에서 완전하고 정확한 설명을 볼 수 있습니다.
별칭(Alias, ISA-95 Part 7) — 같은 신호에 대한 서로 다른 두 이름이 동등함을 선언하는 방법으로, 한 시스템은 어떤 프로브를 계속 TT-101로 부르고 다른 시스템은 그것을 BR101.Temp.PV로 알 수 있게 해 줍니다. 정식 이름이 기록의 시스템(system of record)으로 남고, 나머지 이름들은 그것으로 해소(resolve)됩니다. (이름 붙이기와 통합 네임스페이스(UNS) 장 참조.)
ALCOA+ — 데이터를 신뢰할 수 있게 만드는 요건을 가리키는 규제기관의 약어로, 귀속 가능(Attributable), 판독 가능(Legible), 동시 기록(Contemporaneous), 원본(Original), 정확(Accurate)에 더해 완전(Complete), 일관(Consistent), 영속(Enduring), 가용(Available)을 뜻합니다. 책 전체가 향해 가는 거듭 등장하는 잣대입니다. (설계로 구현하는 ALCOA+ 장 참조.)
Annex 11(EU) — 규제 제조에 쓰이는 컴퓨터화 시스템에 대한 유럽연합의 규칙으로, 미국의 Part 11에 대응하는 유럽 측 규정이며, 곳에 따라 더 엄격합니다(예를 들어 모든 변경마다 문서화된 사유를 요구합니다). (전자기록과 전자서명 장 참조.)
적용 가능 영역(Applicability domain) — 모델이 학습된, 그리고 그 안에서 신뢰할 수 있는 입력 영역으로, 이 영역 밖의(또는 불확실하다고 표시된) 측정값에 대해서는 모델이 추측하기보다 점수 매기기를 거부해야 합니다. (공정 분석 장 참조.)
자산 프레임워크(Asset framework, AF) — 원시 히스토리안 태그를 장비·속성·단위의 계층구조로 정리하는, 벤더가 유지하는 계층으로, 알아보기 힘든 포인트 이름이 아니라 자산 단위로 데이터를 조회하게 해 줍니다. AVEVA PI의 AF가 상용 사례이고, 우리가 쓰는 두 개의 SQL 뷰가 그 오픈소스 대응물입니다. (상용 히스토리안 연동 장 참조.)
감사 추적(Audit trail) — 누가 어떤 데이터를 언제, 왜 바꿨는지를, 이전 값을 숨기지 않고 기록하는 안전하고 타임스탬프가 찍힌 추가 전용(append-only) 기록입니다. 여기서는 PostgreSQL 트리거가 audit.change_log 테이블을 자동으로 채웁니다. (설계로 구현하는 ALCOA+ 장 참조.)
배치/로트(Batch / Lot) — 제조를 한 번 돌린 단위로, 한 유닛에서 실행된 레시피이며 로트 번호, 상태, 시작/종료 시각을 갖습니다. 하나의 이력과 품질 기록을 공유하며 함께 만들어진 모든 것입니다. (배치·장비 데이터 모델 장 참조.)
컴피턴시 질문(Competency question) — 데이터 모델이나 온톨로지가 답할 수 있어야 하는 평이한 영어 질문으로, 합격/불합격 인수 시험으로 사용됩니다(예를 들어 "골든 배치의 용존산소는 페이즈별로 어땠는가?"). (의미론과 디지털 스레드 장 참조.)
맥락화(Contextualization) — 원시 센서 측정값을 그것이 속한 배치, 장비, ISA-88 페이즈, 레시피에 묶어 단순한 숫자를 공정 지식으로 바꾸는 결합(join)으로, 여기서는 하나의 SQL 뷰가 이를 수행합니다. (맥락화 장 참조.)
CSA(컴퓨터 소프트웨어 보증, Computer Software Assurance) — 무거운 밸리데이션을 대체하는, FDA의 위험 기반·최소 부담 후속 접근법으로, 환자와 데이터 위험에 비례해 보증 노력을 들이고 로그·공급업체 기록 같은 기존 증거에 기댑니다. (오픈소스 스택 밸리데이션 장 참조.)
데이터 거주성(Data residency) — 특정 데이터가 물리적으로 한 지역 안에 머물러야 한다는 요건으로, 여기서는 데이터베이스 행 수준 보안으로, 그리고 중국의 경우 별도의 역내 배포로 강제합니다. (국경을 넘는 데이터 장 참조.)
DCS(분산 제어 시스템, Distributed Control System) — ISA-95 레벨 1–2에서 공정 루프를 실시간으로 돌리는 밸리데이션된 제어 계층(Emerson DeltaV, Siemens)으로, 오픈소스 스택은 여기서 읽기만 하고 절대 쓰지 않습니다. (DCS·MES·ERP 연동 장 참조.)
데드밴드(Deadband) — 히스토리안이 새 포인트를 저장할 만큼 측정값이 보여야 하는 최소 변화량으로, 저장 용량 대 충실도의 절충이자 데이터 무결성에 관한 결정이기도 합니다. (이름 붙이기와 통합 네임스페이스(UNS) 장 참조.)
디지털 스레드(Digital thread) — 제품을 수명주기 전반에 걸쳐 추적하는, 연결된 기록들의 처음부터 끝까지의 사슬로, 여기서는 완제의약품에서 세포은행까지 거슬러 올라가는 계보(genealogy)입니다. (의미론과 디지털 스레드 장 참조.)
엣지 게이트웨이(Edge gateway) — OT/IT 이음매에 있는 장치 또는 소프트웨어로, 현장 프로토콜을 읽고 데이터를 변환·버퍼링하여 제어 루프를 건드리지 않고 위로 라우팅합니다. (엣지 게이트웨이 장 참조.)
ERP(전사적 자원 관리, Enterprise Resource Planning) — 자재, 로트, 작업 지시를 소유하는 레벨 4 비즈니스 시스템(SAP)으로, 이 책이 구축하는 모든 것의 위, ISA-95 사다리의 꼭대기입니다. (DCS·MES·ERP 연동 장 참조.)
ETL(추출-변환-적재, Extract-Transform-Load) — 별개의 두 제품 사이에서 데이터를 복사하고 조정하는 예약된 파이프라인으로, 히스토리안과 배치 모델을 하나의 조인 가능한 데이터베이스에 두어 이 스택이 피하는 취약한 대안입니다. (레퍼런스 아키텍처 장 참조.)
골든 배치(Golden batch) — 기준이 되는 운전으로, 여기서는 BATCH-2026-001이며, 새 배치를 그 궤적과 비교합니다. 책은 모든 것을 이것에 견주어 트렌딩합니다(의도적인 규격 이탈 반례로는 BATCH-2026-004를 둡니다). (배치·장비 데이터 모델 장 참조.)
GAMP 5 — 컴퓨터화 시스템을 밸리데이션하기 위한 업계의 위험 기반 프레임워크로, 소프트웨어 카테고리가 1(인프라)부터 5(직접 작성한 맞춤 코드)까지 이어지며, 노력은 카테고리에 따라 비례해 커집니다. (오픈소스 스택 밸리데이션 장 참조.)
GxP — 규제기관이 점검할 수 있는 모든 기록을 규율하는 "Good x Practice" 품질 규제, 즉 우수 제조·실험실·임상 관리(Good Manufacturing, Laboratory, Clinical Practice)를 아우르는 상위 용어입니다. (설계로 구현하는 ALCOA+ 장 참조.)
우수의약품제조관리기준(GMP / cGMP) — 의약품을 안전하고 일관되게 만들기 위해 법으로 요구되는 규칙으로, "c"는 현행(current)을 뜻합니다. (배치·장비 데이터 모델 장 참조.)
Grafana — 스택의 데이터를 트렌딩하고 알림을 거는 데 쓰는 오픈소스 대시보드 도구로, 대시보드·데이터 소스·알림 규칙을 버전 관리되는 파일로 정의합니다. 그래서 하나의 트렌드는 저장된 그림이 아니라 재현 가능한 질문이 됩니다. (Grafana 시각화와 트렌딩 장 참조.)
해시 체인(Hash chain) — 각 감사 행이 직전 행의 해시로부터 만든 SHA-256 해시를 저장하는 감사 행들의 연쇄로, 삭제·재정렬·재연결된 항목을 감지할 수 있게 합니다. 변조를 불가능하게 만드는 것이 아니라 드러나게 만듭니다. (설계로 구현하는 ALCOA+ 장 참조.)
고가용성(High availability, HA) — 단일 구성요소 장애를 서비스 중단 없이 견디는 설계로, 보통 자동으로 인계받는 이중화 대기 노드를 통해 이뤄집니다. TimescaleDB의 내장 HA는 라이선스 기능이라, 여기 단일 노드 스택은 그것 없이 갑니다. (운영·확장·보안 장 참조.)
히스토리안(Historian) — 고속·타임스탬프 공정 신호를 저장하고 제공하는 데 특화된 데이터베이스로, 상용 AVEVA/OSIsoft PI 시스템의 오픈소스 대응물입니다. (오픈소스 히스토리안 장 참조.)
정직한 하이브리드(Honest hybrid) — 이 책의 핵심 입장으로, 순수 오픈소스는 스택의 대략 첫 80%를 깔끔하게 커버하는 반면, 규제가 걸린 마지막 구간(밸리데이션, 전자서명, 고가용성, 벤더 책임)은 강화(hardening)나 상용 시스템으로 충족합니다. (정직한 결론 장 참조.)
하이퍼테이블(Hypertable) — 하나의 평범한 테이블처럼 동작하지만 시간 기준으로 청크(chunk)로 자동 분할되는 TimescaleDB 테이블로, PostgreSQL 안에 살면서도 고속 센서 데이터가 대규모에서도 빠르게 유지됩니다. (레퍼런스 아키텍처 장 참조.)
ISA-88 — 배치가 어떻게 만들어지는지를, 그것이 돌아가는 장비와 분리해 정의하는 배치 절차(procedural) 표준입니다(레시피 → 오퍼레이션 → 페이즈). (배치·장비 데이터 모델 장 참조.)
ISA-95(IEC 62264) — 전사 시스템과 제어 시스템을 통합하기 위한 표준 계층 모델(레벨 0–4)로, 각 도구를 정당한 레벨에 두고 그 사이의 경계를 긋는 데 씁니다. (레퍼런스 아키텍처 장 참조.)
IQ / OQ / PQ — 설치·운전·성능 적격성평가(Installation, Operational, Performance Qualification)로, 시스템이 제대로 설치되고, 제대로 운전되며, 실제 작업을 시간에 걸쳐 제대로 수행함을 세 단계로 문서화한 증거입니다. (오픈소스 스택 밸리데이션 장 참조.)
지식그래프(Knowledge graph) — 배치, 장비, 자재, 레시피, 결과를 하나의 탐색 가능한 전체로 잇는 RDF 트리플의 망으로, 계보를 손으로 재구성하는 대신 시스템을 가로질러 질의할 수 있게 합니다. (의미론과 디지털 스레드 장 참조.)
LIMS(실험실 정보 관리 시스템, Laboratory Information Management System) — 시료 중심 소프트웨어로, 시료를 등록하고 시험을 예약하며 규격에 대비해 결과를 수집하고 출하 결정을 이끕니다. 여기서는 SENAITE입니다. (분석 실험실 장 참조.)
MES(제조 실행 시스템, Manufacturing Execution System) — 레시피를 실행하고, 전자서명을 수집하며, 전자 배치 기록(electronic batch record)을 만드는 레벨 3 소프트웨어로, 신뢰할 만한 오픈소스 GxP 선택지가 없어 이 자리는 상용으로 남습니다. (DCS·MES·ERP 연동 장 참조.)
Modbus — 함수 코드와 16비트 레지스터를 쓰는 단순한 1979년 요청/응답 프로토콜로, 내장 인증이나 암호화가 없습니다. 레거시 스키드, 저울, 펌프에 여전히 흔합니다. (레거시·상용 스키드 연결 장 참조.)
MQTT — 장치가 이름 붙은 토픽에 게시하면 브로커가 메시지를 구독자 모두에게 펼쳐 보내는 경량 발행/구독(publish/subscribe) 메시징 프로토콜로, 이 책이 올라타는 OT 측 전송 수단입니다. (OT의 언어 장 참조.)
NAMUR 개방형 아키텍처(NOA, NAMUR Open Architecture) — 밸리데이션된 제어 시스템을 바꾸지 않고 공정 데이터를 끌어오는, 모니터링·최적화용의 읽기 위주 두 번째 데이터 채널이라는 개념으로, "우리는 DCS에 절대 쓰지 않는다"를 축복하는 표준입니다. (레퍼런스 아키텍처 장 참조.)
Node-RED — 브라우저 기반의 로우코드 플로우 편집기(플로우는 JSON으로 저장되고 Node.js 위에서 실행)로, 엣지 데이터 라우팅을 배선하고 프로토타이핑하는 데 씁니다. (엣지 게이트웨이 장 참조.)
OPC UA — 플랫폼 독립적이고 자기 기술적인 프로토콜(IEC 62541)로, 각 값에 더해 그 데이터 타입, 공학 단위, 타임스탬프, 품질 플래그를 센서에서 애플리케이션까지 실어 나릅니다. 클라이언트는 한 번도 본 적 없는 서버도 탐색(browse)할 수 있습니다. (OT의 언어 장 참조.)
OT / IT — 운영 기술(Operational Technology, 고립된 제어 네트워크 위의 컨트롤러·스키드·센서) 대 정보 기술(Information Technology, 그 위의 데이터베이스·대시보드·분석)로, 엣지 게이트웨이가 걸치는 이음매입니다. (엣지 게이트웨이 장 참조.)
PAT(공정분석기술, Process Analytical Technology) — 공정이 진행되는 동안 품질 결정을 내리는 데 쓰는 실시간 인프로세스 측정(예를 들어 인라인 라만 분석기)입니다. (공정 분석 장 참조.)
페이즈(Phase) — ISA-88 배치에서 가장 작은 절차 단계(성장, 포획, 용출 등)로, 맥락화 뷰가 각 측정값을 묶어 가두는 단위입니다. (배치·장비 데이터 모델 장 참조.)
PLC(프로그래머블 로직 컨트롤러, Programmable Logic Controller) — 단일 공정 장비 한 대를 구동하는 견고화된 산업용 컴퓨터로, Modbus나 Siemens S7로 읽는 장치입니다. (레거시·상용 스키드 연결 장 참조.)
PLS(부분 최소제곱, Partial Least Squares) — 스펙트럼처럼 폭이 넓고 상관이 강한 데이터에 쓰는 회귀 방법으로, 역가 소프트 센서 뒤에서 일하는 일꾼입니다. (공정 분석 장 참조.)
공정 드리프트 대 모델 드리프트(Process drift vs. model drift) — 공정 드리프트는 살아 있는 배양이 배치마다 진짜로 떠도는 것(보존해야 할 실제 신호)이고, 모델 드리프트는 배포된 예측기가 그 움직이는 공정에 대해 낡아 가는 것(감지해야 할 결함)입니다. 둘을 뒤섞으면 모니터가 헛경보를 울리거나 진짜 변화를 놓칩니다. (공정 분석 장 참조.)
프로테인 A 포획(Protein A capture) — 항체를 그 Fc 줄기로 선택적으로 붙잡아 단일 크로마토그래피 단계에서 높은 순도를 내는 플랫폼 친화성(affinity) 단계로, 여기서는 스키드 PA01에서 돌아갑니다. (다운스트림 수집 장 참조.)
품질 플래그(Quality flag) — 모든 값과 함께 실려 오는 측정값별 신뢰 코드로, 히스토리안은 간결한 레거시 OPC DA 인코딩(192 Good, 64 Uncertain, 0 Bad)을 저장하는 반면 OPC UA의 네이티브 Good은 단순히 0입니다. 이를 보존하는 것은 ALCOA+의 "원본(Original)" 속성을 하나의 컬럼으로 만든 것입니다. (레퍼런스 아키텍처 장 참조.)
QUDT 단위 IRI(QUDT unit IRI) — 측정 단위에 대한 전역 식별자(예를 들어 .../unit/DEG_C)로, 값의 단위를 기계가 읽을 수 있게 고정해 "37"이 결코 모호하지 않게 하고 그래프가 시스템을 가로질러 추론할 수 있게 합니다. (이름 붙이기와 통합 네임스페이스(UNS) 장 참조.)
RDF 트리플(RDF triple) — 하나의 주어-술어-목적어 사실로, 지식그래프의 원자입니다. 맥락화된 측정값 하나가 그 태그, 단위, 품질, 배치가 명시적 사실이 되었을 때 취하는 형태입니다. (의미론과 디지털 스레드 장 참조.)
레퍼런스 아키텍처(Reference architecture) — 각 계층이 아래의 데이터를 받아 한 종류의 의미를 더해 위로 넘기는, 플랫폼 전체의 계층형 청사진으로, 이후의 모든 장이 그 위의 얇은 한 조각입니다. (레퍼런스 아키텍처 장 참조.)
행 수준 보안(Row-level security, RLS) — 모든 질의를 세션 컨텍스트로 필터링하는 PostgreSQL 기능으로, 여기서는 데이터 거주성을 강제해 기록이 자기 지역 안에서만 읽히거나 쓰이게 합니다. (국경을 넘는 데이터 장 참조.)
SBOM(소프트웨어 자재 명세서, Software Bill of Materials) — 스택 안의 모든 구성요소, 버전, 출처, 라이선스를 담은 기계 판독 가능한 목록으로, 오픈소스 운영자에게 "벤더에 전화하라"의 대체물이자 새로운 취약점을 살피는 토대입니다. (정직한 결론 장 참조.)
SHACL(형상 제약 언어, Shapes Constraint Language) — RDF 그래프를 요구되는 구조에 대비해 검증하는 W3C 표준으로, 닫힌 세계(closed-world)이기 때문에 빠진 필수 사실은 열린 질문이 아니라 지금 당장의 실패입니다. 데이터베이스 NOT NULL의 그래프 측 거울입니다. (의미론과 디지털 스레드 장 참조.)
Siemens S7 — Siemens의 독자 PLC 프로토콜 스택으로, 설계상 안전하지 않으며 여기서는 snap7 같은 오픈 라이브러리를 써서 중첩된 TPKT/COTP/S7comm 계층으로 읽습니다. (레거시·상용 스키드 연결 장 참조.)
스키드(Skid) — 펌프, 밸브, 센서, 컨트롤러를 한 프레임에 올린 패키지형 공정 유닛으로, 크로마토그래피 스키드나 TFF 스키드처럼 하나의 기계로 납품·적격성평가되며 보통 OPC UA 서버가 앞단을 맡습니다. (업스트림 수집 장 참조.)
소프트 센서(가상 센서, Soft sensor) — 역가처럼 재기 어려운 양을 라만 스펙트럼 같은 재기 쉬운 입력으로부터 추론하는 모델입니다. (공정 분석 장 참조.)
Sparkplug B — MQTT 위에 토픽 구조를 다섯 레벨로 고정하고 birth/death 세션 상태를 더한, 견해가 분명한(opinionated) 프로파일로, 소비자가 장치가 살아 있는지와 무엇을 보고하는지를 항상 알 수 있게 합니다. 와이어 위 통합 네임스페이스의 토대입니다. (이름 붙이기와 통합 네임스페이스(UNS) 장 참조.)
SPARQL — 지식그래프의 질의 언어로, (derivedFrom)+ 같은 속성 경로(property path)는 임의 깊이의 계보 사슬을 한 문장으로 걸어 올라갈 수 있습니다. (의미론과 디지털 스레드 장 참조.)
SPC(통계적 공정 관리, Statistical Process Control) — 공정 자신의 변동을 써서 관리 한계를 정하고 이상 원인(special-cause) 이탈을 표시하는 것으로, 관리 한계는 공정이 하는 것을 기술하며, 공정이 해야 하는 것의 규격과는 별개입니다. (공정 분석 장 참조.)
기록의 시스템(System of record) — 한 종류의 데이터에 대한 유일한 권위 있고 밸리데이션된 출처(제어는 DCS, 실행은 MES, 출하는 LIMS)로, 오픈소스 계층은 원본 기록이 아니라 거울 또는 진본 사본(true copy)입니다. (DCS·MES·ERP 연동 장 참조.)
태그(Tag) — 자산-점-측정-점-속성 형태의 이름 붙은 신호(예를 들어 BR101.Temp.PV)로, 단일 데이터 포인트의 우편 주소입니다. (이름 붙이기와 통합 네임스페이스(UNS) 장 참조.)
태그 사전(Tag dictionary) — 모든 합법적 태그와 그 계층 배치, 단위, UNS 경로, Sparkplug 토픽을 담은, 거버넌스되는 등록부(gov.tag_dictionary)로, 태그 자체가 데이터베이스가 강제하는 기본 키(primary key)입니다. (이름 붙이기와 통합 네임스페이스(UNS) 장 참조.)
기술이전(Tech transfer) — 밸리데이션된 공정을 새 규모나 사이트로 옮기는 일로, ISA-88/95 모델, 맥락화, 계보가 그대로 따라가므로 받는 사이트는 어휘가 아니라 장비와 부하를 재적격성평가합니다. (캡스톤 장 참조.)
통합 네임스페이스(UNS, Unified Namespace) — 어떤 시스템이든 무엇이든 그 현재 상태를 찾으러 가는 단 하나의 장소가 되는, 단일하고 실시간이며 브로커에 구애받지 않는 계층구조로, 비즈니스처럼 조직되고 ISA-95 레벨에 맞춰 형태가 잡힙니다. (이름 붙이기와 통합 네임스페이스(UNS) 장 참조.)
밸리데이션(Validation) — 컴퓨터화 시스템이 명세된 그대로 정확히 작동함을 그 수명 전체에 걸쳐 유지하는, 문서화된 위험 기반 증거로, 오픈소스가 함께 딸려 오지는 않는 규제 부담입니다. (오픈소스 스택 밸리데이션 장 참조.)
21 CFR Part 11 — 전자기록과 전자서명이 종이·수기와 신뢰할 수 있는 등가물이 되는 조건을 정한 미국 FDA 규칙으로, 어떤 오픈소스 도구도 상자에서 꺼내자마자 준수 상태인 것은 없습니다. (전자기록과 전자서명 장 참조.)
여기 어떤 용어가 아직 흐릿하게 느껴진다면, 그 용어가 사는 해당 장으로 되돌아가 보세요. 맥락 속에서 훨씬 잘 이해될 것입니다.