용어집
📍 빠른 참고: 이 페이지는 책 전체를 위한 휴대용 사전입니다. 즐겨찾기 해 두고, 어떤 단어 —
IRI,SHACL,지속체(continuant),역량 질문(competency question)— 가 헷갈릴 때마다 언제든 다시 찾아오세요.
온톨로지를 구축하는 일에는 그것이 모델링하는 제조 용어 위에 얹힌 고유한 어휘가 있습니다. 이 책에서 가장 중요한 용어들을 쉬운 말로 정리했고, 찾기 쉽도록 영어 단어 기준으로 알파벳 순서로 나열했습니다(영어 순서를 그대로 따릅니다). 각 항목은 평이한 말로 된 출발점이며, 연결된 장에서 완전하고 정확한 설명을 볼 수 있습니다.
affectsQuality — 품질 설계(Quality-by-Design) 연결을 그래프 안의 한 엣지로 적은 것입니다. 공정 변수(예: 공급 속도)가 품질 속성(예: 단량체 순도)에 영향을 줍니다. 개발 보고서 안에 묻혀 있던 발견을 질의할 수 있는 사실로 바꾸고, 그 근거 — 작동 범위와 그것을 입증한 연구 — 를 함께 담습니다. (관계와 계보 장 참조.)
정렬(Alignment) — 로컬 용어가 공유된 공개 온톨로지의 더 일반적인 용어의 더 구체적인 종류임을, 스택 위로 향하는 rdfs:subClassOf 엣지로 선언하는 일입니다. 그러면 파트너의 도구가 별도의 브리지를 만들지 않고도 여러분의 클래스를 인식합니다. 이 책은 그러한 엣지를 모두 한 파일 align.ttl에 모아 둡니다. (재사용 조사와 정렬 장 참조.)
Allotrope(AFO / ASM) — 분석 실험실 데이터를 위한 형식 온톨로지이자 데이터 포맷으로, 장비(Equipment), 물질(Material), 공정(Process), 결과(Result)로 구성됩니다. AFO는 온톨로지이고, ASM(Allotrope Simple Model)은 그 가벼운 JSON 형식으로, 점점 더 지식 그래프로 흘러 들어가고 있습니다. (실제로 쓰이는 어휘 장 참조.)
공리(Axiom) — 모델에 적어 두어, 기계가 그것을 단지 이름표만 붙이는 것이 아니라 검사하고 확장할 수 있게 하는 상시 규칙입니다. 예를 들어 derivedFrom이 이행적이라거나, 두 클래스가 결코 겹칠 수 없다는 것입니다. 공리야말로 명사들의 목록을 추론기가 작동할 수 있는 온톨로지로 바꾸는 것입니다. (공리와 제약 장 참조.)
B2MML — 시스템 간에 배치 레시피와 기록을 교환하기 위한 무료(royalty-free) XML(과 JSON) 포맷으로, ISA-95 / ISA-88 제조 표준의 와이어 위 직렬화 형식입니다. 플랜트 시스템 사이의 사실상의 교환 계층으로 널리 쓰입니다. (와이어에서 그래프까지 장 참조.)
BFO(Basic Formal Ontology) — 과학과 산업계가 대체로 정착한, 국제 표준(ISO/IEC 21838-2)으로 발행된 작고 도메인 중립적인 상위 온톨로지입니다. Bioreactor도 Antibody도 담고 있지 않으며, 모든 것이 그 아래로 들어가는 가장 일반적인 범주만을 담고 있어, 그 위에 지어진 온톨로지들이 서로 맞물립니다. (상위 척추 장 참조.)
클래스(Class) — 모델 안의 사물 범주로, 예를 들어 Batch, Bioreactor, DrugSubstance 같은 것입니다. 모든 클래스는 정의되기 전에 BFO의 최상위 범주 중 하나 아래에 배치되며, 이것이 바로 그것을 검사 가능하게 만듭니다. (클래스와 분류학 장 참조.)
닫힌 세계 가정(Closed-world assumption) — SHACL이 따르는 규칙입니다. 데이터에 없는 것은 무엇이든 거짓(누락, 실패)으로 취급됩니다. OWL의 열린 세계와 정반대이며, 출하 결정이 필요로 하는 바로 그것입니다 — 누락된 무균 시험은 미해결 질문이 아니라 불합격 로트입니다. (출하 게이트와 SHACL 장 참조.)
역량 질문(Competency question, CQ) — 어떤 모델링보다 먼저 작성하는, 완성된 온톨로지가 답할 수 있어야 하는 평이한 한국어(영어) 질문입니다("어떤 로트가 불합격하면, 그 계보를 공유하는 다른 제품은 무엇인가?"). 이는 요구사항의 단위이며, 이 책에서는 시험의 단위이기도 합니다. CQ-01부터 CQ-23까지 번호가 매겨진 23개가 있습니다. (명세와 ORSD 장 참조.)
contains — 이행적 포장 계층입니다(카톤이 바이알을 담고, 케이스가 카톤을 담고, 팔레트가 케이스를 담습니다). derivedFrom과 일부러 분리해 두는데, 바이알이 지금 무엇 안에 포장되어 있는지는 바뀔 수 있는 반면, 그것이 무엇으로 만들어졌는지는 영구적이기 때문입니다. 둘을 혼동하면 리콜 추적이 깨집니다. (관계와 계보 장 참조.)
지속체(Continuant) — BFO에서, 시간 전체를 통해 하나의 전체로서 지속하며 존재하는 모든 순간에 온전히 현존하는 것입니다. 세포, 바이오리액터, 바이알, 배치, 순도, 역할 같은 것입니다. 발생체의 반대입니다. (상위 척추 장 참조.)
핵심공정변수(CPP, Critical Process Parameter) — 라인에서 제어하는 설정값으로, 예를 들어 배양 온도나 공급 속도처럼 그 변동이 제품 품질에 영향을 준다고 입증되어, 검증된 범위 안에 유지되는 것입니다. 모델은 이것을 affectsQuality로 그것이 움직이는 속성과 연결합니다. (명세와 ORSD 장 참조.)
핵심품질특성(CQA, Critical Quality Attribute) — 단량체 순도나 응집체 수준처럼, 의약품이 안전하고 효과를 내려면 한계 안에 있어야 하는 제품의 측정 속성입니다. 출하 게이트는 이것들의 패널을 검사합니다. (출하 게이트와 SHACL 장 참조.)
데이터타입 속성(Datatype property) — 사물을 읽을 수 있는 리터럴 값에 연결하는 관계입니다(예: monomerPct를 숫자 98.611에 연결). 다른 사물로 걸어갈 수 있게 연결하는 객체 속성과 대비됩니다. 둘 사이의 갈림길이 어느 쪽을 작성할지 결정합니다. (관계와 계보 장 참조.)
삭제하지 말고 폐기(Deprecate, don't delete) — 한번 발급된 식별자는 결코 제거하지 않고 폐기됨으로 표시한 뒤 그 대체물을 가리키게 하여, 과거 기록이 해석 가능한 상태로 남도록 하는 거버넌스 규칙입니다. (거버넌스와 변경 장 참조.)
derivedFrom — 이 책에서 가장 가치 있는 단 하나의 관계입니다. 모든 물질을 워킹 세포은행에 뿌리내리게 하는 이행적 계보 엣지입니다. 직계 부모 링크만 명시하지만, 이행적이기 때문에 추론기가 전체 사슬을 추론해 내어, 단 하나의 질의로 원료의약품 로트를 그 얼린 기원까지 거슬러 올라갑니다. (관계와 계보 장 참조.)
담음 불가(Disjointness) — 두 범주가 결코 겹칠 수 없다고 선언된 규칙으로, 둘 다로 타입 지정된 엔티티는 표시되는 오류가 됩니다 — 바이오리액터로도 타입 지정된 배치, 또는 발생체로 타입 지정된 지속체처럼요. 추적성을 보호하는 가드입니다. (공리와 제약 장 참조.)
성향(Disposition) — BFO의 실현 가능한 엔티티입니다. 측정되고 있든 아니든 사물이 지니는 실재하는 경향성으로, 수지가 항체에 결합하는 경향, 분자가 응집하는 경향 같은 것이며, 그 근거가 되는 분석 결과와는 구별됩니다. (클래스와 분류학 장 참조.)
완제의약품(DP) / 원료의약품(DS) (Drug product / Drug substance) — 러닝 예제에서, 원료의약품(DS-001)은 열한 개의 조상이 수렴하고 출하가 결정되는 정제된 벌크 항체이고, 완제의약품(DP-001, DP-002)은 그것으로 채운 바이알입니다. (인스턴스 그래프 장 참조.)
실행 가능한 ORSD(Executable ORSD) — 이 책의 핵심 한 수입니다. 역량 질문을 산문으로 남겨 두지 않고 실행 가능한 산출물(cq-catalog.json)로 컴파일하여, 요구사항 문서와 시험 스위트가 같은 파일이 되고 결코 슬그머니 서로 어긋날 수 없게 합니다. (명세와 ORSD 장 참조.)
FAIR — 데이터가 찾을 수 있고(Findable), 접근할 수 있고(Accessible), 상호운용 가능하고(Interoperable), 재사용 가능해야(Reusable) 한다는 원칙입니다. 전역 식별자가 데이터를 찾을 수 있게 하고, 공유 어휘와 단위를 지닌 값이 상호운용 가능하게 합니다. FAIR가 공개(open)와 같은 뜻은 아님에 유의하세요 — 접근이 제한된 규제 데이터도 여전히 완전히 FAIR할 수 있습니다. (발행과 FAIR 장 참조.)
함수 속성(Functional property) — 한 주어당 많아야 하나의 값을 가질 수 있는 관계입니다(세포주는 정확히 하나의 트랜스펙션으로 만들어지고, 한 은행은 정확히 하나의 숙주를 가집니다). 만약 두 값이 주장되면, 추론기는 그 둘이 같은 것임이 틀림없다고 결론짓습니다 — 이중으로 입력된 기록을 병합하는 내장된 방법입니다. (공리와 제약 장 참조.)
GraphRAG — 신뢰 저장소가 지식 그래프인 검색 증강 생성(retrieval-augmented generation)으로, 모델이 학습 기억에서 추측하는 대신 타입 지정 엣지(예: derivedFrom)를 걸어가며 그것을 인용해 답합니다. 검색 단계는 하니스가 이미 실행하는 바로 그 계보 질의입니다. (온톨로지와 AI 장 참조.)
그라운드 트루스(AI를 위한) (Ground truth, for AI) — 학습 또는 검색 시스템이 닻을 내리는, 검증되고 큐레이션된 사실입니다. 이 책에서는 추론되고 SHACL 게이트를 통과한 지식 그래프로, 유창한 모델이 스스로 공급할 수 없는 실체를 공급합니다. (온톨로지와 AI 장 참조.)
그룹화 / 배치 단위 제외 교차검증(Grouped / leave-one-batch-out cross-validation) — 캠페인 데이터 위에서 학습하는 모델을 정직하게 평가하는 방법입니다. 한 배치의 모든 기록은 통째로 학습 또는 시험 어느 한쪽으로 가며, 결코 행 단위로 쪼개지지 않습니다. 한 세포은행에서 나온 형제 로트들은 독립적인 표본이 아니라 거의 쌍둥이이기 때문입니다. derivedFrom 계보가 그룹화 키를 공급합니다. (클래스와 분류학 장 참조.)
개체 / 인스턴스(Individual / instance) — 그래프 안의 특정하게 이름 붙은 사물로(WCB-CHO-001, DS-001), 그것이 속하는 클래스와 대비됩니다. 클래스를 개체로 채우는 일이 어휘를 질의할 수 있는 제조 기록으로 바꿉니다. (인스턴스 그래프 장 참조.)
IOF(Industrial Ontologies Foundry) — OBO Foundry의 제조 측 대응물입니다. 그 IOF Core는 공유 개념(장비, 물질, 공정)을 공급하는 BFO 기반의 중간 수준 온톨로지이고, 바이오파마 모듈은 러닝 예제가 재사용하는 단위 작업, 장비, 품질 설계 용어를 더합니다. (상위 척추 장 참조.)
IRI(Internationalized Resource Identifier) — RDF가 모든 주어, 술어, 자원 목적어에 부여하는, URL처럼 생긴 전역 고유 웹 이름입니다. 로컬 데이터베이스 키와 달리 시스템과 사이트를 넘어 같은 것을 뜻하므로, 두 시스템이 같은 IRI를 가리킴으로써 의미에 합의합니다. (식별자와 단위 장 참조.)
ISA-95 / ISA-88 — 플랜트를 모델링하는 표준입니다. ISA-95(IEC 62264)는 물질 로트, 장비, 활동을 서로 다른 객체로 유지하고, ISA-88(IEC 61512)은 배치 레시피를 절차(procedure), 작업(operation), 단계(phase)로 구조화합니다. 온톨로지는 이 구분을 BFO 척추 위에 다시 표현합니다. (클래스와 분류학 장 참조.)
ISO IDMP — 의약품 식별(Identification of Medicinal Products)을 위한 ISO 표준군으로, 물질이나 제품에 기계가 읽을 수 있는 규제 정체성(예: UNII 코드)을 부여합니다. 이 책은 그것을 출하 게이트가 검증한 바로 그 노드에 붙입니다. (규제 시맨틱 장 참조.)
지식 그래프(Knowledge graph) — 사실을 타입 지정 링크 — 노드, 엣지, 노드 — 로 저장하여 걸어가고 질의할 수 있게 한 저장소입니다. 예를 들어 로트 — derivedFrom — 배치처럼요. 러닝 예제의 전체 데이터셋이 그러한 그래프 하나입니다. (온톨로지와 AI 장 참조.)
LOT(Linked Open Terms) — 온톨로지 수명의 후반부 — 요구사항, 구현, 발행, 버전 관리, 그리고 재사용 가능한 어휘의 FAIR 릴리스 — 를 다루는 산업 지향 방법론입니다. (발행과 FAIR 장 참조.)
LRV(로그 감소값, Log Reduction Value) — 정제 단계가 바이러스 수준을 10의 거듭제곱으로 얼마나 낮추는지를 재는 척도입니다. 값이 로그이기 때문에, 독립적인(직교하는) 두 단계의 값은 더해집니다 — 4.5 더하기 4.2는 총 제거 능력 8.7이 됩니다. 배치별 측정값이 아니라 단계의 검증된 능력으로 모델링됩니다. (질의로서의 역량 질문 장 참조.)
NeOn — 구축을 하나의 경직된 폭포수가 아니라 유연한 단계들(명세, 재사용, 개념화 등)로 틀 잡는 시나리오 기반 온톨로지 공학 방법론입니다. 이 책이 중심으로 삼는 ORSD의 출처입니다. (명세와 ORSD 장 참조.)
NOR / PAR — 정상 작동 범위(NOR, 변수를 일상적으로 더 좁게 유지하는 구간)가, 입증된 허용 범위(PAR, 여전히 허용 가능한 제품을 낸다고 입증된 더 넓은 영역) 안에 자리한 것입니다. 둘 다 산문이 아니라 타입 지정 범위로 모델링됩니다. (관계와 계보 장 참조.)
OBO Foundry — 조율되고 원칙에 기반한 생의학 온톨로지(예: 유전자 온톨로지, 단백질 온톨로지)들이 상위 기반과 설계 규칙을 공유하기 때문에 겹치는 대신 맞물리는 생명과학 커뮤니티입니다. 산업 측 대응물인 IOF에 영감을 주었습니다. (상위 척추 장 참조.)
객체 속성(Object property) — 사물을 다른 사물에 연결하는 관계로, derivedFrom으로 세포은행까지 거슬러 올라가듯 걸어갈 수 있는 엣지입니다. 리터럴 값에 연결하는 데이터타입 속성과 대비됩니다. (관계와 계보 장 참조.)
occursIn — 공정을 그것이 실행된, 지속하는 장비에 묶는 객체 속성입니다(배양 실행을 용기 BR-101에). 배치 물질을 용기로 잘못 다시 타입 지정하는 대신 사용하며, 실행과 배치와 용기를 서로 다른 세 가지로 유지합니다. (관계와 계보 장 참조.)
발생체(Occurrent) — BFO에서, 시간 속에서 일어나고 펼쳐지며, 시간적 부분을 가지기에 결코 한꺼번에 온전히 현존하지 않는 것입니다. 세포 배양 실행, 포획 단계, 캠페인 전체 같은 것입니다. 지속체의 반대입니다. (상위 척추 장 참조.)
열린 세계 가정(Open-world assumption) — OWL 추론이 따르는 규칙입니다. 명시하지 않은 것은 무엇이든 단지 아직 알려지지 않은 것으로 취급되며, 결코 거짓이 아닙니다. 그래서 누락된 필수 결과가 추론기에게는 "알 수 없음"으로 읽히고, 그 간극을 잡아내기 위해 닫힌 세계 SHACL 게이트가 필요한 것입니다. (출하 게이트와 SHACL 장 참조.)
ORSD(Ontology Requirements Specification Document, 온톨로지 요구사항 명세 문서) — 모델링에 앞서 합의하는 짧은 개요서로, 온톨로지의 목적, 범위, 사용자, 의도된 용도, 기능 요구사항(역량 질문 카탈로그), 비기능 요구사항, 그리고 사전 용어집을 확정합니다. (명세와 ORSD 장 참조.)
owl:sameAs — 두 식별자가 동일한 개체를 가리킨다는 강력한 주장으로, 둘의 모든 사실을 양방향으로 융합합니다. 강력하지만 오용되기 쉬워서, 이 책은 일부러 하나도 주장하지 않고, 다르게 이름 붙은 기록을 출처가 명시된 주장으로 대신 화해시킵니다. (식별자와 단위 장 참조.)
OWL(Web Ontology Language) — 모델의 클래스, 관계, 공리를 적는 표준 논리 언어로, RDF 위에 얹힙니다. 추론기는 OWL을 사용해 적어 둔 사실로부터 따라 나오는 새로운 사실을 도출합니다. (클래스와 분류학 장 참조.)
OWL-RL 폐쇄(OWL-RL closure) — 질의가 실행되기 전에, 적어 둔 사실로 이미 함의된 사실을 — 모든 이행적 조상, 물질 엔티티로 태그된 모든 장비 항목 — 명시해 내는 추론 단계입니다. 이것이 러닝 예제의 트리플 수가 2120에서 7137로 늘어나는 이유입니다. (러닝 예제 장 참조.)
계대 수 / 계대 한계(Passage number / passage limit) — 살아 있는 배양이 몇 번 나뉘고 다시 자랐는지로, 세포가 얼마나 오래 증식되어 왔는지를 추적합니다. 세포는 분열하면서 변동하기 때문에 검증된 계대 한계(여기서는 40)가 이를 제한하며, 시드 트레인은 은행에서부터 계대를 누적해 나갑니다. (인스턴스 그래프 장 참조.)
프로파일 한계(이행성) (Profile limit, transitivity) — derivedFrom이 이행적이기 때문에 OWL 2 DL이 그것을 비순환적이라고도 선언하는 것을 금지한다는 정직한 제약입니다 — 그래서 "어떤 것도 자기 자신의 조상이 아니다"는 논리가 아니라 SHACL과 관례로 강제됩니다. 거짓으로 꾸미지 않고 솔직하게 이름 붙였습니다. (공리와 제약 장 참조.)
PROV 기반 화해(PROV-based reconciliation) — 한 사물을 다르게 부르는 기록들을, 식별자를 융합하는 것이 아니라 각 출처의 주장을 출처가 명시된 주장으로 유지하고 스튜어드의 큐레이션 결정을 prov:Activity로 기록하여 해결하는 일입니다. 감사 추적을 유지하고 과잉 병합을 피합니다. (식별자와 단위 장 참조.)
증명 하니스(validate.py) (Proof harness) — 데이터셋을 하나의 그래프로 파싱하고, 그 위에서 추론하며, 23개 역량 질문을 모두 합격/불합격 수용 시험으로 실행하여, 모두가 통과해야만 깨끗이 종료하는 작은 프로그램입니다. 모델을 정직하게 유지하는 검사관입니다. (러닝 예제 장 참조.)
QUDT — 양, 단위, 차원, 타입(Quantities, Units, Dimensions and Types) 어휘로, 값이 단위와 그 양의 종류를 문자열 접미사가 아니라 기계가 읽을 수 있는 식별자로 지니게 합니다. 그래서 98.611이 모호함 없이 98.611 퍼센트를 뜻하게 됩니다. (식별자와 단위 장 참조.)
RDF(Resource Description Framework) — 전체 데이터셋이 표현되는 그래프 데이터 모델입니다. 모든 사실이 주어-술어-목적어 링크이므로, 데이터셋은 서로 연결된 노드의 그물입니다. (러닝 예제 장 참조.)
추론기(Reasoner) — 손으로 주장한 사실만 읽는 것이 아니라, 모델이 함의하는 새로운 사실(예: derivedFrom의 이행적 계보 엣지)을 도출하는 추론 소프트웨어입니다. (명세와 ORSD 장 참조.)
관계 온톨로지(Relation Ontology, RO) — 두 온톨로지가 한 표현을 두 가지 뜻으로 쓰지 않도록, 관계(의 일부(part of), 에 참여한다(participates in), 에서 유래한다(derives from))를 클래스만큼 신중하게 정의하려는 생의학 커뮤니티의 노력입니다. 이 책의 derivedFrom은 위로 RO의 에서 유래한다에 정렬됩니다. (상위 척추 장 참조.)
제약(Restriction) — 클래스에 적은, 추론기가 강제할 수 있는 필요 조건입니다 — 예를 들어 모든 세포주는 어떤 트랜스펙션의 산출물이라거나, 워킹 세포은행은 적어도 하나의 특성분석 결과를 지닌다는 것입니다. (공리와 제약 장 참조.)
러닝 예제(Running example) — 모든 장이 모델링하는 단 하나의 CHO 단일클론항체 캠페인으로, 워킹 세포은행 WCB-CHO-001부터 채워진 바이알 DP-001/DP-002까지 이어지며, 영향과 출하 질문을 시험하기 위해 일부러 규격 이탈된 형제 DP-004를 둡니다. (러닝 예제 장 참조.)
SAMOD — 단순화된 애자일 온톨로지 개발 방법론(Simplified Agile Methodology for Ontology Development)으로, 역량 질문을 쓰고, 슬라이스를 모델링하고, 데이터에 대해 시험하고, 리팩터링하는 작은 시험 우선(test-first) 루프를 모델이 온전해질 때까지 반복합니다. 모든 모델링 장의 리듬입니다. (명세와 ORSD 장 참조.)
SHACL(Shapes Constraint Language) — 그래프를 필요한 형태(shape)에 대해 검증하며 "필요한 것이 누락되었거나 규격을 벗어났는가?"를 묻는 규칙 언어로, 닫힌 세계 질문입니다. 출하, 마감, 세포은행 게이트는 SHACL 형태입니다. (출하 게이트와 SHACL 장 참조.)
SPARQL — RDF 그래프를 위한 질의 언어로, SQL의 그래프 등가물입니다. (derivedFrom)+ 같은 속성 경로는 관계를 한 홉 이상 걸어가므로, 단 하나의 질의로 전체 계보를 재구성합니다. (질의로서의 역량 질문 장 참조.)
포섭(subClassOf) (Subsumption) — 한 클래스가 다른 클래스의 한 종류라는(예: Batch는 물질 인공물의 한 종류) 정직하고 더 약한 주장이며, 둘이 동등하다는 주장이 아닙니다. 동등성을 주장하면 과잉 확약이 되어 추론기를 거짓 결론으로 몰아넣습니다. (상위 척추 장 참조.)
분류학(Taxonomy) — 포섭으로 배열된 클래스의 나무로, 각 클래스가 하나의 BFO 최상위 범주에 매달려 있습니다. 잘 이름 붙은 클래스의 분류학도, 관계와 공리가 그것을 그래프로 엮기 전까지는 여전히 분류학에 지나지 않습니다. (클래스와 분류학 장 참조.)
트리플(Triple) — 하나의 주어-술어-목적어 사실(DS-001 — derivedFrom — POLpool-001)로, RDF 그래프의 원자 단위이자 하니스가 세는 대상입니다. (러닝 예제 장 참조.)
터틀(.ttl) (Turtle) — RDF 그래프를 적는, 사람이 읽을 수 있는 텍스트 구문입니다. a는 "이다(is a)"를 뜻하고, 세미콜론은 같은 주어에 관한 또 다른 문장을 이어 가며, bp: 같은 접두사는 긴 웹 주소의 약칭입니다. (러닝 예제 장 참조.)
UCUM(Unified Code for Units of Measure) — 소프트웨어를 넘어 모호함이 없도록 설계된 대소문자 구분 단위 코드(%, Cel, g/L)의 집합으로, 임상 및 실험실 데이터 교환에 내장되어 히스토리언과 OPC UA 서버가 와이어 위로 내보내는 단위 문법입니다. (식별자와 단위 장 참조.)
상위(기초) 온톨로지(Upper / foundational ontology) — 가장 일반적인 범주 — 지속하는 것, 일어나는 것, 품질, 역할 — 로 이루어진 작고 도메인 중립적인 어휘로, 모든 도메인 용어가 그 안으로 끼워 맞춰져, 서로 다른 팀이 지은 온톨로지가 호환을 유지합니다. 이 책이 쓰는 것은 BFO입니다. (상위 척추 장 참조.)
검증의 역설(Validation paradox) — 학습된 모델은 떼어 둔(held-out) 데이터에 대해 검사되어 분포 밖에서는 자신만만하게 틀릴 수 있는 반면, 추론되고 형태로 검증된 그래프는 공리에 대해 검사되어 범주 혼동이 확실하게 잡힌다는 비대칭입니다 — 그래서 온톨로지가 AI를 그라운딩하지, 그 반대가 아닌 것입니다. (클래스와 분류학 장 참조.)
어떤 용어가 아직 흐릿하게 느껴진다면, 그 용어가 살아 있는 장으로 되돌아가 보세요. 맥락 속에서 훨씬 잘 이해될 것입니다.