Journal of the Korean Biblia Society for Library and Information Science 2023 KCI Impact Factor : 0.82
-
pISSN : 1229-2435 / eISSN : 2799-4767
- https://journal.kci.go.kr/kbiblia
pISSN : 1229-2435 / eISSN : 2799-4767
Deployment of BIBFRAME as a New Bibliographic Framework in Linked Data
Park, Oknam 1, 오정선 2
1상명대학교
2School of Information Sciences, University of Pittsburgh
웹 3.0으로 대변되는 최근의 정보환경은 데이터 웹, 링크드 데이터, 오픈 데이터와 같은 키워드로 대변되며, 지능화된 웹을 위하여 시맨틱 데이터 기술을 활용하여 이용자에게 맞춤형 정보 및 서비스를 제공하는 것을 목적으로 한다
미국국회도서관은 2011년 서지 프레임워크 이니셔티브를 발표하고, 서지데이터의 링크드 데이터로의 변환을 위한 프레임웍을 제시하기 위한 연구를 수행해오고 있다. 이러한 노력의 결과로 목록레코드의 데이터화를 위한 RDF(Resource Description Framework)기반의 링크드 데이터 개체/관계 모델인 BIBFRAME 모델 및 어휘를 발표하였으며, 최근 구현도구를 개발하고 목록 레코드의 BIBFRAME전환을 위한 시범서비스를 실시하고 있다. BIBFRAME은 현재도 계속 개발 중에 있으며, 다양한 자료유형, 콘텐트 모델에 제한되지 않는 서지기술형식을 개발하기 위한 노력은 계속되어야 한다.
지금까지 수행된 BIBFRAME과 관련한 연구는 차세대 목록형식으로서의 BIBFRAME의 개념 및 현재까지의 개발경과를 소개하는
이에 본 연구는 BIBFRAME의 목적 및 배경, 현재까지의 진행상황을 살펴보고, BIBFRAME 모델 및 어휘를 소개하고자 한다. 이와 함께 MARC기반의 목록레코드와 BIBFRAME 어휘간 매핑, MARC 목록레코드의 BIBFRAME 전환사례를 제시함으로써 BIBFRAME 활용방안에 대한 이해를 높이고자 한다. 이러한 연구는 추후 BIBFRAME 실효성 및 완전성을 높이는데 기여할 것으로 기대한다.
도서관 환경을 둘러싼 정보환경은 공유 및 연계의 키워드를 제시하고 새로운 정보생태계를 구성하기 위한 움직임을 보이고 있음에도 불구 하고, 도서관은 오랜 시간 축척해온 목록데이터를 도서관 외부의 데이터와 연계하는 데 어려움을 겪고 있다. 미국국회도서관은 서지기술이 웹 또는 네트워크화된 사회의 일부분으로 편입되기 위한 모델을 제시하고, 이를 위하여 기존 도서관 에서 서지기술을 위해 사용되어왔던 MARC포맷을 대체할 필요성을 인식하였다. 이에 도서관의 서지프레임워크를 위한 이니셔티브를 2011년 5월 발표하고, 같은 해 10월 BIBFRAME 종합 계획을 게시하였다. 종합계획은 BIBFRAME의 목적 및 배경을 제시하였는데, BIBFRAME은 링크드 데이터를 기반으로 기존의 MARC 레코드와의 호환성을 유지하면서 MARC을 대체할 수 있는 새로운 서지프레임워크를 제시할 것을 명시하였다. 링크드 데이터 기반을 제시한 것은 자원 기술의 유연성을 향상시키고 웹 환경에서 도서관 자원의 검색 및 재사용을 용이하게 하기 위함이다. 여기서의 프레임워크는 포맷이 아니라 환경을 의미하는 것으로 목록규칙과 같은 콘텐트 모델에 상관없이 적용될 수 있는 환경을 의미한다. 그러므로 BIBFRAME은 AACR2나 RDA와 같은 목록규칙에 초점을 두고 고안된 것은 아니다. 이후 2012년 5월 미국국회도서관은 BIBFRAME을 개발하기 위한 파트너로 Zepheira 와 계약하였다. Zepheria는 OCLC Schema.org 링크드 데이터 이니셔티브에 참여한 회사로, 전통적 목록레코드에서 표현 가능한 서지정보구조를 벗어나, 이를 데이터 단위로 분석하고 목록데이터를 링크드 데이터로 변환하기 위하여 데이터 간의 연계를 컴퓨터가 용이하게 식별할 수 있는 방식으로 표현하는 것에 초점을 두었다. 미국국회도서관의 이러한 노력의 결과로 2012년 11월 미국국회도서관은 BIBFRAME 모델 입문 서를 게시하면서, MARC 포맷을 조금 더 웹 정보환경에 적합한 메타데이터 인코딩 포맷으로 대체할 것을 제시하였다. 2013년 1월 Bibframe.org 를 게시하고 BIBFRAME 모델과 어휘를 제시 하면서 RDF/XML를 MARC 형식을 대체할 언어로 제시하였다(Kroeger 2013;
BIBFRAME은 도서관 목록의 도서관 내외의 커뮤니티 수용, 자원의 다양성, 전자자원에 대한 접근관리가 용이한 시스템 등 변화하는 목록 환경을 고려하기 위하여 몇 가지 원칙을 제시 하고 있다. 첫째, 콘텐트 규범 및 데이터 모델의 광범위한 수용이다. 이를 위해 RDA, AACR2, DACS 등의 목록규칙에 상관없이 적용할 수 있는 서지프레임워크를 개발하고자 하였다. 둘째, 다양한 메타데이터 유형을 포괄하고자 하였다. 기존의 기술 전거메타데이터와 같은 서지기술을 제공하는 데이터를 지원하는 것은 물론, 소장정보, 코드화된 데이터, 분류 및 주제데이터, 보존․관리․기술 메타데이터를 수용하고자 하였다. 셋째, 모든 유형의 도서관 소장정보에 대한 기술 및 관리를 목적으로 한다. 기존 단행본 및 연속간행물은 물론, 출판사가 직접 생산 하는 전자자원 및 컬렉션과 같은 디지털자원을 고려하였다. 넷째, MARC21기반 레코드와의 호환성을 전제로 MARC포맷을 대체하는 포맷을 제시한다. 기존의 MARC21에서 표현하고 있는 서지레코드에 대한 기술구조는 유지하고, MARC데이터를 새로운 모델로의 변환을 제공 하여 MARC데이터의 재사용이 가능하도록 하였다. 마지막으로 연계의 강조이다. 서지데이터의 도서관 내․외부 데이터와의 연결을 강조하기 위하여 URIs기반의 시맨틱 기술을 활용할 것을 강조하였다
BIBFRAME은 서지데이터를 위한 링크드 데이터 모델을 제시하기 위하여 개념적 콘텐트와 물리적 구현형 사이의 구별을 명시화하고, 자원의 생성 및 자원과 연계된 개념에 대한 정보개체식별에 초점을 두는 동시에 개체 간 연계에 초점을 두었다. 이를 위해 저작(Creative Work), 인스턴스(Instance), 전거(Authority), 주석(Annotation)의 개체로 구성된 모델을
■저작(Creative Works)
저작은 개념적 목록아이템을 의미하며 추상적 개체이다. 저작개체는 저작과 연계된 다양한 인스턴스 사이의 공통적인 콘텐트를 기술하고 다른 저작과의 관계에서 참조를 위한 웹 기반 제어점 역할을 수행한다. 저작은 저작의 생성에 관여한 모든 개체(사람, 기관, 회의 등)는 물론, 자원의 주제(주제, 사람, 장소, 지명 등) 를 표현하는 전거와 연관되며, 다른 저작과 다양한 관계(부분/전체, 전작/후작)로 표현될 수있다. BIBFRAME에서 FRBR 모델의 저작 (Work)과 표현형(Expression)에 대응되는 개체는 저작이다.
■인스턴스(Instance)
인스턴스는 저작의 개별적, 물리적 구현형을 반영하며, 물리적 실체나 디지털 형태로 구현될 수 있다. 인스턴스 개체는 자원의 출판, 배포, 제작과 관계하여 전거개체와 연결될 수 있으며, 구체화(Materialization)와 관계된 속성으로 표현된다. 각 인스턴스는 단 하나의 저작과 연결 되며, FRBR 모델의 구현형(Manifestation)에 대응되는 개체이다.
■전거(Authority)
전거개체는 저작과 인스턴스를 연계하는 중요한 개념으로 사람, 장소, 토픽, 기관 등이 그 예이다. 전거는 통제어휘의 개념에 기초하여 구성된 개체이나, 미국국회도서관 주제명 표목표와 같은 주제명에 대한 통제어휘 범위가 아닌, 포괄적 의미의 전거데이터의 사용가능성을 소개하기 위한 개념이다. 전통적으로 목록에서의 전거레코드는 저작의 생성에 관여한 사람 또는 주제 등에 적용되는 개념이다. 또한 전거는 URI (Uniform Resource Identifier)를 기반으로 하는데, 이는 목록에서 통제어휘는 텍스트 문자열 기반이었던 것을 벗어나 텍스트 문자열을 식별자 기반으로 표현함으로써 식별자 기반으로 텍스트 문자열의 전거데이터와 연결하기 위함이 다. 전거개체는 추상적 개념의 계층으로 전통적 도서관 전거리스트는 물론 비 도서관 전거리스트 등으로 연결될 수 있다.
■주석(Annotation)
다른 주요 클래스 요소에 대한 선언으로, 주석은 자원에 대한 의견, 기관관련정보 부여, 자원기술에 대한 부가적인 설명을 제공하기 위하여 제시된다. 주석은 저작, 인스턴스, 이름전거, 관리 메타데이터에 적용될 수 있으며, 저작에 대해서는 리뷰, 초록, 발췌문이 대표적인 예가 될 수 있으며, 인스턴스에는 소장정보, 표지 이미지, 이름 전거에는 저자정보가 그 대표적인 적용 예이다. 그러나 도서관에서는 이미 출판 사와 같이 타사가 제공하는 표지 및 리뷰를 목록검색결과에서 보여주는 경우가 많으므로 주석은 제3자가 제공한 주석을 연계하는 경우가 많다.
예를 들어, BIBFRAME 저작은 도서자체 (Robinson Crusoe), 인스턴스는 그 도서의 특정 출판물(The life and strange surprising adventures of Robinson Crusoe of York)이 될 수 있다. 전거는 도서의 저자(Defoe, Daniel)나 주제 (Shipwreck survival-Fiction)에 적용될 수 있다. 마지막으로 전거는 도서, 특정 출판물, 전거에 대한 설명(Review)을 제공한다(
BIBFRAME 어휘는 BIBFRAME 모델을 구현하기 위하여 53개의 클래스와 289개의 속성으로 구성된다. BIBFRAME 어휘는 미국국회 도서관 BIBFRAME.org(
저작(bf:Work)은 BIBFRAME 모델에서 저작개체를 실현하기 위한 클래스이며 자원(bf:Resource)의 하위클래스이다. 저작 클래스는 오디오, 지도자료, 데이터세트, 복합자료, 멀티미디어, 악보자료, 동영상, 이미지, 텍스트, 3차원 자료 등 10개의 하위클래스로 구성된다. 저작은 인스턴스(bf:Instance), 에이전트(bf:Agent), 카테고리(bf:Category), 분류(bf:Classification), 이벤트(bf:Event), 제목(bf:Title), 장소(bf:Place) 등 7개 클래스와 연계되어 있다. 저작의 속성은 자원으로부터 상속받은 식별자(bf:Identifier), 제어접근점(bf:authorizedAccessPoint), 연관 저작(bf:relatedTo) 속성 외에 48개의 자체속성으로 구성된다. 속성은 BIBFRAME 개체인 주석(bf:Annotation)과 연결하는 저작주석(bf:has Annotation), 전거(bf:Authority)와 연결하기 위한 생산자(bf:creator), 공헌자(bf:contributor), 주제(bf:subject) 등은 물론, 저작과 연결된 클래스와 연결하기 위한 내용유형(bf:contentCategory), 분류(bf:classification), 관련저작(bf:relatedTo) 등이 있다. 특히 관련저작(bf:relatedTo) 속성은 자원클래스로부터 상속 받은 속성으로 하위속성으로 전작(bf:precedes), 후작(bf:succeeds), 연속간행물(bf:series), 번역본(bf:translation) 등 저작-저작 관계, 저작 -인스턴스 관계, 인스턴스-인스턴스 관계를 표현하기 위한 속성으로 구체화된다
이러한 클래스와 속성을 기반으로 저작이 기술되는데, 예를 들어 로빈슨 크루소 저작은 유형(Text), 표제Robinson Crusoe), 책임저자 (Garland, Robert), 편집자(Crowsley, J.Donald), 주제(Shipwreck survival-Fiction), 언어(Englisnh), 총서사항(Oxford world’s classics), 주석(Review), 분류번호(823.5), 특수이용자계층 ((Juvenile), 관련 인스턴스(The life and strange surprising adventures of Robin Crusoe of York)의 속성으로 기술된다(
인스턴스는 BIBFRAME 모델에서 인스턴스 개체를 실현하기 위한 클래스이며 보존자료(bf:Archival), 컬렉션(bf:Collection), 전자자료(bf:Electronic), 통합자료(bf:Integrating), 필사본(bf:Manuscript), 단행본(bf:Monograph), 합집(bf:MultipartMonograph), 악보(bf:Print), 연속간행물(bf:Serial), 촉각자료(bf:Tactile) 등 10개의 하위 클래스로 구성된다. 저작(bf:Work), 배열(bf:Arrangement), 식별자(bf:Identifier), 카테고리(bf:Category), 제목(bf:Title), 제공자(bf:Provider) 등 6개의 클래스와 연계되어 있으며 자원으로부터 상속받는 속성 외에 총 44개의 자체속성을 갖는다. 자체속성은 BIBFRAME 개체인 저작과 연결하는 속성(bf:InstanceOf) 외에 연결된 클래스와 연결하기 위한 매체유형 및 수록매체 유형(bf:mediaCategory, bf:carrierCateogory), 표제 및 약표제(bf:instanceTitle, bf:abbrevia tedTitle, bf:keyTitle), 발행․제작․배포사항(bf:publication, bf:distribution, bf:distribution, bf:manufacture), 식별자(bf:issn, isbn)는 물론, 형태사항에서 특정자료종별, 기타 물리적 속성, 크기 등을 표현하기 위한 속성(bf:dimensions, bf:extent, bf:illustrationNote) 등을 포함한다. 관련저작(bf:relatedTo)은 자원클래스로부터 상속받은 속성으로 하위속성으로 전작(bf:precedes), 후작(bf:succeeds), 연속간행물(bf:series), 등 저작간 관계를 표현하기 위한 속성으로 구체화된다.
제시된 클래스와 어휘를 사용하여 인스턴스를 기술하게 되는데, 예를 들어 로빈슨 크루소 저작의 인스턴스(The life and strange surprising adventures of Robinson Cruseo of York)는 단행본으로 중개장치 없는 매체(unmediated)이며, ISBN(9780192833822), 판차(1ST et.), 발행사항(Oxford : New York: Oxford University Press 1998), 소장정보(P43403.A2.C76 1998), 관련저작(Robinson Crusoe) 등의 속성으로 표현된다(
저작과 인스턴스는 모두 자원(bf:Resource) 의 하위클래스이며, 동일한 계층으로 구성된다. 이는 FRBR에서 표현형과 구현형을 저작의 하위클래스로 개념상 위치시킨 것과 구별되는데, 시맨틱 웹에서 하위클래스는 상위클래스의 속성을 상속받으므로, 인스턴스와 저작의 개별속성을 구별하기 위하여 동일한 계층으로 구성하였다.
전거(bf:Authority) 클래스는 에이전트(bf:Agent), 장소(bf:Place), 시간(bf:Temporal), 토픽(bf:Topic) 등 4개의 하위클래스로 구성 되며 이중 에이전트는 저작에 역할을 갖는 엔터티로 사람, 기관, 회의 등을 포함하는 개념 이다. BIBFRAME에서 전거는 기존의 목록에서 전거의 개념을 대체하기 위한 개념이 아니라 전거에 대한 일반적인 추상화 계층 또는 래퍼(wrapper)를 제공하기 위함이다
전거클래스는 자원(bf:Resource) 클래스와 연계되어 저작, 인스턴스, 주석에 대한 전거정보를 제공하기 위하여 가장 상위클래스인 자원 클래스와 연결된다. 전거클래스는 제어접근점(bf:authorizedAccessPoint) 등 자원 클래스로부터 상속받는 속성 외에 전거할당자(bf:auth orityAssigner), 전거출처(bf:authoritySource), 전거정보(bf:has Authority), 기타전거정보(bf:referenceAuthority), 역할(bf:role) 등 5개의 자체속성을 갖는다. 이중 제어접근점(bf:authorizedAccessPoint)은 고유한 제목이나 이름과 같이 자원을 고유하게 식별하기 위하여 부여되는 제어문자열로 저자 또는 삽화가의 이름을 값으로 가지며, 전거정보(bf:hasAuthority) 는 전거로 제공되는 문자열 값에 대한 링크를 제공한다. 다음의 예와 같이 로빈슨 크루소의 저자(Daniel Defoe)는 에이전트 클래스 중 사람(bf:Person)이며, 제어접근점 속성을 통해 문자열 값, 전거정보 속성을 통해 미국국회도서관의 전거식별자로 연결된다. 또한 주제 역시 제어접근점 속성을 통해 문자열 값(Orphans-Fiction), 전거정보 속성을 통해 미국국회도서관 주제명 표목표로 연결된다.
주석(bf:Annotation)클래스는 자원 클래스(bf:Resource)의 하위클래스로, 표지정보(bf: CoverArt), 소장정보(bf:HeldMaterial), 리뷰(bf:Review), 목차(bf:TableOfContents), 요약(bf:Summary) 등 5개 하위클래스를 가지며, 전거정보를 제공하는 에이전트 클래스와 저작및 인스턴스를 포함하는 자원 클래스와 연결된다. 주석클래스는 주석대상(bf:annotates), 주석(bf:annotationAssertedBy), 주석내용(bf:anno tationBody), 주석출처(bf:annotationSource), 주석생성날짜(bf:assertionDate) 등의 속성을 가지며 주석의 각 하위클래스는 각각의 속성을 가진다. 다음의 예와 같이 로빈슨 크루소 저작은 리뷰자원과 연계되며, 저작의 인스턴스는 소장정보 및 표지정보를 기반으로 부가적인 정보를 제공할 수 있다. 이때 저작의 리뷰, 소장정보, 표지정보의 값은 URI 식별자를 이용하여 직접 자원의 링크를 제시할 수 있다
앞서 살펴본 바와 같이, BIBFRAME은 링크드 데이터 모델을 채택한 새로운 서지기술 프레임웍을 제안하고 있다. 다시 말해 MARC에서 BIBFRAME으로의 전환은 단순한 레코드 형식의 변화에 그치는 것이 아니라 서지 기술 방식 자체의 변화를 의미하는 것이다. 기존의 도서관 목록이 레코드 중심이었다면, BIBFRAME에서는 자원에 대한 정보가 RDF 문장(statement) 들과 그 연결 관계로 표현되며, 링크드 데이터 원칙에 따라 개체와 개념을 URI로 기술함으로써 확장과 추론이 가능한 새로운 형태의 목록 데이터를 생성할 수 있게 되는 것이다.
이와 같은 근본적인 차이를 감안할 때, 기존의 MARC 레코드를 BIBFRAME의 어휘로 변환 하는 것이 간단한 작업이 아니라는 것은 쉽게 짐작할 수 있다. 실제로 BIBFRAME 개발이 시작된 2011년 이후 미국국회도서관, 미 의학도서관, 영국 및 독일의 국립 도서관 등 유수의 기관들이 참여하여 기존의 MARC 레코드를 변환하고 BIBFRAME을 지원하는 새로운 도구와 서비스를 개발하는 작업을 진행하고 있으나, MARC와 BIBFRAME 어휘의 매핑 테이블은 아직 제공되지 않고 있다. 다만 MARCXML 레코드를 BIBFRAME으로 변환하는 도구가 개발되어 공개되어 있으므로 그 소스 코드를 분석함으로써 MARC 레코드의 구성요소(리더, 고정장필드, 가변장필드 및 서브필드, 지시기 호)가 BIBFRAME 어휘로 어떻게 매핑되는지 살펴볼 수 있다. 이와 함께, 미국국회도서관의 개별 MARC 레코드와 BIBFRAME으로 변환된 RDF문서를 비교해 볼 수 있는 서비스가 Bibframe.org사이트를 통해 제공되고 있어, 실제 레코드 변환 사례를 통해 BIBFRAME이 모델과 어휘가 어떻게 적용되고 있는 지 분석해볼 수 있다.
이에 본 연구는 미국국회도서관이 공개한 MARC 변환도구의 XQuery 소스 코드와 실제 레코드 변환 결과를 분석한 것을 토대로, 주요 MARC 데이터 필드와 서브필드가 BIBFRAME 의 다양한 클래스와 속성과 어떻게 매핑되는지 살펴보았다. 미국국회도서관의 MARC 변환도 구는 XQuery로 작성되어 있으며 MARCXML 레코드를 입력 받아 BIBFRAME RDF 문서를 생성한다. 이 변환 도구의 소스 코드는 12개의 XQuery 모듈로 구성되어 있는데, 이 중 RDF 문서의 출력 형식 처리나 에러 처리 등 부가적인 모듈이나 지원 모듈을 제외하고 직접적으로 MARC 변환 로직을 처리하는 핵심 모듈 2개만을 고려해도 7,200줄 이상의 코드를 포함하고 있다. 예를 들어, 다음
다음에 제시하는 MARC와 BIBFRAME 매핑 테이블은, 이와 같이 변환 로직을 담당하는 핵심 모듈들의 XQuery 소스 코드를 분석한 후실제 레코드 변환 결과를 통해 검증하여 작성한 것이며, 매핑 테이블의 범위는 BIBFRAME 모델을 구성하는 주요 개체들을 중심으로, 대부분의 MARC 레코드에 출현하는 주요 혹은 필수 요소들과의 관계를 살펴보는 것으로 제한하였다. 유의할 것은 BIBFRAME은 개발이 완료된 표준이 아니라 현재 개발과 테스트, 문제점 및 해결방안에 대한 논의가 지속되고 있는 상태이고, BIBFRAME 어휘 자체의 성장/변화나 구현 방법의 변화에 따라 MARC와의 매핑 역시 크고 작은 변경이 가능하다는 점이다.
하나의 MARC 레코드는 하나의 저작(bf:Work) 에 대한 RDF 문장의 집합으로 변환된다. 즉, MARC에서 변환된 BIBFRAME RDF 문서는 URI로 식별되는 저작을 주어(subject)로 하는 트리플(triple)의 집합으로 구성되며, 저작을 정의역(domain)으로 갖는 속성(bf:Resource에서 상속받은 속성 포함) 중 주어진 MARC레코 드에서 데이터를 추출하여 속성값(object)을 구성할 수 있는 속성들이 모두 사용된다. 가장 기 본적인 속성으로는 식별자(bf:identifier), 제어 접근점(bf:authorizedAccessPoint), 저작표제(bf:workTitle), 생산자(bf:creator), 공헌자(bf:contributor), 분류(bf:classification), 주제(bf:subject), 언어(bf:language) 등이 있으며, 인스 턴스(bf:Instance) 클래스의 속성값과 연결하는 인스턴스(bf:hasInstance)나 주석(bf:Annotation) 클래스의 속성값과 연결하는 주석(bf:has Annotation), 혹은 관련된 다른 저작 및 자원과 연결하는 관련자원(bf:relatedResource)이 대표적이라 할 수 있다. 이와 같은 저작(bf:Work)의 속성들은 대부분 상응하는 클래스를 공역(range)으로 갖기 때문에 URI나 공백노드(blank node)를 사용하여 기술되며 문자열(literal)을 속성값으로 가지는 경우는 많지 않다. MARC 서브필드에 포함된 혹은 지시기호로 표현된 데이터는 공백노드에 연결된 속성을 이용하여 기술한다. 예를 들어 MARC 130이나 240 필드는 저작표제(bf:workTitle)로 매칭되는데, 저작표제(bf:workTitle)속성은 표제 클래스의 공백노드를 속성값으로 가지며, 130 혹은 240 필드의 서브 필드 $a에 포함된 표제정보는 표제 클래스의 표제값(bf:titleValue) 속성의 문자열 값으로 변환된다.
다음 장에서 제시할 실제 레코드 변환 예에서 볼 수 있는 것처럼, BIBFRAME에는 개별 저작에 대한 제어접근점(bf:authorizedAccessPoint) 이 포함되는데, 저작의 제어접근점은 1xx필드의 기본표목과 저작의 표제(bf:workTitle)을 조합하여 생성하도록 되어 있다. 저작의 표제는 MARC 레코드에 통일 표제에 해당하는 필드(130, 240) 존재할 경우 통일표제를 사용하며, 통일 표제가 없을 경우에는 일반 표제 (245) 인스턴스의 표제와 저작의 표제로 동시에 사용한다.
앞서 4장에서 설명한 것처럼 저작(bf:Work) 클래스는 오디오(bf:Audio), 지도자료(bf:Car tography), 데이터세트(bf:Dataset), 복합자료(bf:MixedMaterial), 멀티미디어(bf:Multimedia), 악보자료(bf:NotatedMusic), 동영상(bf:Mov ingImage), 이미지(bf:StillImage), 텍스트(bf:Text), 3차원자료(bf:ThreeDimensionalObject) 등 자료의 유형을 나타내는 10개의 하위클래스로 구성된다. MARC 레코드를 BIBFRAME으로 변환할 때 저작의 자료 유형은 리더 06(Type of Record)을 위주로 결정하되 필요에 따라 007 제어필드와 336(Content Type), 337(Media Type)필드의 데이터를 추가로 반영하며, RDF 일반 속성인 rdf:type을 이용하여 기술된다. 예를 들어 리더 06(리더의 7번째 자리)의 코드 값이 a 혹은 t인 경우 해당 저작은 bf:Text 클래스에 속하며, 리더 06의 값이 c 혹은 d인 경우 bf:NotatedMusic 클래스, e나 f인 경우는 bf:Cartography 클래스 등으로 결정된다.
BIBFRAME 모델에서는 저작(Creative Work), 인스턴스(Instance), 전거(Authority), 주석(Annotation)으로 구분되는 개체들 간의 관계를 제시하고 있는데, 저작 개체와 다른 개체들 간의 관계는 인스턴스(bf:hasInstance), 전거(bf:hasAuthority), 주석(bf:hasAnnotation) 속성을 이용하여 표현할 수 있다. 또한 서로 다른 저작 간의 관계의 표현에는 bf:relatedTo 속성과 그 하위 속성들이 사용될 수 있다. 실제로 MARC 레코드 내에 많은 필드들이 관련 저작에 대한 정보를 담고 있는데, 이러한 필드들은 저작간 관계의 유형에 따라 bf:relatedTo의 하위 속성과 매핑된다(
BIBFRAME의 인스턴스(bf:Instance)는 FRBR모델의 구현형(Manifestation)에 해당하며, MARC 레코드 내에서 인스턴스에 관한 정보는
MARC레코드 내에서 인스턴스는 020(ISBN) 필드를 기준으로 식별한다. 복수개의 ISBN이 있을 경우, 각 ISBN에 대해 인스턴스를 생성하고, ISBN이 없을 경우, 26X필드(260, 261, 262, 264) 와 300필드를 기반으로 인스턴스를 생성한다.
저작을 기술할 때 MARC 레코드의 리더에 표기된 정보를 이용하여 자료 유형(Resource Type) 을 결정하는 것과 마찬가지로, 인스턴스의 경우도 리더의 정보를 이용하여 간행물의 유형(Instance Type)을 결정한다. 예를 들어 리더 07의 코드값이 a혹은 m이면 단행본(bf:Monograph) 형식 으로 판단하되 이 중에서 리더 19의 코드값이 a일 경우에는 합집(bf:MultipartMonograph) 으로 구분한다. 리더 07은 bf:modeOfIssuance 속성의 값을 결정하는 데에도 사용된다.
인스턴스의 기본적인 속성으로는 표제(bf:instanceTitle), 책임표시(bf:responsibilityState ment), 판사항(bf:edition), 출판사항(bf:publi cation), 내용주기(bf:contentNote) 등이 있으며 MARC의 해당 필드에서 정보를 추출해서 기술한다. 저작의 경우와 달리 인스턴스의 속성 들은 표제와 출판사항을 제외한 대부분의 속성이 문자열(literal)을 속성값으로 갖는다. 인스턴스의 속성 중 일부 속성은 동일한 데이터를 반복적으로 사용하는데, 주로 이용자를 위한 디스플레이의 목적으로 정의된 것으로 보이는 표제정보(bf:titleStatement), 책임표시사항(bf:responsibilityStatement), 판차정보(bf:edition Statement), 제공자정보(bf:providerStatemet) 등에는 변환된 문서의 다른 부분에서 몇 개의 속성과 하위 속성으로 나뉘어 이미 기술된 사항이 반복되는 것을 볼 수 있다.
본 장에서는 실제 MARC 레코드를 BIBFRAME 으로 변환한 사례를 살펴본다. MARC 레코드는 앞서 제시한 매핑 테이블 작성 과정에서 분석한 20여 개의 미국회도서관 레코드 중 BIBFRAME 어휘를 다양하게 보여줄 수 있는 레코드로 선별 하였으며, BIBFRAME으로의 변환은 Bibframe.org 사이트에서 제공되는 MARC/BIBFRAME 비교 서비스(http://bibframe.org/tools/compare/) 를 이용하였다. 이 서비스는 LC 통제번호(LCCN)를 입력하면 해당 MARC 레코드와 함께 변환된 BIBFRAME RDF를 Turtle(Terse RDF Triple Language) 구문으로 출력해서 보여주는 서비스이다. 다음에 제시하는 변환 사례는위 서비스의 출력물을 편집한 것으로, MARC 레코드와의 비교를 용이하게 하기 위하여 RDF 문장의 순서를 MARC 필드의 순서에 따라 재배열하였다. 다만 BIBFRAME에서는 저작 개체에 대한 기술과 인스턴스 개체에 대한 기술 부분이 분리되므로, 각 개체의 범위 안에서 변환 전 MARC 레코드에 대응되는 필드의 순서를 준수하였으며 예시 표의 상단에는 저작에 대한 기술을 하단에는 인스턴스에 대한 기술을 배치하였다. 또한 가독성을 높이기 위해 원본 MARC 레코드에서 불필요하거나 중요도가 낮은 필드(예: 9XX 필드)는 삭제하였고 동일한 패턴으로 변환되는 반복되는 필드(예: 650)는 일부만 남기고 삭제하였다.
MARC 레코드의 변환에 있어서 주목할 점은 단순히 MARC 필드와 BIBFRAME 속성을 매핑하는 것이 아니라, 저작(Creative Work), 인스턴스(Instance), 전거(Authority), 주석 (Annotation)의 개체로 구성된 BIBFRAME 의 모델이 어떻게 구현되고 있는 가 하는 부분이 다. BIBFRAME 모델은 서지 데이터의 링크드 데이터화를 염두에 두고 개발되었다는 점을 감안할 때, 단일 MARC 레코드 내에 혼재되어 있는 각각의 개체들을 식별하고 해당 개체에 대한 정보를 추출하여 재조직함으로써, 추후 이들 개체들에 대한 개별적인 접근과 유기적인 연계가 가능하도록 하는 것이 중요하다. 이러한 개체간의 연결은 링크드 데이터에서 URI 사용을 통해 이루어진다.
현재 Bibframe.org에서 제공되는 비교 서비스 에서는 이름(개인명, 기관명, 회의명 등)이나 주제명 등의 전거형을 bf:authorizedAccessPoint 의 속성값으로 포함시키고, bf:hasAuthority 의 속성값은 MADS/RDF로 변환해서 보여주고 있다. 하지만, 미국국회도서관의 전거데이 터는 이미 링크드 데이터로 변환되어 공개되었으므로, 이미 이들 전거 개체에 대한 URI가 존재하고 추후 URI로의 변환이 가능하다. 아래의 변환 사례에서는 URI를 이용한 개체간의 연결 가능성을 예시하기 위해, 미국국회도서관의 링크드 데이터 서비스(
아래의 예시에서 BIBFRAME 모델의 저작과 다른 개체들(인스턴스, 전거, 주석) 간의 관계를 표현하는 bf:hasInstance, bf:hasAuthority, bf:hasAnnotation 속성은 굵은 글씨체로 표시하였다.
예시 1은 Ronbison Crusoe를 통일표제로 갖는 저작과 그 인스턴스를 보여준다. BIBFRAME 변환결과를 보면 네임스페이스 선언 아래 첫번째 RDF 문장은 URI “
한편 인스턴스에 대한 기술은 비교적 매핑이 간단한데 이는 앞서 매핑테이블에서 본 것처럼 인스턴스와 관련된 속성들이 대부분 문자열 (Literal)을 공역(range)으로 가지며 245, 250, 260, 300 등 MARC 필드와의 매핑이 분명하기 때문이다. bf:hasInstance의 속성값은 인스턴스(bf:Instance) 클래스의 공백노드로, 인스턴스와 관련된 속성과 속성값들은 모두 이 공백노드를 주어로 하는 RDF 문장으로 기술되어 있다. 인스턴스의 경우에도 5장의 매핑 테이블에 제시된 MARC 필드와 BIBFRAME 속성의 매핑뿐 아니라 BIBFRAME 모델 상의 클래스 간의 관계가 변환 결과에 어떻게 반영되어 있는지 살펴보는 것이 중요한데, 특히 저작(Work) 클래스와의 관계뿐 아니라 BIBFRAME 모델에서 소장 정보가 주석(Annotation) 클래스의 일부로 정의되어 있음에 주목할 필요가 있다. 아래 예시에서 인스턴스의 속성 중 bf:instanceOf의 속성값은 저작의 URI를 가지고 있는 것을 볼수 있는데, 이와 같이 하나의 MARC 레코드 안에 포함되어 있는 저작과 인스턴스에 대한 정보가 분리되어 재조직됨과 동시에, 저작과 인스턴스는 두 개체를 연결해주는 속성과 URI를 통해 다시 연계될 수 있다. 또한 소장정보의 경우 bf:heldItem 속성을 통해 주석(Annotation) 클래스의 하위 클래스인 소장자료(bf:HeldItem) 클래스로 연결된 것을 볼 수 있다. 이에 포함된 소장 정보로는 MARC 050 필드의 미국국회도 서관 청구기호를 bf:shelfMarkLcc 속성값으로 표기하고 있다.
예시 2는 통일표제를 갖지 않는 레코드의 처리 방법을 보여준다. 통일 표제가 없을 경우, 저작의 표제(bf:workTitle)는 MARC 245 $a를 사용하며, 이 표제가 저작의 제어접근점(bf:authorizedAccessPoint)의 일부로도 사용 된다. 이렇게 구성된 제어접근점의 경우 연계된 기존의 전거 데이터가 없기 때문에 예시 1과는 달리 저작이 bf:hasAuthority 속성을 가지고 있지 않다. 예시 2에서 주목할 부분은 이 저작이 예시 1의 저작 Robinson Cursoe를 주제로 다루고 있다는 점인데, 주제(bf:subject) 속성값을 살펴보면, bf:authorizedAccessPoint로 기술된 관련 저작의 제어접근점과 bf:hasAuthority의 URI 속성값이 예시 1의 저작의 제어접근점 및 전거 URI와 동일함을 볼 수 있다. 다시 말해, 링크드 데이터로 구현되었을 때 예시 2의 저작과 예시 1의 저작이 URI를 통해 연계될 수 있는 것을 보여준다.
미국국회도서관에서 차세대 서지기술형식으로 제시하고 있는 BIBFRAME은 서지기술의 웹 접근성을 확보하고 도서관의 웹 환경으로의 통합을 목적으로 한다. BIBFRAME은 링크드 데이터 기반 서지기술 프레임웍을 제시하고 있으며 MARC에서 BIBFRAME으로의 전환은 단순한 레코드 형식의 변화에 그치는 것이 아니라 서지기술형식 자체의 변화를 표방한다. 이를 위해 BIBFRAME은 서지레코드 간의 입체적 관계를 표현하고 디지털자료를 포함한 다양한 자료의 수용, 이용자 참여 및 리뷰 등 기존의 서지레코드에서는 제공하지 않았던 데이터 요소의 수용을 원칙으로 한다. 이에 본 연구는 현재 까지 소개된 BIBFRAME 모델 및 어휘를 살펴 보고, MARC21와 BIBFRAME 어휘간 매핑, MARC 목록레코드의 BIBFRAME 전환사례 를 제시함으로써 BIBFRAME 활용방안에 대한 이해를 높이고자 하였다.
BIBFRAME은 기존의 FRBR에서 제시하고 있는 개념모형을 저작-인스턴스 관계로 구분하여 서지데이터상에서 구현이 가능하게 하였으며, 데이터의 시맨틱을 이해할 수 있는 RDF/ XMLDMF을 기반으로 하고 있다. 또한 식별자를 기반으로 하여 웹에서 데이터를 연결하고 식별할 수 있도록 하였으며 주석 개체를 제시하여 이용자 및 외부 기관에서 생산한 정보를 서지데이터상에 제시하고 있다. BIBFRAME은 이러한 노력을 통해 서지데이터의 링크드 데이터로의 활용가능성을 제시하고 다양한 정보를 제공 함으로써 이용자의 정보탐색가능성을 보완하고 있다는 점에서 그 의의가 있다.
그럼에도 불구하고 BIBFRAME은 도서관 서지데이터의 표현형식으로 채택되기 위해 서는 계속적인 후속 연구가 요구된다. 첫째, BIBFRAME은 저작, 인스턴스, 전거, 주석의 개체를 실현하기 위하여 53개의 클래스와 289 개의 속성으로 구성되며 클래스와 속성 역시 계층관계로 구성되어 있다. 그러므로 목록레코드의 표현을 위해서는 BIBFRAME간 어휘 및 클래스간 관계에 대한 이해가 요구된다. 둘째, MODS(Metadata Object Description Schema) 의 경우는 MARC에서 태그를 중심으로 지시기 호와 식별기호가 계층관계를 기반으로 표현하는 반면, BIBFRAME의 경우는 태그 내의 지시기호와 식별기호가 저작이나 인스턴스의 같은 수준에서의 속성으로 제시되는 경우가 있다. 예를 들어, 발행사항은 발행지, 발행처, 발행 년도가 발행속성의 하위속성으로 제시되는 반 면 형태사항의 종별 및 수량, 기타 물리적 특성, 크기 등은 형태사항의 상위요소가 없이 나열되고 있어 가독성이 높지 않으며 레코드의 길이 역시 길어짐을 알 수 있다. 셋째, MARC레코드의 변환 예들을 살펴보면 BIBFRAME에서 제시되는 53개의 클래스와 289개의 속성 중 일부분만이 사용되는 것을 확인할 수 있는 데, 이는 서지기술에서 요구되는 필수 클래스와 속성이 제한적이기 때문이다. 현재 미국국회도서 관에서 제시하고 있는 BIBFRAME 어휘는 필수 및 재량을 제시하고 있지는 않으므로 이를 제시하여 보다 필수요소를 정제해서 표현하도록 하는 가이드라인이 제시되어야 할 것이다. BIBFRAME은 콘텐트 모델에 제한 없이 또는 전자자료 및 비도서를 포함한 다양한 자료유형을 수용할 수 있는 형식을 지향한다. 그러나 현재까지는 대부분 MARC21 포맷을 기반으로 인쇄자료 및 단행본의 BIBFRAME 예들이 제시되고 있으므로 전자자료 및 비도서를 포함한 다양한 자료유형의 BIBFRAME 구현 및 KORMARC과 같은 다양한 MARC포맷의 레코드 변환을 통해 BIBFRAME이 제시고 있는 원칙을 점검해볼 필요가 있다. 또한 본 연구에서 제시한 MARC과 BIBFRAME의 매핑은 BIBFRAME 모델을 구성하는 주요 개체들을 중심으로, MARC 레코드에 출현하는 주요 혹은 필수 요소들과의 관계를 살펴보는 것으로 제한 하였다. 추후 연구를 통해 포괄적인 매핑 테이블 및 변환 예를 제시하여 MARC과 BIBFRAME 의 상호이해를 높이고, 상호운영에 대한 논의가 지속되어야 한다.
1.
[journal]
박, 윤정.
2009
2.
[other]
박, 지영.
3.
[journal]
Fallgren, M., Lauruhn, M., Reynolds, R. R., Kaplan, L..
2014
“The Missing Link: The Evolving Current State of Linked Data for Serials.”
4.
[web]
5.
[journal]
Kroeger, A. L..
2013
“The Road to BIBFRAME: The Evolution of the Idea of Bibliographic Transition into a Post-MARC Future.”
6.
[web]
7.
[web]
8.
[web]
9.
[web]
10.
[web]
11.
[web]
12.
[journal]
Shieh, J..
2013
“A Transformative Opportunity: BIBFRAME at the George Washington University, an Early Experimenter.”
13.
[web]
14. [other] Park, J. Y.. “BIBFRAME Model for the Next Generation Bibliographic Description Format.” Conference of Korean Society for Information Management 101 - 104
15.
[journal]
Park, Y. J..
2009
“The Case and Implication of Web3.0 Information Service.”