자료보존과 매체변환

방준필

 


목차

 1.서론
 2. 자료보존의 필요성
     2.1. 문제의 심각성
     2.2. 훼손의 원인
     2.3. 자료보존 전략
 3. 자료보존 방법
     3.1. 문제해결 방법
     3.2. 형태보존 대 내용보존
     3.3. 보존할 자료의 선택
 4. 매채변환
     4.1. 매체의 결정
     4.2. 매체별 특성
 5. 결론
 


1. 서론

자료를 보존한다는 것은 이용과 상대되는 개념이다. 이는 자료를 철저히 보존하기 위해서는 이용을 제한해야 한다는 의미이다. 그러나 자료는 이용을 시키기 위한 것이다. 따라서 자료보존을 위한 조치는 이용에 차질이 없는 한편 보존으로서의 목적도 달성되어야 한다. 그런데 근래 급격히 발전한 정보과학 기술은 자료보존에 있어서 새로운 방법론을 제시하고 있다. 이러한 배경 하에 본고는 정보과학 기술을 고려한 매체변환에 대하여 논하고자 한다.

우선 자료보존의 개념을 정의하자면, IFLA의 Principles for the Preservation and Conservation of Library Materials에 따르기로 한다.

자료보존(preservation)은 도서관의 자료와 정보를 보존하기 위하여 서고와 시설, 인사, 정책, 기술 및 방법을 포함한 관리·재정적인 모든 문제를 고려한다.

자료보호(conservation)는 도서관의 자료를 훼손, 손상, 부식으로부터 보호하기 위하여 특정 정책 및 실무 외에도 전문가가 개발한 방법과 기술을 나타낸다.

복원(recovery, restoration)은 시간, 이용 그외 다른 요인으로 손상된 도서관의 자료를 수리하기 위하여 전문가가 사용하는 기술과 판단이다.


2. 자료보존의 필요성

2.1 문제의 심각성

미국의 경우 20세기 초반에 인쇄된 책의 대부분이 21세기에는 온전하지 못할 것이라고 한다. 1973년 의회도서관은 전체 1700만 권의 장서 가운데 34%인 600만 권이 완전히 사용 불가능하거나 보수 불가능하게 손상되어 있다고 평가하였다. 예일 대학의 경우 1985년의 조사 결과에 의하면, 표본의 29%라는 많은 양의 도서가 매우 부스러지기 쉬운 종이로 만들어졌으며, 약 37%가 부스러지기 쉬운 종이였으며, 약 83%는 산성지(pH 5.4 이하)였다. 그리고 13%는 즉각적인 처리가 필요했다. 1986년 미국의 전문도서관에서 훼손된 책의 양이 측정되었는데, 30,500만 권 가운데 약 25%인 7,500만 권이 위험한 상태였다.

영국 국립도서관에서 실시한 조사의 결과, 1850년 이후에 간행된 자료의 약 14%는 종이 상태가 좋지 않은 것으로 밝혀졌다. 호주의 경우 1990년 시드니 대학도서관의 학술장서에 대한 조사를 통하여 자료의 12.3%가 매우 부스러지기 쉬운 종이에 인쇄되었음이 밝혀졌다. 다른 조사에서는 부스러진 상태에 있는 자료가 전체의 15%임을 밝혔다. 1985년까지 발간된 3500만 페이지의 뉴질랜드 신문은 전체의 20%인 700만 페이지의 종이가 매우 훼손되어 있어 즉시 마이크로필름으로 제작해야 한다. 인도네시아 도서관의 경우 전체의 40%나 되는 도서가 심하게 훼손되어 있다.

위에서 밝힌 수치는 종이의 훼손상태를 전체 장서에 대한 비율로 나타낸 것으로, 종이가 제작된 시기와 질이라는 변수를 고려하지 않았다. 한 예로서, 위에서 언급한 영국 국립도서관에 대한 조사를 통하여 1880년대와 1890년대에 간행된 도서의 약 40%가 부스러지기 쉬운 종이에 인쇄되었음이 밝혀졌는데, 이는 전제 장서의 약 14%에 불과하다.

2.2. 훼손의 원인

도서관 장서의 훼손은 한 가지 혹은 여러 가지 요인과 그것들의 복잡한 상호작용으로 발생한다. 한 가지 요인이란 종이 자체가 갖는 문제점을 말한다. 이밖에 장서 이용율 증가, 도서관의 신기술 도입과 사용, 환경 요인과 자연재해 등도 훼손요인에 해당한다.

종이의 경우, 전통적인 제지법은 질기고 긴 섬유소를 원료로 사용하기 때문에 종이의 수명이 길다. 1850년 무렵부터 종이를 대량생산하기 위하여 목펄프를 사용하기 시작하였다. 목펄프에는 리그닌이 있어 자외선에 노출되면 종이를 검게 만들고 시간이 경과하면 섬유소를 파괴하여 이산화카본 가스로 만든다. 기계로 연마한 목펄프로 만든 종이는 제지과정에서 섬유소가 잘려 결합력이 약해지기 때문에 부식되기 쉽다. 그 결과 종이가 약해지는 것이다. 목펄프로 만든 종이의 구조적 성질은 제지과정에 첨가되는 화학약품 때문에 더욱 약해진다.

잉크가 번지는 것을 막기 위한 사이징제로서 로진이, 인쇄와 필기에 적합한 색상을 만들기 위한 표백제로서 황산알루미늄이 사용된다. 이러한 첨가제는 종이에 산성 잔류물을 남겨 섬유소를 더 단순한 분자로 만든다. 이러한 현상을 '산성침해(acid attack)'라고 한다. 종이는 빛과 열의 복사 에너지에 노출되어도 섬유소가 파괴된다. 이를 광화학감성이라고 한다.  

도서관 장서 가운데 훼손되는 것은 종이뿐만 아니다. 근래 책을 만드는 데 사용되는 다른 재료도 때로는 유사한 문제를 안고 있다. 제본에 사용되는 가죽, 헝겊 표지, 종이, 실, 풀 등의 재료와 잉크에도 화학성분이 있어 이것들의 상호작용과 종이에 대한 반응으로 훼손된다.

훼손을 야기하는 다른 중요한 원인은 도서관 장서의 이용 증가이다. 여가시간의 확대와 교육열의 향상으로 1945년 이후 도서관 이용이 급증하면서 장서 훼손율이 높아졌다. 도서관계의 최근 경향인 자료공유와 서지 네트워크의 발전도 훼손율을 높이는 데 일조하였다.

도서관에 도입된 신기술이 훼손을 더했다. 가장 명백한 예가 복사기이다. 복사는 자료에 물리적인 스트레스를 가하여 제본을 해체시키며, 훼손율을 높이는 빛을 가한다.

대기오염도 자료를 훼손하는 주요 요인이다. 오염된 대기 속에 농축된 아황산과 산화질소는 종이의 훼손을 가속시킨다. 종이의 마모로 인해 생긴 먼지와 더러운 입자 또한 기계적인 손상을 일으킨다.

홍수, 화재, 지진 같은 재난도 훼손요인이다. 최근에 발생한 재난의 예는 많다. 1986년 로스엔젤레스 공공도서관에서는 40만 권, 1988년 러시아 학술원도서관에서는 40만 권 이상의 장서가 화재로 파괴되었다. '천재지앙'에 속하는 재난은 막을 수 없지만, 다른 것은 적절한 계획과 행동으로 예방할 수 있거나 피해를 최소화할 수 있다.  

마지막으로 인간의 태도도 훼손요인이다. 여기에는 이용자뿐만 아니라 사서도 포함한다.

2.3. 자료보존 전략

자료보존을 위한 전략은 다음과 같다.   

㉮ 우선순위를 정한다.
  ① 자료 모두를 물리적으로 구하기는 어려우므로 무엇을 먼저 보존할지 우선순위를 정해야 한다.
  ② 복원할 수 없는 자료는 마이크로필름 같은 매체로 옮긴다.
  ③ 매체의 성질을 변경한다. 예를 들면, 화학처리법으로 제작되는 종이를 더 견고하고 안전하며 수명이 연장되도록 한다.

㉯ 전략은 각기관의 목적에 부합해야 한다.

㉰ 자료를 경제적으로 대량 처리하는 방법을 개발하는 것도 원칙이 된다.   

㉱ 자료보존은 더이상 전문가의 업무가 아니라 직원 모두의 일이다는 원칙이 수립되어야 한다.  여기서 필요한 것은,
  ① 도서관의 모든 업무에 그러한 과정을 거치도록 하는 데 드는 시간,
  ② 업무를 수행하는 직원들의 의지.
  ③ 상급 관리자로부터 기획과 개발을 하기 위한 인사와 예산 지원.
여기서 추가적인 인원보충이나 전문적인 기술이 반드시 필요한 것은 아니다.  

㉲ 보존에 있어서 협동은 필수적이다. 도서관 자원을 보존하는 일을 하는 관계자는 모두 협동해야 한다.

㉳ 예방차원과 복원차원으로 구별한다. 예방차원의 방법은 최근 보존문제를 해결하는 데 있어서 가장 의미있고, 비용 대 효과도 높아서 중요하다. 또한 자료에 훼손된 부분을 보완하거나 보수하기보다는 더 이상 훼손되지 않도록 최소한의 변화를 가함으로써 보호하는 것이다.  

㉴ 교육과 훈련이 문제를 해결하는 중요한 역할을 한다. 도서관의 모든 업무에 보존을 반영시킴으로써 문제를 해결하는 것이 중요하다. 이 방법을 성공시키기 위해서 도서관의 모든 직원은 자료보존을 항상 의식하고 있어야 하며, 자료보존 교육과 훈련을 받아야 한다. 교육과 훈련의 기회를 넓히는 것은 성공을 보장하는 방법이다. 모든 사서는 자료보존에 대하여 알아야 하며, 이를 위한 전문교육을 받아야 한다.


3. 자료보존 방법

3.1. 문제 해결방법

보존문제를 해결하기 위한 방법으로는 도서관에서 즉시 수행할 수 있는 '하우스키핑' 성격의 방법, 재난대책과 관련한 방법, 정보를 다른 매체로 옮기는 방법, 협동이나 대규모 기술을 요하는 방법 등의 네 가지가 있다.

㉮ '하우스키핑' 방법은 보존원칙을 도서관의 일상업무에 반영함으로써 영향을 준다.  

㉯ 재난대책(재난대처계획, 사고대책, 비상대책)은 도서관에서 발생하는 재난의 원인을 밝히고 그것의 발생 가능성을 줄이거나 피해를 최소화하는 방법을 포함한다. 화재와 수해를 입은 도서관 자료를 복원하는 효과적인 기술도 개발되었다.

㉰ 자료보존을 위하여 다른 매체로 옮기는 기술로는 복사, 마이크로폼 제작, 디지털 데이터 변환 등이 있다. 이 가운데 마이크로폼 변환이 자료보존에 가장 확실하며, 복사는 제한적인 보존을 위해서 이용된다. 디지털 데이터의 경우는 새로운 자료보존의 대안으로 제시되기도 하지만 보존보다는 이용을 목적으로 개발된 기술이다.  

㉱ 협동이나 대규모의 기술을 이용하는 방법으로는 효율적인 서지 시스템, 보존용 복본 등록, 대량탈산처리법, 불변지의 사용과 지역적 협동 등이 있다.  


3.2. 형태보존 대 내용보존

자료보존을 위해서는 자료의 지적 속성과 물리적 속성 가운데 무엇을 보존할지 정해야 한다. 여기서 지적 속성은 텍스트와 의미에 있지만 물리적 속성은 구성, 재료 그리고 디자인을 의미한다. 책의 내용(지적 속성)을 보존하려면 복사나 마이크로필름 제작 또는 카세트 테이프에 본문을 녹음하는 것으로서 충분하다.  

형태 자체(책의 물리적 속성)를 보존하려면 어떤 처리를 가해야 한다. 종이의 산성을 제거하여 이용에 지장이 없도록 강화시키고, 제본을 보완하거나 주문 제작한 박스에 넣어야 하기도 한다. 형태보존은 자료가 오래되었거나 미적인 가치가 있거나 희귀하거나 역사적인 의의가 있거나 재산 가치가 높다는 등 특별한 가치를 가질 때 대개 선택된다. 그러한 기준은 정의하기도 어렵고 적용하기도 어렵다. 어떤 경우는 실물이 갖는 서지적인 중요성 때문에 보존되기도 한다.

형태보존은 가능한 한 오랫동안 보유해야 할 법적 및 도덕적 책임이 있는 국보급 장서에 적합하다(법원 기탁장서를 예로 들 수 있다). 대부분의 도서관은 자료의 이용 자체가 우선이며, 형태보존은 대체로 예산을 고려하여 결정한다. 훼손되고 있는 자료의 내용을 이용할 수 있는 가장 저렴한 방법은 무엇인가? 형태 자체가 갖는 가치는 보존 여부를 결정하는 이유가 될 수 있다. 형태보존의 과정에서 최소한의 변화를 가해야 한다. 즉, 자료를 원본 상태 그대로 유지하는 것이 중요한 것이다. 마지막으로, 처리를 가한 자료는 처음 상태로 완전히 되돌릴 수 있어야 한다. '문헌에 손상을 입히지 않고 원래 상태로 되돌릴 수 없다면 아무 일도 하지 말라'는 말이 있다.

3.3. 보존할 자료의 선택

모든 자료보존 프로그램은 보존할 대상을 정해야 한다. 이는 도서관 자료를 다음 세대에도 이용할 수 있는지 결정하는 것이다. 도서관에서는 이것이 대개 도서선정의 첫 번째 단계에서 결정된다. 이 과정에서 적용되는 선정기준은 장서로서 적절하고 현재 유용하거나 장래 유용한 자료인지의 여부이다. 그리고 더 나아가 이러한 자료를 보존할 것인지 고려하여야 한다.
  이러한 결정을 하려면 다른 사항을 고려해야 한다. 훌륭한 서지통정은 지역 수준에서 장서에 무엇이 있는지 알기 위해(예를 들면, 특정 자료가 복본으로 소장되어 있다면 보존하지 않는다), 그리고 국가적 수준에서(같은 자료를 보존하기 위해 중복 투자하지 않는다) 필수적이다. 또한 대체품을 - 리프린트이든 마이크로필름이든 - 입수할 수 있는지 확인하는 데에도 필수적이다.


4. 매체변환

4.1. 매체의 결정

매체 변환이 가능한 방법은 복사, 마이크로필름, 디지털화이다. 이러한 매체로 변환할 때 고려해야 할 사항은 다음과 같다.

㉮ 변환의 목적 즉, 변환 후 원본을 버려도 되는지 또는 특별한 물리적 가치가 있어 원본을 다른 곳에 보관해 두고 증빙이나 참고용으로 이용할 것인지의 여부이다.

㉯ 이용자의 요구와 관련된 것으로, 이용자가 새로운 매체에 얼마나 쉽게 접근할 수 있는지, 얼마나 신속하게 정보를 찾을 수 있는지, 그 아이템이 얼마나 많이 이용되는 자료인지 등이다.

㉰ 기술적인 문제. 새로운 포맷으로 변환한 자료의 수명, 저장과 이용을 위한 광학적 환경상태, 변환의 범위도 고려한다. 예를 들어, 자료 접근을 위한 하드웨어가 노후한지, 자료의 변환이 적정 기준에 맞는지 등이다.

㉱ 비용문제. 자료의 변환비용, 새로운 자료의 저장, 유지, 목록작성에 관련된 비용 등이다.

4.2. 매체별 특성
 
가. 복사

복사는 자료의 지적인 내용만을 보존하는 경우에 사용한다. 이에 따른 비용요인은 복사용지, 복사기 운영비, 인건비 및 제본비 등이다.

㉮ 복사는 작은 자료를 복사하는 데 가장 적절하다.
㉯ 복사본은 마이크로필름보다 이용하기 쉽고 이용자의 거부감도 덜하기 때문에 이용율이 높은 자료에 적합하다.
㉰ 복사는 색상이 있는 자료나 고품질의 흑백 일러스트레이션 자료에는 적합하지 않다.
㉱ 원본과 똑같거나 비슷하게 만들 수 있다. 예를 들면, 원본과 똑같은 크기로 복사하여 제본할 수 있다.
㉲ 부정적인 측면은 다음과 같다.

① 복사과정에서 약한 자료에 손상을 가한다. 이는 복사 후 원본을 버려도 되는 자료인 경우에는 문제가 되지 않지만 원본을 보존해야 하는 경우에는 큰 해를 끼친다.    
② 복사로는 마스터 카피를 생산하지 못한다는 점이다.  물론 안전한 장소에 보존하기 위한 복사본과 이용을 위한 복사본을 만들 수는 있다.  
③ 면수가 많은 자료의 경우에는 비용이 많이 든다는 것이다. 특히 제본비나 보호용 봉함 제작에 들어가는 비용을 고려해야 한다.
㉳ 해결되어야 할 사항은 표준의 개발, 마스터카피의 생산과 보관, 그리고 이들에 대한 서지통정 등이다.

나. 마이크로폼

마이크로필름은 수명이 입증되었기 때문에 자료보존을 위해 가장 많이 이용되고 있는 포맷이며, 디지털 매체가 등장하였더라도 존속할 것이다.  

(1) 포맷과 필름의 형태

마이크로폼에는 마이크로필름과 마이크로피쉬가 있으며, 영상이 축소되어도 고품질을 유지한다. 최근에는 마이크로피쉬가 주목을 받고 있다. 마이크로 필름은  35mm와 16mm가 있는데 전자가 표준이며, Silver-Gelatin, Diazo, Vesicular 등 세 가지 형식이 있다. 반영구적으로 오랫동안 자료를 보존하기 위해서 표준으로 채택한 것은 Silver-Gelatin 형식이다. 그러나 이것은 곰팡이, 물, 기계적 마찰로 손상되기 쉽기 때문에 보관과 취급에 주의를 요한다. 작업용으로는 Silver-Gelatin을 사용하지만, 일상적인 이용에 내구력이 강한 것은 Diazo나 Vesicular 형식이다. Diazo나 Vesicular 형식은 Silver-Gelatin 형식보다 비용이 저렴하고 긁힘에 대한 저항력도 강하다.
     
(2) 평가

마이크로필름을 제작하는 장점은 다음과 같다.
  ㉮ 비용이 저렴하다.
  ㉯ 내구성에 있다. 특히 마이크로필름의 수명은 표준에 따라 적절히 작업한다면 100년 이상이다.
  ㉰ 공간을 절약한다. 연속간행물인 경우는 특히 그러하다.
  ㉱ 한번 마스터가 생산된 뒤에는 저렴하고 손쉽게 복사할 수 있다.
  ㉲ 마이크로필름에 접근하는 장치는 간단한 광학장치이다. 그것은 고도의 기술을 요하는 것도 아니고 짧은 시간에 사라지는 것도 아니다. 광디스크의 포맷에 필요한 기술과 그것을 컴퓨터 데이터로 변환시키는 기술과 같이 간단하다.

마이크로필름에도 다음과 같이 바람직하지 않은 면이 있다.
  ㉮ 장비가 고가이다.
  ㉯ 이용하기가 상대적으로 불편하다.  
  ㉰ 부주의하게 보관하거나 취급하면 쉽게 손상된다.  

마이크로필름으로 변환하기에 가장 적합한 자료는 부서지기 쉬운 책과 팜플렛, 신문, 저질 종이로 인쇄된 연속간행물, 통계자료, 스크랩북, 수직으로 세워두는 파일자료, 정부간행물 기타 원고본 등이다. 또 마이크로필름으로 제작하기에 적합하지 않은 것으로는 특히 컬러로 된 삽화, 자료 자체가 가치가 높은 것, 영상과 그 배경의 대비가 희미한 자료 즉 색이 바랜 자료, 그리고 상업용으로 제작된 마이크로필름 자료들이다. 자료를 보존하는 데는 경제적·기술적으로 마이크로필름 제작에 대신할 만한 다른 대안이 없다.

(3) 마이크로필름의 제작단계

마이크로필름 제작은 선택, 원본의 준비, 촬영, 필름 처리 및 검사 등의 단계를 거친다. 선택은 <3.3> 단계에 적용된다. 준비단계에는 물리적 준비와 서지적 준비가 있다. 물리적 준비는 아이템이 마이크로필름 제작대상인지의 확인, 제본 해체, 해당 페이지 청소, 찢어진 종이의 보수 등이다. 서지적 준비는 해당 아이템에 대한 서지기록 작성, 서지 변경사항 확인(변경대상 타이틀, 마이크로필름의 상세사항, 제작자에 대한 정보, 정기간행물의 타이틀 변경), 서지사항 촬영 등이다.  

  필름의 처리는 원판 마스터의 수명을 결정하는 데 중요한 역할을 한다. 현상은 사진 처리과정과 같이 metallic silver image가 티오황산염이 들어 있는 용액에서 고착되는 과정이다. 현상과정에서 고착하는 용액을 완전히 씻지 않으면 티오황산염이 남아 영상을 얼룩지게 하거나 흐릿하게 만든다.
  현상된 필름에 대한 검사 역시 필름 제작과정에서 중요한 부분이다. 화학적 안정성 테스트와 함께 긁힘이나 마멸 같은 물리적인 문제가 있는지 또는 리딩의 밀도는 적합한지, 서지적으로 완벽한지 즉, 누락된 페이지는 없는지 등을 알아보기 위해 필름의 물리적 검사도 해야 한다.

(4) 마이크로필름 제작 프로그램의 수립

처음에 결정할 사항은 마이크로필름을 자체적으로 제작할 것인지 용역으로 할 것인지 정하는 것이다. 마이크로필름 제작장비를 도서관에 설치한다면,
㉮ 필름 제작작업을 면밀히 감독할 수 있고 자료의 보안을 유지할 수 있다.
㉯ 많은 경비(카메라와 필름 처리장비, 연결장비, 마이크로필름 리더, 실험장비 등의 기본시설이 필요함)를 지불해야 한다.

마이크로필름 제작업체와 계약을 하는 경우에는,
㉮ 특수한 장비나 인력을 투입하지 않아도 된다.
㉯ 자료에 대한 보안이 취약하다.
㉰ 약한 자료를 운반하는 과정에서 훼손되기 쉽다.
㉱ 작업과정을 감독하기 어렵다.

(5) 마이크로필름 마스터의 보관
마이크로필름 마스터를 잘 보관해야 한다. 마스터의 수명을 가능한 한 오랫동안 보장하기 위해서는 최신 표준을 따라야 한다. 최근에 나온 호주의 표준(AS3674 -1989)에 의하면;  
㉮ 온도는 21℃ 이하, 상대습도는 20% - 40%, 기압은 약간 높아야 한다.
㉯ 먼지는 필터를 통하여 배출되어야 하며 모든 기체는 제거되어야 한다.
㉰ 빛의 밝기 특히 자외선은 가능한 한 낮게 유지해야 한다.
㉱ 릴이나 용기는 품질이 좋아야 하며 선반이나 캐비넷의 재질은 불연성이어야 한다.  

마이크로필름 제작시 마스터 외에 열람용으로 복사본을 제작하여 이용시킨다. 이 열람용 필름은 마스터와는 달리 보관하는 데 엄격한 조건이 필요하지 않으며, 손상되면 마스터로부터 다시 복사할 수 있다.

(6) 마이크로필름의 역사 : http://www.kmicro.co.kr/마이크로필름소개.htm

(7) 장비 : 카메라, 스캐너, 현상기, 리더, 복제기, 검사기, 농도계, 리더프린터
            (예 : http://www.voimtech.com/korea/main.htm / http://sungwoodms.co.kr)

다. 디지털 데이터

(1) 특징

㉮ 복제가 신속하고 자료의 훼손 없이 전자통신 네트워크를 통하여 이용자에게 신속히 전송된다.
㉯ 저장공간이 적다.
㉰ 여러가지 다양한 매체로 저장될 수 있으며 저장매체 간의 변환도 가능하다.
㉱ 검색과 정보접근이 빠르다.
㉲ 원본의 사용빈도를 줄이고 다른 여러 곳에 복본을 보관할 필요성을 없앰으로써 자료보존에 도움이 된다.  

디지털 데이터의 문제점을 열거하면 다음과 같다.
㉮ 데이터를 저장하는 방법, 즉 솔루션의 개발속도 및 보급(범용성), 표준성
㉯ 데이터 저장에 이용되는 매체의 수명   
㉰ 장비의 노후화
㉱ 데이터의 안전으로, 우연이나 고의에 의한 데이터의 손실
㉲ 저작권과 관련한 문제
㉳ 마이크로필름이나 디지털 데이터로 변환하는 비용의 문제
㉴ 도서관 및 사서에 대한 평가, 인식

(2) 변환방식

디지털 데이터로 변환하는 데 있어서 고려해야 할 사항은 어떤 파일 형식으로 제작할 것인지를 결정해야 한다. 즉, 이미지 형태 혹은 텍스트 형태의 파일 형식의 선택이다. 도서관 장서 가운데 원문을 이미지 형태로만 변환할 경우가 많을 것이다. 텍스트 파일을 입수할 수 있다면 텍스트 형태로 혹은 텍스트 형태와 이미지 형태로 동시에 구축할 수 있다.  

* 이미지 형태

원본을 스캐닝하여 이미지 형태로 변환할 경우 텍스트 형태보다 파일의 크기가 크고 구축비용이 높고, 내용을 검색할 수 없는 단점이 있다. 원문의 모습을 그대로 전하기 때문에 인용면에서 장점이 있으며, 범용성이 뛰어난 솔루션이 이미 개발되어 있다.

이미지를 저장하는 압축방식에 따라 파일 형식이 정해지는데, JPG와 TIFF 형식이 많이 사용된다. JPG는 JPEG(Joint Photographic Experts Group)라고도 하는데, 문헌을 스캐닝하면 페이지 수만큼의 파일을 생성한다. 이 경우 한 타이틀을 구성하는 많은 파일을 관리해야 하는 단점이 있지만 웹브라우저 상에서 직접 볼 수 있는 장점이 있다.

TIFF(Tagged Image File Format) 형식에는 JPG처럼 한 페이지를 각각 파일로 저장하는 Single TIFF와 전체 페이지를 하나의 파일에 저장하는 Multi TIFF가 있다. Multi TIFF는 이미지 정보에 목차, Page Matching 정보 등의 표시가 가능하며, 이미지 원문에서 처리하기가 불가능한 목차정보를 텍스트로 처리할 수 있다. 따라서 이미지 형태로 구축하는 데 있어서 Multi TIFF 방식이 선호되고 있다. TIFF 방식의 데이터는 웹 브라우저 상에서 직접 볼 수 없기 때문에 전용 뷰어를 별도로 제공해야 한다.  

이미지 파일의 범용성을 높이기 위하여 TIFF 파일을 PDF (Portable Document Format) 형식으로 변환하는 방법도 있다. PDF가 텍스트 파일뿐만 아니라 이미지 파일을 수용하고, 마크업 기능 등의 편집이 가능하기 때문에 근래 널리 사용되고 있다. (참고 : http://www.korea.adobe.com/products/acrobat/overview1.html )

* 텍스트 형태

근래 제작되는 자료는 컴퓨터 상에서 작업이 이루어지는 경우가 많아 내용을 파일로 입수하여 텍스트 형태로 구축할 수 있다. 내용의 수정, 조작 가능성이 있으므로 내용의 완전성이 보장되어야 한다. 인쇄본의 모습을 완벽하게 재현하지 못할 수 있다. 이는 화면상의 디스플레이 문제와 텍스트의 편집 과정이 포함되기 때문이다. 따라서 문헌의 인용시 이미지 형태처럼 출처의 정확성을 나타내지는 못한다.
  이러한 단점에도 불구하고 텍스트 형태로 변환하는 것은 장점이 크기 때문이다. 텍스트 형태의 데이터는 화면에 디스플레이되거나 프린터에 출력될 경우 미려하다. 방법에 따라 변환비용이 상대적으로 저렴하고, 파일 저장용량이 작고 이미지 파일에 비해 전송속도가 빠르다. 그리고 내용 전체를 대상으로 검색이 가능하다는 점이 가장 큰 장점이다. 텍스트 형태로 구축하는 데 있어서는 융통성이 많다. 이는 어떤 파일 형식이든 전문이 확보되어 있는 한 필요시 파일을 변환하여 서비스 방법을 개선할 수 있기 때문이다.

파일 형식에 대해서는 인터넷 상에서 이용되는 것을 고려하면 다음과 같다. 웹 브라우저 자체가 지원하는 파일 형식은 HTML과 TXT인데, 우리가 웹 브라우저로 보는 것은 대부분 HTML 파일 형식으로 제작된다. 워드프로세서 파일을 HTML이나 TXT 파일 형식으로 변환하면 원문의 모습을 완벽하게 재현하지 못하기 때문에 인터넷 상에서 원문의 모습을 잘 나타내도록 지원하는 파일 형태로 변환하는 것이 일반적이다. 여기에 해당하는 파일 형태가 SGM이다. SGM 파일은 텍스트 파일을 SGML 규정에 따라 편집하여 만든 것이다.
  SGML(Standard Generalized Markup Language)은 ISO에서 정한 문서 표현 기준으로 제정된 것으로 DTD(Document Type Definition)에 따라 문서의 구조를 지정하는 마크업 언어이다. 웹 브라우저가 사용하는 HTML (HyperText Markup Language)언어는 SGML을 기반으로 한 언어의 일종이다.  
  SGML로 구축된 전문DB는 국립중앙도서관, 국회도서관, 한국과학기술원 과학도서관, 한국과학기술원, 연구개발정보센터 및 한국학술진흥재단 등의 5개 기관에서 공동으로 '97년도에 시행한 전자도서관 시범사업에서 볼 수 있다. SGML 파일로 변환하는 데에는 변환결과를 검증하는 시간과 노력이 많이 필요하다. 따라서 원문을 완벽하게 재현하는 SGML 자동변환기가 개발되기 전에는 많은 양의 학위논문을 전문DB로 구축하기는 현실적으로 어렵다. SGML의 대안으로 SGML과 HTML의 중간 성격을 가진 XML 방식을 고려할 만하다.

XML(Extensible Markup Language)은 WWW, 인트라넷 등에서 정보 포맷을 생성하고 포맷과 데이터를 공유하는 도구로서, 현재 WWW 컨소시움에서 웹의 유용성을 높이기 위하여 공식적으로 권하고 있다. XML은 문헌이나 파일을 기술하는 마크업 기호를 포함하기 때문에 웹 페이지, HTML 등의 언어와 유사하다. 그런데 HTML이 웹 페이지의 내용(문장과 그림의 배열, 관계)을 기술하는 데 비해 XML은 데이터가 기술되는 용어로 내용을 기술한다. XML이 SGML과 HTML의 단점을 극복하기 위하여 개발되었으므로 이에 대한 기대감은 높지만 아직은 국내 한글 환경에서 널리 사용되고 있지 않다. (참고 사이트 : http://sookmyung.ac.kr/~ksh/research.htm / http://user.chollian.net/~rapsodie/main.html )

근래 급속히 보급되고 있는 파일 형식인 PDF(Portable Document Format)는 모든 컴퓨터 시스템 환경에서도 전송과 읽기가 가능하도록 지원되는 포맷이다. PDF는 페이지 포맷정보, 이미지를 포함하기 때문에 텍스트 파일과 이미지 파일 모두를 PDF 파일로 변환할 수 있다. 북마크, 하이퍼링크, 전문의 내용 검색 등이 가능하다.  

워드프로세서 파일을 다른 형태로 변환하지 않고 그대로 DB로 구축하는 방안도 있다. 이러한 방법은 비용이 저렴하지만, 여러 가지 파일 형식의 데이터를 하나의 뷰어로 볼 수 없는 이용상의 문제가 있다. 따라서 도서관의 홈페이지에서 파일 형식을 지원하는 전용 뷰어를 각각 제공하거나, 이용자가 파일을 전송받아 개인 PC에서 해당 워드프로세서로 보는 수밖에 없다. 후자의 방법은 전자도서관의 서비스로서 적합하지는 않지만, 임시방편으로 일시 사용할 수는 있을 것이다.   

(3) 저장 매체

* 광디스크

이 포맷을 보존목적으로 이용하는 문제에 대해서는 그간 많이 연구되어 왔지만, 현재로서는 보존매체로 활용하는 데 적지 않은 불이익이 따른다. 이 기술은 아직 완전하지 않고 표준이 없으며, 영속성과 기술의 퇴화가 가장 중대한 문제점이다.
  광디스크는 레이저 기술을 이용하여 아날로그와 디지털 모두를 얇은 금속판 위에 일련의 홈(pit)을 만들어 놓은 것이다. 이 금속판은 두 개의 투명한 층과 그 위에 있는 정보를 레이저가 읽는데, 금속판의 물리적 접촉은 이루어지지 않는다. 데이터의 저장 용량은 매우 크고 내용과 그래픽이 압축된 형태로 되어 있다. 도서관에서 이용되는 광디스크의 가장 흔한 예로는 콤펙트 디스크와 CD-ROM이며 더 큰 사이즈로는 비디오 디스켓이 있다.
  광디스크는 디지털 데이터를 저장하는 데 이상적인 매체이다. 이것은 압축 저장되며 정보 저장량이 크다. 기술개발로 광디스크에 저장된 정보에 신속히 접근할 수 있다. 그러나 여러 가지 긍정적인 면에도 불구하고 조심스러운 것은 영구성이 확실하게 보장되지 않기 때문이다. 도서관 자료보존에 이용되는 광디스크는 현재는 이용도가 높은 장서 가운데 부서지기 쉬운 원본을 대신 이용시키기 위하여 사본으로 제공하는 데 한정되어 있다.   

* 마그네틱 매체

디지털 데이터는 전통적으로 1/2인치 테이프에 저장되었다. 현재 사용되고 있는 다른 마그네틱 매체는 마그네틱 디스크('하드' 또는 플로피 디스크)와 마그네틱과 광기술을 합성한 마그네틱-광디스크(magneto - optical erasable disk)가 있다. 마그네틱 매체는 열, 빛, 습도(또는 습도 부족), 자기, 먼지에 약하고 삭제될 위험이 크다. 마그네틱 테이프가 특히 민감하므로 데이터의 완벽성을 확보하기 위하여 높은 수준의 관리가 필요하다. 테이프는 정기적으로 되감아 데이터를 신선하게 유지해야 한다. 영국의 표준(British Standard B.S4783 part 2 1988)은 되감기 주기를 매6개월로 권하고 있다. 장비는 정밀하게 유지해야 한다. 데이터는 접근을 보장하기 위하여 다른 최신 매체를 이용하여 몇 단계로 변환시켜야 한다.

* 기타 매체

자료를 저장할 수 있는 매체는 계속 개발되고 있다. 실험단계에 있는 것이 있지만 최근 소개된 것으로는 디지털 비디오테입, 디지털 오디오테입, 디지털 페이퍼, 반도체 등이 있다. 이것은 미래에 반도체 메모리 비용이 감소하고 새로운 기술이 개발되면 이용할 수 있는 방법이 될 것이다.
  이밖에도 두 가지 리포맷팅 방법이 더 있는데, 출판과 전사가 그것이다. 그중 어느 것도 일반화된 것은 없다. 출판은 아이템이나 텍스트를 편집하여 복제하는 것이다. 복제 출판은 원고나 원고의 첨부물 혹은 추가적인 증빙자료를 보존하기 위한 것이다. 출판은 비용이 많이 들기 때문에 판매 가능성이 있는 것만 대상으로 한다.
  텍스트를 타이핑이나 워드프로세서로 전사하는 것은 과거에 자주 시행되었다. 족보와 원고본이 그 예에 해당한다. 이것은 노동집약적이며 전사시 실수가 발생할 가능성이 높기 때문에 도서관의 보존문제를 다루는 기술로서는 중요한 수단이 못된다.

 

5. 결론

자료의 보존과 이용은 상반된 개념이긴 하지만, 매체변환은 자료의 보존과 이용의 효과를 동시에 기할 수 있다. 매체변환은 마이크로필릌과 디지털 자료의 형태로 제작하는 방법을 대표적으로 거론할 수 있다. 마이크로필름은 자료보존의 성능이 이미 검증되었기 때문에 외국에서 널리 사용되었으며, 국내에서도 일찍부터 사용되고 있다. 디지털 자료의 경우 근래정보화 추진정책과 디지털 도서관의 보급으로 많이 제작되고 있다. 엄격하게 구분한다면 디지털 자료는 이용 편의를 위해 제작되는 단계라고 할 수 있다. 이는 마이크로필름처럼 오랜 기간 동안 자료보존의 효과가 있는지 검증되지 않았기 때문이다.

현재 시점에서 자료보존을 위한 방법으로 매체변환을 한다면 원본을 마이크로필름과 디지털 자료로 동시에 제작함으로써 보존과 이용의 효과를 함께 기하는 것이다. 이렇게 하는 데 있어서 비록 비용부담이 되겠지만 미래의 불확실함에 대하여는 보장받을 수 있다.

 

참고문헌

권기원, 이종권, 방준필 공역,  자료보존론, 사민서각, 1999.  
권기원, 자료보존 환경에 관한 연구, 성균관대인문과학 30(2000.2) : pp.123-141
김정혜 譯, 미래를 위한 정부자료 보존, 국회도서관보 258(”98.4) : pp.79-82
방준필 譯, 자료의 보존, 도서관 332(”94.9) : pp.85-92
윤대현 譯, 종이의 열화와 자료보존, 기록보존 10(”97.12) : pp.179-207
이종영, 정보의 디지털화와 매체변환 기술, 디지틀도서관 14(”99.6) : pp.80-87
주영주, 기록 보존 수단으로써의 마이크로 폼 자료에 관한 연구, 이화여대 한국문화연구원논총 58(”90.12):pp.371-390