내용 |
유럽 지역 도서관의 신문 디지털화의 범위는 어느 정도일까? 신문 기사를 종합하고 정리하여 온라인에서 무료로 제공하기 위한 ENP( www.europeana-newspapers.eu )의 일환으로, 유럽연합 도서관은 2012년까지 유럽의 국립ㆍ연구ㆍ공공 도서관에서 모든 신문 컬렉션 디지털화의 확인 및 분석을 위한 조사에 착수했다. 조사는 신문명, 날짜 범위, 메타데이터, 데이터 분배력, 디지털화 품질에 대한 12가지 항목으로 이루어졌으며, 새로운 파트너를 확인하는 효과도 있었다. 실시된 조사에 대한 결과는 다음과 같다. 디지털화 된 신문을 무료로 이용할 수 있다. 47개 도서관 중 최소 40곳(85%)에서 디지털화 된 신문을 무료로 이용할 수 있다. 1개 기관은 경우에 따라 비용을 지불해야 했으며, 다른 3곳은 이용자를 위한 구독 서비스를 제공하고 있었다(즉, 1일 또는 1달 이용요금). 4개 도서관은 자관 신문 기사 열람을 학교 및 대학을 대상으로 허가하고 있었다. 디지털화된 신문(20세기)을 이용하는 데에서 문제가 발생한다. 조사 대상 도서관의 절반 이상(27개, 57%)이 웹에서 디지털화 된 신문을 발행하지 못하는 기한을 적용하고 있다. 대부분이 70년을 자동으로 적용하고 있으며 즉, 1942년 이후에 발행된 신문 기사는 디지털로 이용할 수 없음을 의미한다. 또한 23%(47개 중 11개)의 도서관은 저작 권리 단체와의 협약으로 디지털화 된 신문을 이용할 수 있게끔 하고 있으나, 오히려 협약된 컬렉션보다는 개별 제목으로 제한하고 있다. 자유롭게 이용 가능한 신문기사를 악용할 소지가 있다. 조사 대상 도서관의 36%(17개)가 광학 문자 인식(Optical Character Recognition, OCR) 양식을 사용하고 있지 않았는데, 이는 검색으로 신문 기사의 전문을 검색할 수 없다는 것을 의미한다. 또한 64%가 OCR을 사용한 반면, 36%는 뷰어를 통해 전문을 제공하고 있었다. 이는 OCR 텍스트 품질을 신뢰하지 않는다는 의미로 받아들여진다. 또한 36%의 도서관은 구역화 및 세분화를 수행했고, 6개(13%)의 도서관은 패싯 검색이나 장소, 이름, 단체 브라우징을 제공했다. 협약 도서관 ENP는 네트워크 확장을 위한 노력을 계속하고 있다. 협약을 맺은 도서관과 도서관 네트워크에 세미나 및 교육 프로그램 등을 제공하고, 유로피아나 재단으로부터 콘텐츠를 제공받을 수 있다. 조사를 진행하는 동안 35개의 도서관이 협약 도서관에 참여할 의사를 보였다. 협약 도서관은 다음과 같다 : - 체코 국립 도서관 - 웨일즈 국립 도서관 - 슬로베니아 류블랴나 대학 및 국립 도서관 - 포르투갈 국립 도서관 - 아이슬란드 대학 및 국립 도서관 - 스페인 국립 도서관 - 크로아티아 자그레브 대학 및 국립 도서관 - 벨기에 국립 도서관 - 성 치릴로 성 메토디오 국립 도서관(불가리아) - 룩셈부르크 국립 도서관 - 루치안 블라가 중앙 대학 도서관(루마니아, 클루지나포카) 조사 참여 도서관은 다음과 같다 : - 베를린 시립 도서관 - 네덜란드 국립 도서관 - 에스토니아 국립 도서관 - 호주 국립 도서관 - 헬싱키 대학 및 핀란드 국립 도서관 - 함부르크 시립 및 대학 도서관 - 프랑스 국립 도서관 - 폴란드 국립 도서관 - CCS 콘텐츠 컨버전 전문가 - 유럽연합 도서관 재단 - 라트비아 국립 도서관 - 터키 국립 도서관 - 베오그라드 대학 - 인스부룩 대학 - 프리드리히 테스먼 도서관 - 영국 도서관 - 샐포드 대학 - 유럽 연합 도서관 * Europeana Newspaper Project 란? 개요 2012년 2월 18개 유럽 국가 기관이 모여 3년 이후 1800만 개의 신문 페이지를 유로피아나에서 서비스하는 것을 목표로 “Europeana Newspaper' 프로젝트에 착수했다. ENP는 유럽연합 도서관을 통해 신문을 집대성할 예정이며, 프로젝트에 참여하는 각 도서관은 디지털화 된 신문의 전문을 합법적인 절차를 통해 유로피아나에서 서비스할 수 있도록 지원할 것이다. 또한, 프로젝트는 신문 디지털화와 관련된 문제들도 다루고 있다. - OCR, OLR/기사 분할에 대한 상세 검색 방법 중 하나를 사용하여 개체명 인식(NER), Europeana 고객을 위한 검색과 프리젠테이션 기능을 향상시키는 페이지 클래스 인식 - 자동 상세 검색 기능의 품질 평가 - 유로피아나 데이터 모델에 따른 로컬 데이터 변환 - 공공 및 민간 부문 실무자들과의 긴밀한 협력을 통한 메타데이터 표준화 주요 활동 디지털화 신문의 상세검색 주요 목적은 일반 집계 과정의 일환으로 이미 디지털화 신문 페이지를 개선하고 수정하는 것이나, 약 10만 페이지의 전문에서 관련 메타데이터 및 개체명(개인, 지역 이름 등)이 자동으로 유로피아나에 감지·태그·산출되게 된다. 이런 방식으로 유로피아나를 통해 신문을 검색함으로써 현재의 솔루션을 향상시키게 될 것이다. 평가 및 품질 평가 프로젝트를 통해 신문 디지털화에 대한 평가 및 품질 평가에 대한 인프라 개발을 기대해 볼 수 있다. 첫 번째 중요한 작업은 정확성 요구 및 세부사항, 속도, 비용의 수준과 관련하여 디지털화 신문에 대한 사용 시나리오를 분석하는 것이다. 사용 시나리오에 따라 객관적으로 복잡한 워크플로우 뿐 아니라 각 처리 단계에서 얻은 결과의 품질을 측정하기 위한 평가 자원과 도구를 제공 할 수 있다. 전체 평가 인프라 또한 대표 데이터세트를 수집하고 수동으로 실지 검증 정보를 생산하기 위해 필요하다. 특정 방법의 성능은 다음 실지 검증 정보에 해당 방법의 실제 출력을 비교해 할인할 수 있다. 시나리오, 실지 검증 정보 및 평가 도구 등의 데이터세트는 향상 및 개선 프로세스의 성공 여부를 평가하기 위해 파트너 라이브러리에서 기존 재료의 잠재력과 가능성을 평가하기 위해 사용된다. 유로피아나 디지털화 신문에 대한 집계 및 프리젠테이션 이 프로젝트는 유로피아나 재단을 통해 자유롭게 신문 목록 및 전문을 온라인으로 이용하기 위한 것이다. 신문 전문 및 검색도구를 구축하는 것이 주요 목표이다. 또한 2012년까지 유럽 지역 국립·연구·공공 도서관에 의해 디지털화 된 신문 컬렉션을 식별하고 분석하는 조사가 이루어졌다. 조사의 결과로 11개 도서관이 프로젝트의 협력기관으로 선정되었으며, 유로피아나에 디지털화 신문 콘텐츠를 제공하고, 우수 사례 네트워크로 모든 프로젝트에 초대할 것이다. 최적 메타데이터 권장 프로젝트를 통해, 신문에 대한 유로피아나 데이터 모델은 프로젝트 컨소시엄 내·외부에서 사용할 수 있게끔 생성할 것이다. 분석 및 업무 흐름에 따라 결과는 최적의 메타데이터가 디지털화 및 상세검색에 대한 권장사항으로 이루어질 것이며, 메타데이터 모델, 디자인 및 사실상 표준(METS, MODS, MARC, ALTO 등)에 기초한 포괄적 메타데이터 모델의 배포와 가장 적합한 사례를 지원하기 위한 온라인 자료의 데이터 포맷 사례를 확보하는 것이다. 보급 및 개발 미디어 커뮤니케이션과 실무자 참여를 통해 ENP를 홍보하고 인식을 환기하는 효과가 있다. 미디어 커뮤니케이션은 프로젝트의 목표, 결과 및 성과를 알릴 수 있다. 워크샵 및 인포메이션 데이는 프로젝트 협력 기관이 참여하며, WP6는 실무자 및 최종 이용자들에게 프로젝트와 관련된 정책 및 콘텐츠를 제공할 것이다. [관련 링크] http://www.europeana-newspapers.eu/ http://www.europeana-newspapers.eu/activities/ |