이용안내

데이터 생성 및 등록

  • 연구를 수행하면서 데이터를 생성 혹은 수집하거나 관리할 때 참고할 만한 정보입니다.

연구데이터의 정의

  • 연구데이터란 연구개발과제 수행과정에서 실시하는 실험, 관찰, 조사 및 분석 등을 통하여 산출된 사실 자료로서 연구결과의 검증에 필수적인 데이터를 말합니다.
  • (논문, 연구노트, 보고서, 소스코드 등은 제외*)
  • *참고 : 연구데이터로 분류되지 않은 연구성과물은 아래의 메뉴를 통해 등록해주시기 바랍니다.
    • 논문 : ETRIware > 과제수행 > 원고심의/게재확인
    • 연구보고서 : ETRIware > 사업관리 > 연구보고서 등록
    • 소스코드 : ETRI CodeArchive
    • 연구노트 : ETRIware > 연구산출물 등록(TM/TDP)

파일 형식(format) 선택

  • 기술변화로 인해서 하드웨어, 소프트웨어의 노후화에 대한 계획과 장기적인 가독성 유지와 접근 보장을 위해 연구데이터 파일 형식을 고려해야합니다
  • *참고: 공공데이터 관리지침에서는 '기계판독이 가능한 형태'를 포맷별로 구분하여 최소 2단계 이상이 되어야 데이터를 자유롭게 수정, 변환, 추출 등 가공하여 활용할 수 있다고 보고 있습니다

기계 판독이 가능한 형태의 포맷 단계별 구분·비교

구분 1단계 2단계 3단계 4단계 5단계
기계판독이 가능한 형태 미충족포맷 최소충족포맷 오픈포맷*
특징 특정 소프트웨어에서 읽을 수만 있는 데이터로 자유로운 수정, 변환 불가 특정 소프트웨어에서 읽고 수정, 변환 가능 최소한 가지 이상의 비독점적 소프트웨어에서 읽고 수정, 변환 가능 URI 기반으로 데이터 속성 특성 관계를 기술하고 있는 데이터 구조 웹상의 다른 데이터와 연결, 공유 가능
예시 PDF HWP, XLS CSV, JSON, XML RDF LOD**
* 오픈포맷(open format)
비용 또는 그 밖의 사용에 제약 없이 최소 한 가지 이상의 무료/자유/오픈소스 소프트웨어로 처리(수정, 편집 등)할 수 있는 기계판독 가능한 데이터포맷

오픈포맷의 형식은 이미지, 텍스트, 테이블 또는 지리데이터 등 데이터 유형에 따라 다를 수 있으며, 비정형 데이터는 국제표준규격을 준수하여야 함※ (참고) https://opendefinition.org/ofd/

** LOD
파일 포맷이 아니라, RDF와 같은 형식의 데이터를 활용하여 시멘틱 웹을 구현한 웹서비스 방식의 하나임

개인정보/민감정보 처리

  • 개인정보가 담긴 연구데이터는 사전에 ETRI 생명윤리위원회 지침 준수 및 위원회 승인을 받은 후 수집/생산되어야 합니다. (관련메뉴: ETRIware>과제관리>생명윤리) 개인정보보호법에 따라 개인정보는 가명처리 혹은 익명처리 후에 제공할 수 있습니다.

    *참고: 개인정보의 구분 및 활용범위는 다음과 같습니다.

개인정보 가명정보 익명정보
예시
  • 010-1234-4567
  • 대전시 동구
  • 길동로 둘리 576-1
  • 98년생 남자
  • 010-****-****
  • ****@naver.com
  • 20대 남자
  • 지방 거주
  • 영화를 좋아함
개념 특정 개인에 관한 정보 추가 정보의 사용 없이는 특정 개인을 알아볼 수 없음 개인을 알아볼 수 없음
활용 범위 사전에 구체적인 동의를 받은 범위 내 활용 가능 통계 작성, 과학적 연구, 공익적 기록 보존 목적으로 동의 없이 활용 가능 개인 정보가 아니라 제한 없음
출처: 대한민국 정책브리핑

본 글은 ETRI 연구데이터 관리 가이드라인, University College London 도서관 홈페이지, MIT 도서관 홈페이지를 참고하여 작성하였습니다.

알림