데이터 생성 및 등록
- 연구를 수행하면서 데이터를 생성 혹은 수집하거나 관리할 때 참고할 만한 정보입니다.
연구데이터의 정의
- 연구데이터란 연구개발과제 수행과정에서 실시하는 실험, 관찰, 조사 및 분석 등을 통하여 산출된 사실 자료로서 연구결과의 검증에 필수적인 데이터를 말합니다.
- (논문, 연구노트, 보고서, 소스코드 등은 제외*)
-
*참고 : 연구데이터로 분류되지 않은 연구성과물은 아래의 메뉴를 통해 등록해주시기 바랍니다.
- 논문 : ETRIware > 과제수행 > 원고심의/게재확인
- 연구보고서 : ETRIware > 사업관리 > 연구보고서 등록
- 소스코드 : ETRI CodeArchive
- 연구노트 : ETRIware > 연구산출물 등록(TM/TDP)
파일 형식(format) 선택
- 기술변화로 인해서 하드웨어, 소프트웨어의 노후화에 대한 계획과 장기적인 가독성 유지와 접근 보장을 위해 연구데이터 파일 형식을 고려해야합니다
- *참고: 공공데이터 관리지침에서는 '기계판독이 가능한 형태'를 포맷별로 구분하여 최소 2단계 이상이 되어야 데이터를 자유롭게 수정, 변환, 추출 등 가공하여 활용할 수 있다고 보고 있습니다
기계 판독이 가능한 형태의 포맷 단계별 구분·비교
| 구분 |
1단계 |
2단계 |
3단계 |
4단계 |
5단계 |
| 기계판독이 가능한 형태 |
미충족포맷 |
최소충족포맷 |
오픈포맷* |
| 특징 |
특정 소프트웨어에서 읽을 수만 있는 데이터로 자유로운 수정, 변환 불가 |
특정 소프트웨어에서 읽고 수정, 변환 가능 |
최소한 가지 이상의 비독점적 소프트웨어에서 읽고 수정, 변환 가능 |
URI 기반으로 데이터 속성 특성 관계를 기술하고 있는 데이터 구조 |
웹상의 다른 데이터와 연결, 공유 가능 |
| 예시 |
PDF |
HWP, XLS |
CSV, JSON, XML |
RDF |
LOD** |
- * 오픈포맷(open format)
- 비용 또는 그 밖의 사용에 제약 없이 최소 한 가지 이상의 무료/자유/오픈소스 소프트웨어로 처리(수정, 편집 등)할 수 있는 기계판독 가능한 데이터포맷
오픈포맷의 형식은 이미지, 텍스트, 테이블 또는 지리데이터 등 데이터 유형에 따라 다를 수 있으며, 비정형 데이터는 국제표준규격을 준수하여야 함※ (참고) https://opendefinition.org/ofd/
- ** LOD
- 파일 포맷이 아니라, RDF와 같은 형식의 데이터를 활용하여 시멘틱 웹을 구현한 웹서비스 방식의 하나임
개인정보/민감정보 처리
|
개인정보 |
가명정보 |
익명정보 |
| 예시 |
- 010-1234-4567
- 대전시 동구
- 길동로 둘리 576-1
|
- 98년생 남자
- 010-****-****
- ****@naver.com
|
|
| 개념 |
특정 개인에 관한 정보 |
추가 정보의 사용 없이는 특정 개인을 알아볼 수 없음 |
개인을 알아볼 수 없음 |
| 활용 범위 |
사전에 구체적인 동의를 받은 범위 내 활용 가능 |
통계 작성, 과학적 연구, 공익적 기록 보존 목적으로 동의 없이 활용 가능 |
개인 정보가 아니라 제한 없음 |
출처: 대한민국 정책브리핑
본 글은 ETRI 연구데이터 관리 가이드라인, University College London 도서관 홈페이지, MIT 도서관 홈페이지를 참고하여 작성하였습니다.